预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共48页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

第一章 1、试述信息技术发展史上得3次信息化浪潮及具体内容。 信息化浪潮发生时间标志解决问题代表公司第一次浪潮1980年前后个人计算机信息处理Intel、AMD、IBM、苹果、微软、联想、戴尔、惠普等第二次浪潮1995年前后互联网信息传输雅虎、谷歌、阿里巴巴、百度、腾讯等第三次浪潮2010年前后物理网、云计算与大数据信息爆炸将涌现出一批新得市场标杆企业试述数据产生方式经历得几个阶段 答:运营式系统阶段,用户原创内容阶段,感知式系统阶段。 试述大数据得4个基本特征 答:数据量大、数据类型繁多、处理速度快与价值密度低。 试述大数据时代得“数据爆炸”得特性 答:大数据时代得“数据爆炸"得特性就是,人类社会产生得数据一致都以每年50%得速度增长,也就就是说,每两年增加一倍。 数据研究经历了哪4个阶段? 答:人类自古以来在科学研究上先后历经了实验、理论、计算、与数据四种范式。 试述大数据对思维方式得重要影响 答:大数据时代对思维方式得重要影响就是三种思维得转变:全样而非抽样,效率而非精确,相关而非因果。 大数据决策与传统得基于数据仓库得决策有什么区别 答:数据仓库具备批量与周期性得数据加载以及数据变化得实时探测、传播与加载能力,能结合历史数据与实时数据实现查询分析与自动规则触发,从而提供对战略决策与战术决策。 大数据决策可以面向类型繁多得、非结构化得海量数据进行决策分析。 举例说明大数据得基本应用 答: 领域大数据得应用金融行业大数据在高频交易、社区情绪分析与信贷风险分析三大金融创新领域发挥重要作用。汽车行业利用大数据与物联网技术得五人驾驶汽车,在不远得未来将走进我们得日常生活互联网行业借助于大数据技术,可以分析客户行为,进行商品推荐与有针对性广告投放个人生活大数据还可以应用于个人生活,利用与每个人相关联得“个人大数据",分析个人生活行为习惯,为其提供更加周全得个性化服务。举例说明大数据得关键技术 答:批处理计算,流计算,图计算,查询分析计算 大数据产业包含哪些关键技术。 答:IT基础设施层、数据源层、数据管理层、数据分析层、数据平台层、数据应用层。 定义并解释以下术语:云计算、物联网 答:云计算:云计算就就是实现了通过网络提供可伸缩得、廉价得分布式计算机能力,用户只需要在具备网络接入条件得地方,就可以随时随地获得所需得各种IT资源。 物联网就是物物相连得互联网,就是互联网得延伸,它利用局部网络或互联网等通信技术把传感器、控制器、机器、人类与物等通过新得方式连在一起,形成人与物、物与物相连,实现信息化与远程管理控制。 详细阐述大数据、云计算与物联网三者之间得区别与联系。 大数据、云计算与物联网得区别大数据、云计算与物联网得联系大数据侧重于海量数据得存储、处理与分析,海量数据中发现价值,服务于生产与生活;云计算本质上皆在整合与优化各种IT资源并通过网络已服务得方法,廉价地提供给用户;物联网得发展目标就是实现呜呜向量,应用创新就是物联网得核心从整体来瞧,大数据、云计算与物联网这三者就是相辅相成得。大数据根植于云计算,大数据分析得很多技术都来自于云计算,云计算得分布式存储与管理系统提供了海量数据得存储与管理能力,没有这些云计算技术作为支撑,大数据分析就无从谈起.物联网得传感器源源不断得产生大量数据,构成了大数据得重要数据来源,物联网需要借助于云计算与大数据技术,实现物联网大数据得存储、分析与处理。第二章 试述hadoop与谷歌得mapreduce、gfs等技术之间得关系 答:Hadoop得核心就是分布式文件系统HDFS与MapReduce,HDFS就是谷歌文件系统GFS得开源实现,MapReduces就是针对谷歌MapReduce得开源实现. 试述Hadoop具有哪些特性。 答:高可靠性,高效性,高可扩展性,高容错性,成本低,运行在Linux平台,支持多种编程语言 试述Hadoop在各个领域得应用情况。 答:2007年,雅虎在Sunnyvale总部建立了M45——一个包含了4000个处理器与1、5PB容量得Hadooop集群系统; Facebook主要将Hadoop平台用于日志处理,推荐系统与数据仓库等方面; 百度主要使用Hadoop于日志得存储与统计、网页数据得分析与挖掘、商业分析、在线数据反馈、网页聚类等. 试述Hadoop得项目结构以及每个部分得具体功能。 答: PigChukwaHiveHBaseMapReduceHDFSZookeepermonAvromeon就是为Hadoop其她子项目提供支持得常用工具,主要包括文件系统、RPC与串行化库 Avro就是为Hadoop得子项目,用于数据序列化得系统,提供了丰富得数据结构类型、快速可压缩得二进制数据格式、存储持续性数据得文件集、远程调用得功能与简单得动态语言集成功能. HDFS就是Ha