预览加载中,请您耐心等待几秒...
1/4
2/4
3/4
4/4

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

大数据技术原理与应用第一卷一:判断题(每小题5分)1:对于大数据而言,最基本、最重要的要求就是减少错误、保证质量。因此,大数据收集的信息量要尽量精确。A:对B:错答案:B2:Spark是一个高效的分布式计算系统,它有MapReduce所有优点,同时性能与Hadoop一样高。A:对B:错答案:B3:信息生命周期管理是据生命周期管理的来源,最早由英国企业提出。A:对B:错答案:B4:简单随机抽样,是从总体N个对象中任意抽取n个对象作为样本,最终以这些样本作为调查对象。在抽取样本时,总体中每个对象被抽中为调查样本的概率可能会有差异。A:对B:错答案:B5:大数据预测能够分析和挖掘出人们不知道或没有注意到的模式,确定判断事件必然会发生。A:对B:错答案:B二:单选题(每小题5分)6:数据清洗的方法不包括______A缺失值处理B噪声数据清除C一致性检查D重复数据记录处理答案:D7:大数据的基本特征不包括______A数据量大B数据类型繁多C处理速度快D价值密度高答案:D8:HDFS中当前block大小为128M,如果当前要上传到HDFS中的文件大小为300M,那么在存储时会分配_______个block进行存储A1B2C3D4答案:C9:下列______程序通常与NameNode在一个节点启动ASecondNameNodeBDataNodeCTaskTrackerDJobTracker答案:D10:配置Hadoop时,JAVA_HOME包含在______配置文件中Ahadoop-default.xmlBhadoop-env.shChadoop-site.xmlDconfiguration.xs答案:B11:在数据生命周期管理实践中______是执行方法A数据存储和备份规范B数据管理和维护C数据价值发觉和利用D数据应用开发和管理答案:B12:HBase系统基本架构中主服务器Master的作用是______A包含访问HBase的接口,同时在缓存中维护着已经访问过的Region位置信息,用来加快后续数据访问过程B可以帮助选举出一个Master作为集群的总管,并保证在任何时刻总有唯一一个Master在运行C主要负责表和Region的管理工作D是HBase中最核心的模块,负责维护分配给自己的Region,并响应用户的读写请求答案:C13:Hadoop具有特性不包括______A高可靠性B高效性C高可扩展性D低容错性,答案:D14:YARN的http端口默认是______A80B8080C8090D8088答案:D15:大数据时代,数据使用的关键是______A数据收集B数据存储C数据分析D数据再利用答案:D三:多选题(每小题5分)16:大数据人才整体上需要具备______等核心知识A数学与统计知识B计算机相关知识C马克思主义哲学知识D市场运营管理知识E在特定业务领域的知识答案:ABE17:下列关于数据生命周期管理的核心认识中,正确的是______A数据从产生到被删除销毁的过程中,具有多个不同的数据存在阶段B在不同的数据存在阶段,数据的价值是不同的C根据数据价值的不同应该对数据采取不同的管理策略D数据生命周期管理旨在产生效益的同时,降低生产成本答案:ABC18:数据研究经历了几种范式,包括______A实验B理论C计算D数据答案:ABCD19:按照涉及自变量的多少,可以将回归分析分为______A线性回归分析B非线性回归分析C一元回归分析D多元回归分析答案:CD20:大数据产业发展特点______A规模较大B规模较小C增速较快D增速缓慢E多产业交叉融合答案:ACE第二卷一:判断题(每小题5分)1:HDFS能提供高吞吐量的数据访问,非常适合于大规模数据集上的应用。A:对B:错答案:A2:利用数据融合、数学模型、仿真技术等,可以逼近事物的本质,可以揭示出原来没有想到或难以展现的关联,大大提升政府决策的科学性。A:对B:错答案:A3:Pig是一个基于Hadoop的大规模数据分析平台,它为复杂的海量数据并行计算提供了一个简单的操作和编程接口。A:对B:错答案:A4:信息生命周期管理是据生命周期管理的来源,最早由英国企业提出。A:对B:错答案:B5:Spark是一个高效的分布式计算系统,它有MapReduce所有优点,同时性能与Hadoop一样高。A:对B:错答案:B二:单选题(每小题5分)6:信息技术发展史上的第二次信息化浪潮发生在______A1950年前后B1980年前后C1995年前后D2010年前后答案:C7:HBase系统基本架构中主服务器Master的作用是______A包含访问HBase的接口,同时在缓存中维护着已经访问过的Region位置信息,用来加快后续数据访问过程B可以帮助选举出一个Master作为集群的总管,并保证在任何时刻总有唯一