预览加载中,请您耐心等待几秒...
1/8
2/8
3/8
4/8
5/8
6/8
7/8
8/8

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

2020年大数据及其应用试题及答案2020年大数据及其应用试题及答案练一:大数据方法与工具1、(单选,10分)不属于Hadoop生态系统的是()A、HDFSB、GFSC、HBaseD、Hive答案:B2、(单选,10分)MapReduce计算模型的描述,错误的是()A、MapReduce采用的是一种分而治之的思想B、MapReduceMapReduce要求待处理数据集可以分解为能并行处理的小数据集C、MapReduce适合于实时在线任务的应用场景D、MapReduce可以处理离线任务答案:C3、(单选,10分)Spark描述正确的是()A、SparkStreaming是将Stream数据分成小的时间片段(几秒)B、Spark是专为大范围数据处理而设计的快速通用的计算引擎C、内存计算下Spark比Hadoop快100倍D、Spark不适合处理离线数据。答案:D4、(单选,10分)下列关于人工智能技术描述错误的是()A、人工智能技术是大数据分析的重要方法B、计算智能属于人工智能技术C、深度研究通常需要昂贵的GPU设备,不太适合于大数据分析D、传统的机器研究对硬件环境要求不高,适合大数据分析。答案:C5、(单选,10分)聚类分析的描述错误的是()A、基于“物以类聚,人以群分”思想B、采用样本间距离度量相似性,将数据分类划分到已有种别C、k-means算法适合于非此即彼的聚类分析方法D、对于有层级关系的样本,能够采用自底向上的凝聚式条理聚类分析方法答案:B6、(单选,10分)关于深度研究算法的描述,错误的是()A、深度研究通过组合低层特征形成更加抽象的高层特征或类别。B、深度进修算法适合于语音辨认、笔墨辨认、智能客服等应用处景C、深度研究应用于人脸识别时,首先根据每个像素的亮度来识别边缘,然后根据边缘再识别出轮廓,最后根据轮廓识别出特定图像。D、XXX、SVM等算法属于深度进修算法。答案:D7、(单选,10分)计算智能描述错误的是()A、计算智能是在生物遗传、变异、生长以及外部环境的自然选择中产生的B、计算智能包括遗传算法、粒子群算法、蚁群算法等C、粒子群算法是模仿鸟随机搜索食物的算法D、计算智能是局部最优算法答案:D8、(单项选择,10分)深度研究开源软件框架描述,错误的是()A、TensorFlow支持多种操作系统和终端设备B、Caffe撑持命令行、Python和MATLAB接口C、PyTorch内嵌自动求导系统,使其成为最流行的动态图像处理框架D、2018年PyTorch工程并入Caffe2工程。答案:D9、(单选,10分)HDFS是基于XXX的GFS白皮书设计开源分布式文件系统A、正确B、错误答案:A10、(单项选择,10分)啤酒和尿布的关系是XXX分析消费者购物行为时,利用分类分析方法发现的规律A、正确B、错误答案:B练二:大数据基本概念1、(单选,10分)下列对大数据4V特性的说法中,错误的是()A、数据规模大B、数据价值密度高C、数据类型多样D、数据处理速度快答案:B2、(单选,10分)依照KB、MB、GB、TB、PB的有小到大顺序,下列换算错误的是()A、1KB=1024ByteB、1MB=1024KBC、1TB=1024MBD、1PB=1024TB答案:C3、(单项选择,10分)下列关于大数据中计算机存储容量单位的说法中,错误的是()A、基本储备容量单位是字节(Byte),B、汉字字符存储空间要大于英文字符存储空间C、一个英笔墨符需要2个字节的储备空间D、一个汉字字符需要2个字节的存储空间答案:C4、(单选,10分)数据清洗的方法不包括()A、缺失数据处理B、噪声数据清除C、数据的一致性检查D、数据的可视化答案:D5、(单项选择,10分)非关系型数据库不包括()A、HbaseB、MapreduceC、Neo4jD、MongoDB答案:B6、(单选,10分)数据库不包括()A、HbaseB、MongoDBC、Neo4jD、Mapreduce答案:D7、(单项选择,10分)下列关于分布式数据库的说法中,错误的是()A、分布式数据库系统通常使用较小的计算机系统B、分布式数据库是物理上分散的数据库C、分布式数据库是逻辑上统一的数据库D、每台计算机中都一定有DBMS的一份完整拷贝副本答案:D8、(单项选择,10分)大数据4V特征不包括()A、范围性(Volume)B、真实性(Veracity)C、多样性(Varity)D、高速性(Velocity)答案:B9、(单选,10分)大数据的4V特性仅仅是指数据的体量大。A、正确B、错误答案:B10、(单项选择,10分)分布式数据库是指物理上分散在不同地点,但是逻辑上是统一的数据库。