《大数据技术》在线平时作业1-00001
试卷总分:100 得分:100
一、单选题 (共 10 道试题,共 50 分)
1.下面哪个程序负责 HDFS 数据存储
A.1
B.2
C.3
D.最少3个
2.分析项目大多数的失败案例都是由于缺少精确定义的( )。
A.发展规模
B.方针政策
C.政治要求
D.业务价值
3.预测模型在组织部署( )都是没有实际价值的。
A.之后
B.之前
C.前后
D.过程中
4.空间或地理空间数据通常用来识别单个实体的( )地理位置,然后将其绘图。空间数据分析专注于分析基于地点的数据,从而寻找实体间不同地理关系和模式。
A.自然位置
B.空间位置
C.社交位置
D.地理位置
5.Client在HDFS上进行文件写入时,namenode根据文件大小和配置情况,返回部分datanode信息,谁负责将文件划分为多个Block,根据DataNode的地址信息,按顺序写入到每一个DataNode块
A.Client
B.Namenode
C.Datanode
D.Secondary namenode
6.数据分析阶段致力于执行实际的分析任务,通常会涉及一种或多种类型的数据分析。在这个阶段,尤其是在探索性分析的情况下,分析过程会( )。
A.图形设计
B.数据可视化
C.Photoshop
D.数字媒体
7.下列( )不是视觉分析的合适问题。
A.怎样才能得到经济增长的最佳指数值?
B.怎样才能从视觉上识别有关世界各地多个城市碳排放量的模式?
C.怎样才能看到不同癌症的模式与不同人种的关联?
D.怎样根据球员的长处和弱点来分析他们的表现?
8.一个用例是实现一个目标所需步骤的描述,而分析用例是那些需要定义( )的组织所需要的关键成功要素之一。
A.程序模板
B.数据结构
C.分析架构
D.对象实例
9.人脑是一种适应性系统,必须对变幻莫测的事物做出反应,而学习是通过修改( )之间连接的强度来进行的。
A.脑细胞
B.记忆细胞
C.记忆神经
D.神经元
10.大数据处理技术和传统的数据挖掘技术最大的区别是( )
A.处理速度快(秒级定律)
B.算法种类更多
C.精度更高
D.更加智能化
二、多选题 (共 5 道试题,共 25 分)
11.下列哪项可以作为集群的管理?
A.Puppet
B.Pdsh
C.Cloudera Manager
D.Zookeeper
12.HFile数据格式中的KeyValue数据格式,下列选项描述正确的是
A.是byte[]数组
B.没有固定的结构
C.数据的大小是定长的
D.有固定的结构
13.HBase性能优化包含下面的哪些选项?
A.读优化
B.写优化
C.配置优化
D.JVM优化
14.按照涉及自变量的多少,可以将回归分析分为
A.线性回归分析
B.非线性回归分析
C.一元回归分析
D.多元回归分析
E.综合回归分析
15.下列哪个是 Hadoop 运行的模式?
A.单机版
B.伪分布式
C.分布式
三、判断题 (共 5 道试题,共 25 分)
16.因为 HDFS 有多个副本,所以 NameNode 是不存在单点问题的。
17.每个 map 槽就是一个线程。
18.Mapreduce 的 input split 就是一个 block。
19.Hadoop 默认调度器策略为 FIFO.
20.Block Size 是不可以修改的。