《大数据技术》在线平时作业3-00001
试卷总分:100 得分:100
一、单选题 (共 10 道试题,共 50 分)
1.持续改善,即在生产活动中不断提高,其核心不包括( )
A.增加更多人手
B.加快学习过程
C.联系更多专家
D.组织更多活动
2.当企业处于越来越多的数据和决策的“围城”之中时,为寻找一个可持续发展的优势,可以( )来支持他们独特的经营策略,以帮助实现业务目标。
A.量身定制其分析战略
B.加大生产规模
C.引进人才提高研究水平
D.厉行节约减少成本
3.( )是关联规则分析的一个典型例子。该过程通过发现顾客放入其中的不同商品之间的联系,分析顾客的购买习惯
A.相关关系
B.结合方式
C.不同之处
D.依赖程度
4.大数据的4V特征中的Volume是指( )。
A.价值密度低
B.处理速度快
C.数据类型繁多
D.数据体量巨大
5.定性分析专注于用( )描述不同数据的质量。与定量分析相对比,定性分析涉及分析相对小而深入的样本,其分析结果不能被适用于整个数据集中,也不能测量数值或用于数值比较。
A.资源运用
B.潜在风险
C.经济价值
D.潜在决策
6.空间或地理空间数据通常用来识别单个实体的( )地理位置,然后将其绘图。空间数据分析专注于分析基于地点的数据,从而寻找实体间不同地理关系和模式。
A.自然位置
B.空间位置
C.社交位置
D.地理位置
7.如今随着第二代更强大的分析功能的问世,在企业的( )方面都有利用分析的机会。
A.销售
B.各个
C.财务
D.采购
8.Hadoop 作者
A.Hadoop
B.Nutch
C.Lucene
D.Solr
9.针对每行数据内容为”Timestamp Url”的数据文件,在用JobConf对象conf设置conf.setInputFormat(WhichInputFormat.class)来读取这个文件时,WhichInputFormat应该为以下的( )
A.TextInputFormat
B.KeyValueTextInputFormat
C.SequenceFileInputFormat
D.NlineInputFormat
10.下面与HDFS类似的框架是( )
A.NTFS
B.FAT32
C.GFS
D.EXT3
二、多选题 (共 5 道试题,共 25 分)
11.下面对LSM结构描述正确的是?
A.顺序存储
B.直接写硬盘
C.需要将数据Flush到磁盘
D.是一种搜索平衡树
12.关于HBase二级索引的描述,哪些是正确的?
A.核心是倒排表
B.二级索引概念是对应Rowkey这个“一级”索引
C.二级索引使用平衡二叉树
D.二级索引使用LSM结构
13.MapReduce与HBase的关系,哪些描述是正确的?
A.两者不可或缺,MapReduce是HBase可以正常运行的保证
B.两者不是强关联关系,没有MapReduce,HBase可以正常运行
C.MapReduce可以直接访问Hbase
D.它们之间没有任何关系
14.下列哪个是 Hadoop 运行的模式?
A.单机版
B.伪分布式
C.分布式
15.HBase构建二级索引的实现方式有哪些?
A.MapReduce
B.Coprocessor
C.Bloom Filter
D.Filter
三、判断题 (共 5 道试题,共 25 分)
16.Nagios 不可以监控 Hadoop 集群,因为它不提供 Hadoop 支持。
17.Hadoop 支持数据的随机读写。
18.因为 HDFS 有多个副本,所以 NameNode 是不存在单点问题的。
19.Ganglia 不仅可以进行监控,也可以进行告警。
20.Hadoop 默认调度器策略为 FIFO.