第一章 单元测试
1、判断题:数据,就是所有能输入到计算机,并被计算机程序处理的符号的总称为()。
A:错
B:对
正确答案:【对】
2、多选题:大数据的4V特征包括()。
A:规模庞大
B:价值巨大但价值密度低
C:变化频繁
D:种类繁多
正确答案:【规模庞大;
价值巨大但价值密度低;
变化频繁;
种类繁多】
3、单选题:2TB数据等于多少GB()。
A:1000
B:2000
C:2048
D:1024
正确答案:【2048】
4、多选题:大数据包含下面类型()。
A:半结构化数据
B:非结构化数据
C:纯文本数据
D:结构化数据
正确答案:【半结构化数据;
非结构化数据;
纯文本数据;
结构化数据】
5、多选题:大数据的生命周期一般会经历这么几个阶段()。
A:采集与预处理
B:可视化
C:分析与挖掘
D:存储与管理
正确答案:【采集与预处理;
可视化;
分析与挖掘;
存储与管理】
6、多选题:大数据平台的基本架构,从技术架构的角度,可划分为这几个层次()。
A:数据存储层
B:服务封装层
C:数据采集层
D:数据处理层
正确答案:【数据存储层;
服务封装层;
数据采集层;
数据处理层】
7、单选题:linux系统中cd命令的作用是()。
A:将源文件复制至目标文件
B:删除一个目录中的一个或多个文件
C:移动文件或修改文件名
D:进入指定目录
正确答案:【进入指定目录】
8、多选题:vi编辑器的操作模式共分为()。
A:底线命令模式
B:编辑模式
C:输入模式
D:命令模式
正确答案:【底线命令模式;
编辑模式;
命令模式】
第二章 单元测试
1、多选题:Flume的Agent包含这些组成部分()。
A:Source
B:Channel
C:Event
D:Sink
正确答案:【Source;
Channel;
Sink】
2、多选题:Event由这两部分组成()。
A:Body
B:Head
C:Array
D:K-V
正确答案:【Body;
Head】
3、判断题:Source是Flume中事件的源头,负责接收数据到Flume Agent,可以处理多种类型、多种格式的数据()
A:错
B:对
正确答案:【对】
4、判断题:Channel是位于Source和Sink之间的缓冲区,对Source和Sink进行一对一处理()
A:错
B:对
正确答案:【错】
5、单选题:在Flume的配置文件中,对某个目录下文件进行监控的命令是()。
A:flume-ng
B:/bin/bash -c
C:exec
D:tail -f
正确答案:【tail -f】
第三章 单元测试
1、单选题:以下说法有误的是()。
A:分布式存储系统可以实现数据容灾
B:分布式存储系统需要考虑数据的分块问题
C:传统单机存储方式扩容成本较低
D:“元数据”中不包含真正的文件数据
正确答案:【传统单机存储方式扩容成本较低】
2、单选题:Hadoop 2.x中HDFS默认的block的大小为()。
A:256MB
B:32MB
C:128MB
D:64MB
正确答案:【128MB】
3、单选题:关于SecondaryNameNode 哪项是正确的()。
A:它的目的是帮助 NameNode 合并编辑日志,减少 NameNode 启动时间
B:SecondaryNameNode 应与 NameNode 部署到一个节点
C:它对内存没有要求
D:它是 NameNode 的热备
正确答案:【它的目的是帮助 NameNode 合并编辑日志,减少 NameNode 启动时间】
4、单选题:以下哪一项用于配置HDFS的block大小()。
A:dfs.name.dir
B:dfs.blocksize
C:dfs.replication
D:fs.defaultFS
正确答案:【dfs.blocksize】
5、多选题:HDFS中的NameNode节点用于存放元数据,元数据内容包含()。
A:客户端硬件配置数据
B:数据块与数据节点的映射表
C:文件与数据块的映射表
D:每个数据块的内容
正确答案:【数据块与数据节点的映射表;
文件与数据块的映射表】
6、判断题:如果 NameNode 意外终止,SecondaryNameNode 会接替它使集群继续工作。()
A:错
B:对
正确答案:【错】
7、判断题:NameNode 负责管理元数据,客户端每次读写请求,它都会从磁盘中读取或者写入元数据信息并反馈客户端。()
A:错
B:对
正确答案:【错】
8、判断题:因为 HDFS 有多个数据副本,所以 NameNode 是不存在单点故障问题的。()
A:错
B:对
正确答案:【错】
9、判断题:读取HDFS文件可以使用命令hdfs dfs -get。()
A:错
B:对
正确答案:【对】
第四章 单元测试
1、单选题:以下说法有误的是()。
A:MapReduce编程模型可以分为Map和Reduce两个阶段
B:分布式计算框架的实现需要考虑网络通信
C:MapReduce编程模型的核心思想是分而治之
D:Hadoop的MapReduce框架不能容忍任务出错
正确答案:【Hadoop的MapReduce框架不能容忍任务出错】
如有任何疑问请及时联系QQ 50895809反馈