Hadoop大数据平台集群部署与开发-天水师范学院

Hadoop大数据平台集群部署与开发-天水师范学院

开课学校:天水师范学院授课老师:刘文华中国大学MOOC

Hadoop大数据平台集群部署与开发期末试卷

1、【单选题】HDFS默认的一个块大小是

A. 64MB
B. 8KB
C. 16KB
D. 32KB

参考答案: 请先登录

2、【不定项选择题】下列关于Hive的说法正确的是

A. Hive支持频繁数据更新
B. Hive的可扩展性差
C. Hive不支持索引
D. Hive支持批量导入

参考答案: 请先登录

3、【多选题】NoSQL数据库的三大理论基石不包括

A. CAP
BASE
C. 最终一致性
D. ACID

参考答案: 请先登录

4、【不定项选择题】以下属于流计算的应用有哪些

A. 购物网站的广告推荐
B. 数据仓库数据批处理分析
C. 实时交通路线推荐
D. 根据过去一年购物记录判断用户的消费能力

参考答案: 请先登录

5、【单选题】Hadoop的两大核心是 和

A. HDFS; MapReduce
B. HDFS; HBase
C. MapReduce; HBase
D. GFS; MapReduce

参考答案: 请先登录

6、【不定项选择题】HBase需要根据哪些属性来唯一地确定一个单元格(cell)中的某个版本数据

A. 行键
B. 列族
C. 列限定符
D. 时间戳

参考答案: 请先登录

7、【不定项选择题】在设计词频统计的MapReduce程序时,对于文本行“hello bigdata hello hadoop”,经过map函数处理后直接输出的结果应该是(没有发生combine和merge操作)

A. <"hello",1,1>、<"bigdata",1>和<"hadoop",1>
B. <"hello",2>、<"bigdata",1>和<"hadoop",1>
C. <"hello",<1,1>>、<"bigdata",1>和<"hadoop",1>
D. <"hello",1>、<"hello",1>、<"bigdata",1>和<"hadoop",1>

参考答案: 请先登录

8、【单选题】下列有关HBase的说法正确的是

A. HBase是针对谷歌BigTable的开源实现,是高可靠、高性能的图数据库
B. HBase是一种NoSQL数据库
C. 在向数据库中插入记录时,HBase和关系数据库一样,每次都是以“行”为单位把整条记录插入数据库
D. HBase数据库表可以设置该表任意列作为索引

参考答案: 请先登录

9、【单选题】在HDFS根目录下创建一个文件夹/test,且/test文件夹内还包含一个文件夹dir,正确的shell命令是

A. hadoop fs -mkdir -p /test/dir
B. hadoop dfs -mkdir /test/dir
C. hdfs fs -mkdir -p /test/dir
D. hdfs dfs *mkdir -p /test/dir

参考答案: 请先登录

10、【单选题】第三次信息化浪潮的发生标志是以下哪种技术的普及

A. 个人计算机
B. 互联网
C. 物联网、云计算和大数据
D. CPU

参考答案: 请先登录

11、【不定项选择题】已知一张表student存储在HBase中,向表中插入一条记录{id:2015001,name:Mary,{score:math}:88},其id作为行键,其中,在插入数学成绩88分时,正确的命令是

A. put 'student','2015001','score:math','88'
B. put 'student','2015001','88'
C. put 'student','2015001','math','88'
D. put 'student','score:math','88'

参考答案: 请先登录

12、【不定项选择题】下列适用于批处理计算的框架有哪些

A. MapReduce
B. Spark
C. Storm
D. Pregel

参考答案: 请先登录

13、【不定项选择题】CAP是指

A. 一致性
B. 可用性
C. 持久性
D. 分区容忍性

参考答案: 请先登录

14、【单选题】上传当前目录下的本地文件file.txt到分布式文件系统HDFS的“/path”目录下的Shell命令是

A. hdfs dfs -put file.txt /path
B. hadoop dfs -put /path file.txt
C. hdfs dfs -put /path file.txt
D. hdfs fs -put file.txt /path

参考答案: 请先登录

15、【不定项选择题】下列哪些是图计算框架Pregel的应用

A. 单源最短路径
B. 二分匹配
C. PageRank
D. 流数据处理

参考答案: 请先登录

16、【单选题】在分布式文件系统HDFS中, 负责数据的存储和读取

A. 数据节点
B. 主节点
C. 名称节点
D. 第二名称节点

参考答案: 请先登录

17、【判断题】在分布式文件系统HDFS中,名称节点负责管理HDFS的元数据,这些元数据被保存在磁盘中。

A. 对
B. 错

参考答案: 请先登录

18、【判断题】HDFS可以高效存储大量的小文件。

A. 对
B. 错

参考答案: 请先登录

19、【单选题】‏在Flink中哪个是基于批处理的图计算库:

A. SQL&Table库
B. CEP
C. FlinkML
D. Gelly

参考答案: 请先登录

20、【多选题】‌Flink核心组件栈分为哪三层:

A. Core层
B. API&Libraries层
C. Runtime核心层
D. 物理部署层

参考答案: 请先登录