题目内容

如果我们现有一个hadoop集群,默认存储文件3份,并且大文件会按照128M的数据块大小进行切割分散存储,在不修改默认配置的情况下存储200个每个200M的文本文件,请问最终会在集群中产生多少个数据块(包括副本)?

A. 200
B. 40000
C. 400
D. 1200

查看答案
更多问题

下列不是数据再利用的意义的是

A. 挖掘数据的潜在价值
B. 实现数据重组的创新价值
C. 利用数据可扩展性拓宽业务领域
D. 优化存储设备,降低设备成本

HBase底层依靠什么进行数据的存储

A. HDFS
B. Hive
C. Memory
D. MapReduce

下列选项中,哪个选项是用于处理海量数据的并行编程模式和大规模数据集的并行运算的软件架构?

A. GFS
B. MapReduce
Chubby
D. BitTable

在MapReduce中哪一个阶段,把Mapper的输出数据并整理后分发给Reducer处理

A. Shuffle
B. Map
C. Reduce
D. Sort

答案查题题库