题目内容

Mapreduce 的 input split 就是一个 block。

A. 对
B. 错

查看答案
更多问题

在使用MapReduce程序WordCount进行词频统计时,对于文本行“hello master bye master”,经过WordCount程序的Map函数处理后直接输出的中间结果,应该是下面哪种形式:

A. <"hello",1>、<"master",1>、<"bye",1>和<"master",1>
B. <"hello",1>、<"master",2>和<"bye",1>
C. <"master",1,1>、<"hello",1>和<"bye",1>
D. <"master",<1,1>>、<"hello",1>和<"bye",1>

对于文本行“hello master bye master”,经过WordCount的Reduce函数处理后的结果是

A. <"hello",1>、<"master",1>、<"bye",1>和<"master",1>
B. <"hello",1>、<"master",2>和<"bye",1>
C. <"master",1,1>、<"hello",1>和<"bye",1>
D. <"master",<1,1>>、<"hello",1>和<"bye",1>

下列关于HDFS为存储MapReduce并行切分和处理的数据做的设计,错误的是

A. FSDataInputStream扩展了DataInputStream以支持随机读
B. 为实现细粒度并行,输入分片(Input Split)应该越小越好
C. 一台机器可能被指派从输入文件的任意位置开始处理一个分片
D. 输入分片是一种记录的逻辑划分,而HDFS数据块是对输入数据的物理分割

下列关于Map/Reduce并行计算模型叙述正确的一项为:

A. Map/Reduce把待处理的数据集分割成许多大的数据块
B. 大数据块经Map()函数并行处理后输出新的中间结果
C. reduce阶段的作用接受来自输出列表的迭代器
D. reduce()函数把多任务处理后的中间结果进行汇总

答案查题题库