两个键值对<"a",1>和<"a",1>,如果对其进行归并(merge),会得到<"a",2>,如果对其进行合并(combine),会得到<"a",<1,1>>
查看答案
Mapreduce 的 input split 就是一个 block。
A. 对
B. 错
在使用MapReduce程序WordCount进行词频统计时,对于文本行“hello master bye master”,经过WordCount程序的Map函数处理后直接输出的中间结果,应该是下面哪种形式:
A. <"hello",1>、<"master",1>、<"bye",1>和<"master",1>
B. <"hello",1>、<"master",2>和<"bye",1>
C. <"master",1,1>、<"hello",1>和<"bye",1>
D. <"master",<1,1>>、<"hello",1>和<"bye",1>
对于文本行“hello master bye master”,经过WordCount的Reduce函数处理后的结果是
A. <"hello",1>、<"master",1>、<"bye",1>和<"master",1>
B. <"hello",1>、<"master",2>和<"bye",1>
C. <"master",1,1>、<"hello",1>和<"bye",1>
D. <"master",<1,1>>、<"hello",1>和<"bye",1>
下列关于HDFS为存储MapReduce并行切分和处理的数据做的设计,错误的是
A. FSDataInputStream扩展了DataInputStream以支持随机读
B. 为实现细粒度并行,输入分片(Input Split)应该越小越好
C. 一台机器可能被指派从输入文件的任意位置开始处理一个分片
D. 输入分片是一种记录的逻辑划分,而HDFS数据块是对输入数据的物理分割