MapReduce是为能够在集群上分布式处理海量数据而量身订做的框架,MapReduce job可以分为三次连续过程。
A. Map:将输入数据划分为key-value集合Shuffle:则对接收到的key-value进一步处理Reduce:将Map产生的结果传输给Reduce
B. Map:将输入数据划分为key-value集合Shuffle:将Map产生的结果传输给ReduceReduce:则对接收到的key-value进一步处理
C. Map:将Map产生的结果传输给ReduceShuffle:将输入数据划分为key-value集合Reduce:则对接收到的key-value进一步处理
D. Map:则对接收到的key-value进一步处理Shuffle:将Map产生的结果传输给ReduceReduce:将输入数据划分为key-value集合