题目内容

____组件的作用就是对Map阶段的输出的重复数据先做一次合并计算,然后把新的(key,value)作为Reduce阶段的输入。(注意大小写)

查看答案
更多问题

输入Map阶段的数据源,必须经过____和格式化操作。

____主要是为了掌握利用并行化思想来对数据进行有意义的筛选。

MapReduce编程模型的实现过程是通过____和____函数来完成的。

一个元数据文件包括数据长度、____以及时间戳。

答案查题题库