默认情况下,run()方法中的setup()和cleanup()方法在内部不做任何处理,也就是说,____方法是处理数据的核心方法。
查看答案
____ 是文档检索系统中最常用的数据结构,被广泛应用于全文搜索引擎。
MapReduce在操作海量数据时,每个MapReduce程序被初始化为一个工作任务,每个工作任务可以分为____和____两个阶段。(注意大小写)
____组件的作用就是对Map阶段的输出的重复数据先做一次合并计算,然后把新的(key,value)作为Reduce阶段的输入。(注意大小写)
输入Map阶段的数据源,必须经过____和格式化操作。