对于MapReduce 而言,其处理单位是split。split 是一个逻辑概念,它包含哪些元数据信息?
A. 数据起始位置
B. 数据长度
C. 数据所在节点
D. 数据大小
查看答案
下列关于Map 端的Shuffle的描述,哪些是正确的?
A. MapReduce默认为每个Map任务分配1000MB缓存
B. 多个溢写文件归并成一个或多个大文件,文件中的键值对是排序的
C. 当数据很少时,不需要溢写到磁盘,直接在缓存中归并,然后输出给Reduce
D. 每个Map任务分配多个缓存,使得任务运行更有效率
MapReduce的具体应用包括哪些?
A. 关系代数运算(选择、投影、并、交、差、连接)
B. 分组与聚合运算
C. 矩阵-向量乘法
D. 矩阵乘法
MapReduce执行的全过程包括以下哪几个主要阶段?
A. 从分布式文件系统读入数据
B. 执行Map任务输出中间结果
C. 通过 Shuffle阶段把中间结果分区排序整理后发送给Reduce任务
D. 执行Reduce任务得到最终结果并写入分布式文件系统
下列说法正确的是?
A. MapReduce体系结构主要由四个部分组成,分别是:Client、JobTracker、TaskTracker以及Task
B. Task 分为Map Task 和Reduce Task 两种,均由TaskTracker 启动
C. 在MapReduce工作流程中,所有的数据交换都是通过MapReduce框架自身去实现的
D. 在MapReduce工作流程中,用户不能显式地从一台机器向另一台机器发送消息