题目内容

对于MapReduce 而言,其处理单位是split。split 是一个逻辑概念,它包含哪些元数据信息?

A. 数据起始位置
B. 数据长度
C. 数据所在节点
D. 数据大小

查看答案
更多问题

下列关于Map 端的Shuffle的描述,哪些是正确的?

A. MapReduce默认为每个Map任务分配1000MB缓存
B. 多个溢写文件归并成一个或多个大文件,文件中的键值对是排序的
C. 当数据很少时,不需要溢写到磁盘,直接在缓存中归并,然后输出给Reduce
D. 每个Map任务分配多个缓存,使得任务运行更有效率

MapReduce的具体应用包括哪些?

A. 关系代数运算(选择、投影、并、交、差、连接)
B. 分组与聚合运算
C. 矩阵-向量乘法
D. 矩阵乘法

MapReduce执行的全过程包括以下哪几个主要阶段?

A. 从分布式文件系统读入数据
B. 执行Map任务输出中间结果
C. 通过 Shuffle阶段把中间结果分区排序整理后发送给Reduce任务
D. 执行Reduce任务得到最终结果并写入分布式文件系统

下列说法正确的是?

A. MapReduce体系结构主要由四个部分组成,分别是:Client、JobTracker、TaskTracker以及Task
B. Task 分为Map Task 和Reduce Task 两种,均由TaskTracker 启动
C. 在MapReduce工作流程中,所有的数据交换都是通过MapReduce框架自身去实现的
D. 在MapReduce工作流程中,用户不能显式地从一台机器向另一台机器发送消息

答案查题题库