题目内容

下列关于Map 端的Shuffle的描述,哪些是正确的?

A. MapReduce默认为每个Map任务分配1000MB缓存
B. 多个溢写文件归并成一个或多个大文件,文件中的键值对是排序的
C. 当数据很少时,不需要溢写到磁盘,直接在缓存中归并,然后输出给Reduce
D. 每个Map任务分配多个缓存,使得任务运行更有效率

查看答案
更多问题

MapReduce的具体应用包括哪些?

A. 关系代数运算(选择、投影、并、交、差、连接)
B. 分组与聚合运算
C. 矩阵-向量乘法
D. 矩阵乘法

MapReduce执行的全过程包括以下哪几个主要阶段?

A. 从分布式文件系统读入数据
B. 执行Map任务输出中间结果
C. 通过 Shuffle阶段把中间结果分区排序整理后发送给Reduce任务
D. 执行Reduce任务得到最终结果并写入分布式文件系统

下列说法正确的是?

A. MapReduce体系结构主要由四个部分组成,分别是:Client、JobTracker、TaskTracker以及Task
B. Task 分为Map Task 和Reduce Task 两种,均由TaskTracker 启动
C. 在MapReduce工作流程中,所有的数据交换都是通过MapReduce框架自身去实现的
D. 在MapReduce工作流程中,用户不能显式地从一台机器向另一台机器发送消息

下列选项中,哪些属于Hadoop1.0的核心组件的不足之处?

A. 实时性差(适合批处理,不支持实时交互式)
B. 资源浪费(Map和Reduce分两阶段执行)
C. 执行迭代操作效率低
D. 难以看到程序整体逻辑

答案查题题库