MapReduce执行的全过程包括以下哪几个主要阶段?
A. 从分布式文件系统读入数据
B. 执行Map任务输出中间结果
C. 通过 Shuffle阶段把中间结果分区排序整理后发送给Reduce任务
D. 执行Reduce任务得到最终结果并写入分布式文件系统
查看答案
下列说法正确的是?
A. MapReduce体系结构主要由四个部分组成,分别是:Client、JobTracker、TaskTracker以及Task
B. Task 分为Map Task 和Reduce Task 两种,均由TaskTracker 启动
C. 在MapReduce工作流程中,所有的数据交换都是通过MapReduce框架自身去实现的
D. 在MapReduce工作流程中,用户不能显式地从一台机器向另一台机器发送消息
下列选项中,哪些属于Hadoop1.0的核心组件的不足之处?
A. 实时性差(适合批处理,不支持实时交互式)
B. 资源浪费(Map和Reduce分两阶段执行)
C. 执行迭代操作效率低
D. 难以看到程序整体逻辑
Hadoop的优化与发展主要体现在哪几个方面?
A. Hadoop自身核心组件MapReduce的架构设计改进
B. Hadoop自身核心组件HDFS的架构设计改进
C. Hadoop生态系统其它组件的不断丰富
D. Hadoop生态系统减少不必要的组件,整合系统
下列哪些属于Hadoop2.0相对于Hadoop1.0的改进?
A. 设计了HDFS HA
B. 提供名称节点热备机制
C. 设计了HDFS Federation,管理多个命名空间
D. 设计了新的资源管理框架YARN