A. Client B. JobTracker C. TaskTracker D. Task
A. 用户编写的MapReduce程序通过Client提交到JobTracker端 B. JobTracker负责资源监控和作业调度 C. TaskTracker监控所有TaskTracker与Job的健康状况 D. TaskTracker 使用“slot”等量划分本节点上的资源量(CPU、内存等)
A. 从磁盘或从网络读取数据,即IO密集工作 B. 计算数据,即CPU密集工作 C. 针对不同的工作节点选择合适硬件类型 D. 负责协调集群中的数据存储
A. 数据起始位置 B. 数据长度 C. 数据所在节点 D. 数据大小
A. MapReduce默认为每个Map任务分配1000MB缓存 B. 多个溢写文件归并成一个或多个大文件,文件中的键值对是排序的 C. 当数据很少时,不需要溢写到磁盘,直接在缓存中归并,然后输出给Reduce D. 每个Map任务分配多个缓存,使得任务运行更有效率
A. 关系代数运算(选择、投影、并、交、差、连接) B. 分组与聚合运算 C. 矩阵-向量乘法 D. 矩阵乘法
A. 从分布式文件系统读入数据 B. 执行Map任务输出中间结果 C. 通过 Shuffle阶段把中间结果分区排序整理后发送给Reduce任务 D. 执行Reduce任务得到最终结果并写入分布式文件系统
A. MapReduce体系结构主要由四个部分组成,分别是:Client、JobTracker、TaskTracker以及Task B. Task 分为Map Task 和Reduce Task 两种,均由TaskTracker 启动 C. 在MapReduce工作流程中,所有的数据交换都是通过MapReduce框架自身去实现的 D. 在MapReduce工作流程中,用户不能显式地从一台机器向另一台机器发送消息
A. 实时性差(适合批处理,不支持实时交互式) B. 资源浪费(Map和Reduce分两阶段执行) C. 执行迭代操作效率低 D. 难以看到程序整体逻辑
A. Hadoop自身核心组件MapReduce的架构设计改进 B. Hadoop自身核心组件HDFS的架构设计改进 C. Hadoop生态系统其它组件的不断丰富 D. Hadoop生态系统减少不必要的组件,整合系统