多选题以下关于Hadoop副本存放和机架感知策略的描述哪些是正确的?
A. 只有一个存放数据块副本的机架出问题,不会影响数据读写
B. 写入数据块副本的时候会写到不同机架的DataNode
C. MapReduce 会根据机架感知策略获取距离比较近的网络数据
D. 为了方便存放,数据块的所有副本都会存放在同一个机架上
查看答案
多选题以下哪些是 Spark 中 Worker Node 的作用?
A. 将资源和任务进一步分配给 Executor
B. 同步资源信息、Executor 状态信息给 Driver
C. 通过注册机制向 Cluster Master 汇报自身的 cpu 和 memory 等资源
D. 在Master 的指示下创建启动 Executor,Executor 是执行真正计算的苦力
多选题以下哪些不是Hive 数据倾斜的表现?
A. Hive 运算任务为报错单长期卡在 99%
B. Hive 建表后数据无法导入
C. Hive sql 语句运行异常直接退出
D. Hive 无法启动
多选题Client端上传文件的时候下列哪项正确?
A. 数据经过NameNode传递给DataNode
B. Client端将文件以Block为单位,管道方式依次传到DataNode
Client只上传数据到一台DataNode,然后由DataNode负责Block复制工作
D. 当某个DataNode失败,Client会继续传给其它DataNode
多选题MapReduce 中可能引起负载问题的原因不包括哪些?
A. Map中Key值选取和设定问题,导致 Key 值过于集中
B. DataNode 节点与 Map 节点不在一起
C. MapReduce 需要处理的数据量过大
D. 数据本身的格式问题,例如:文档格式混乱