多选题以下哪些是 Spark 中 Worker Node 的作用?
A. 将资源和任务进一步分配给 Executor
B. 同步资源信息、Executor 状态信息给 Driver
C. 通过注册机制向 Cluster Master 汇报自身的 cpu 和 memory 等资源
D. 在Master 的指示下创建启动 Executor,Executor 是执行真正计算的苦力
查看答案
多选题以下哪些不是Hive 数据倾斜的表现?
A. Hive 运算任务为报错单长期卡在 99%
B. Hive 建表后数据无法导入
C. Hive sql 语句运行异常直接退出
D. Hive 无法启动
多选题Client端上传文件的时候下列哪项正确?
A. 数据经过NameNode传递给DataNode
B. Client端将文件以Block为单位,管道方式依次传到DataNode
Client只上传数据到一台DataNode,然后由DataNode负责Block复制工作
D. 当某个DataNode失败,Client会继续传给其它DataNode
多选题MapReduce 中可能引起负载问题的原因不包括哪些?
A. Map中Key值选取和设定问题,导致 Key 值过于集中
B. DataNode 节点与 Map 节点不在一起
C. MapReduce 需要处理的数据量过大
D. 数据本身的格式问题,例如:文档格式混乱
多选题以下有关大数据特点的描述,有哪些是正确的?
A. 数据量巨大
B. 数据增长速度快
C. 数据价值密度低
D. 多为结构化数据