单选题MapReduce 中可能引起负载问题的原因有哪些?
A. Map 中 Key 值选取和设定问题,导致 Key 值过于集中
B. DataNode 节点与 Map 节点不在一起
C. MapReduce 需要处理的数据量过大
D. 数据本身的格式问题,例如:文档格式混乱
查看答案
单选题配置主机名和 IP 地址映射的文件位置是
A. /etc/host
B. /usr/local/hosts
C. /etc/hosts
D. /home/hosts
单选题以下对窄依赖描述正确的是
A. 表现为存在一个父 RDD 的一个分区对应一个子 RDD 的多个分区,对输入进行协同划分
B. 可以表现为一个父 RDD 的分区对应于一个子 RDD 的分区,对输入进行协同划分
C. 可以表现为多个父 RDD 的分区对应于一个子 RDD 的分区,对输入进行非协同划分
D. 表现为存在一个父 RDD 的一个分区对应一个子 RDD 的多个分区,对输入进行非协同划分
单选题禁用 ipv6 需要修改的是哪个配置文件
A. /etc/profile
B. /etc/networks
C. /etc/sysctl.conf
D. ~/.bashrc
单选题下列不属于大数据项目实施工作流程的是
A. 项目规划阶段
B. 数据治理阶段
C. 项目设计阶段
D. 系统运维阶段