多选题下列哪些是 Hadoop 的运行模式?
A. 单机模式
B. 伪分布式
C. 完全分布式
D. 高可用
多选题下面哪些是引起 Spark 负载不均的原因?
A. 在数据过滤阶段需要处理的数据量差异
B. Spark 的运行方式差异
C. Spark 读入的数据源是倾斜的
D. Shuffle 阶段 Key 值过于集中
多选题在HDFS的文件写操作流程中,关于Client 上传文件描述下列哪项是正确的?
A. 所有数据都经过NameNode 传递给DataNode
B. Client 将文件切分为多个 block并依次上传
Client 只上传数据到一台DataNode,然后由NameNode 负责block的多个副本的复制工作
D. client 根据DataNode 的地址信息,把block按顺序写入到每一个DataNode
多选题以下关于Hadoop副本存放和机架感知策略的描述哪些是正确的?
A. 只有一个存放数据块副本的机架出问题,不会影响数据读写
B. 写入数据块副本的时候会写到不同机架的DataNode
C. MapReduce 会根据机架感知策略获取距离比较近的网络数据
D. 为了方便存放,数据块的所有副本都会存放在同一个机架上