多选题以下对 Flume 描述哪些是正确的?
A. 高可用的
B. 负责处理数据
C. 负责海量日志采集
D. 高可靠的
多选题下列哪些是 Hadoop 的运行模式?
A. 单机模式
B. 伪分布式
C. 完全分布式
D. 高可用
多选题下面哪些是引起 Spark 负载不均的原因?
A. 在数据过滤阶段需要处理的数据量差异
B. Spark 的运行方式差异
C. Spark 读入的数据源是倾斜的
D. Shuffle 阶段 Key 值过于集中
多选题在HDFS的文件写操作流程中,关于Client 上传文件描述下列哪项是正确的?
A. 所有数据都经过NameNode 传递给DataNode
B. Client 将文件切分为多个 block并依次上传
Client 只上传数据到一台DataNode,然后由NameNode 负责block的多个副本的复制工作
D. client 根据DataNode 的地址信息,把block按顺序写入到每一个DataNode