多选题Namenode 在启动时自动进入安全模式,对安全模式的描述哪些是正确的?
A. 安全模式目的是在系统启动时检查各个 DataNode 上数据块的有效性
B. 会根据策略对数据块进行必要的复制或删除
C. 数据块最小百分比数满足的最小副本数条件时,会自动退出安全模式
D. 允许对HDFS文件系统的文件数据进行修改
查看答案
多选题Kafka 的设计初衷是应用于以下哪些场景?
A. 网站运营统计
B. 处理海量日志
C. 用户行为统计
D. 数据转换
多选题以下哪些属于非关系型数据库?
A. MySQL
B. MongoDB
C. HBase
D. Neo
多选题下对Spark中窄依赖的描述哪些是错误的?
A. 表现为存在一个父 RDD 的一个分区对应一个子 RDD 的多个分区,对输入进行协同划分
B. 可以表现为一个父 RDD 的分区对应于一个子 RDD 的分区,对输入进行协同划分
C. 可以表现为多个父 RDD 的分区对应于一个子 RDD 的分区,对输入进行非协同划分
D. 表现为存在一个父 RDD 的一个分区对应一个子 RDD 的多个分区,对输入进行非协同划分
多选题关于对整个大数据平台按其职能划分成的五个模块层次,以下描述哪些正确的?
A. 运行环境层为基础设施层提供运行时环境,它由 2 部分构成,即操作系统和运行时环境
B. 基础设施层由 2 部分组成:Zookeeper 集群和 Hadoop 集群。它为基础平台层提供基础设施服务
C. 基础平台层由 3 个部分组成:任务调度控制台、HBase 和 Hive。它为用户网关层提供基础服务调用接口
D. 用户网关层用于为终端客户提供个性化的调用接口以及用户的身份认证,是用户唯一可见的大数据平台操作入口