多选题下对Spark中窄依赖的描述哪些是错误的?
A. 表现为存在一个父 RDD 的一个分区对应一个子 RDD 的多个分区,对输入进行协同划分
B. 可以表现为一个父 RDD 的分区对应于一个子 RDD 的分区,对输入进行协同划分
C. 可以表现为多个父 RDD 的分区对应于一个子 RDD 的分区,对输入进行非协同划分
D. 表现为存在一个父 RDD 的一个分区对应一个子 RDD 的多个分区,对输入进行非协同划分
多选题关于对整个大数据平台按其职能划分成的五个模块层次,以下描述哪些正确的?
A. 运行环境层为基础设施层提供运行时环境,它由 2 部分构成,即操作系统和运行时环境
B. 基础设施层由 2 部分组成:Zookeeper 集群和 Hadoop 集群。它为基础平台层提供基础设施服务
C. 基础平台层由 3 个部分组成:任务调度控制台、HBase 和 Hive。它为用户网关层提供基础服务调用接口
D. 用户网关层用于为终端客户提供个性化的调用接口以及用户的身份认证,是用户唯一可见的大数据平台操作入口
多选题下列关于 MapReduce 说法哪些是正确的
A. MapReduce 来源于 google 的学术论文
B. MapReduce 是一种分布式存储框架
C. MapReduce 程序只能用 java 语言编写
D. MapReduce 隐藏了并行计算的细节,方便使用
多选题Hadoop 的安装部署的模式属于伪分布模式,以下哪些描述是错误的?
A. 守护进程运行在由多台主机搭建的集群上
B. Hadoop的守护程序在本地计算机上运行,是模拟的集群环境, 并且是相互独立的Java 进程
C. 是真正的生产环境
D. 无需运行任何守护进程(daemon),所有程序都在单个 JVM 上执行