多选题Kafka 的设计初衷是应用于以下哪些场景?
A. 网站运营统计
B. 处理海量日志
C. 用户行为统计
D. 数据转换
查看答案
多选题以下哪些属于非关系型数据库?
A. MySQL
B. MongoDB
C. HBase
D. Neo
多选题下对Spark中窄依赖的描述哪些是错误的?
A. 表现为存在一个父 RDD 的一个分区对应一个子 RDD 的多个分区,对输入进行协同划分
B. 可以表现为一个父 RDD 的分区对应于一个子 RDD 的分区,对输入进行协同划分
C. 可以表现为多个父 RDD 的分区对应于一个子 RDD 的分区,对输入进行非协同划分
D. 表现为存在一个父 RDD 的一个分区对应一个子 RDD 的多个分区,对输入进行非协同划分
多选题关于对整个大数据平台按其职能划分成的五个模块层次,以下描述哪些正确的?
A. 运行环境层为基础设施层提供运行时环境,它由 2 部分构成,即操作系统和运行时环境
B. 基础设施层由 2 部分组成:Zookeeper 集群和 Hadoop 集群。它为基础平台层提供基础设施服务
C. 基础平台层由 3 个部分组成:任务调度控制台、HBase 和 Hive。它为用户网关层提供基础服务调用接口
D. 用户网关层用于为终端客户提供个性化的调用接口以及用户的身份认证,是用户唯一可见的大数据平台操作入口
多选题下列关于 MapReduce 说法哪些是正确的
A. MapReduce 来源于 google 的学术论文
B. MapReduce 是一种分布式存储框架
C. MapReduce 程序只能用 java 语言编写
D. MapReduce 隐藏了并行计算的细节,方便使用