A. 网站运营统计 B. 处理海量日志 C. 用户行为统计 D. 数据转换
A. MySQL B. MongoDB C. HBase D. Neo
A. 表现为存在一个父 RDD 的一个分区对应一个子 RDD 的多个分区,对输入进行协同划分 B. 可以表现为一个父 RDD 的分区对应于一个子 RDD 的分区,对输入进行协同划分 C. 可以表现为多个父 RDD 的分区对应于一个子 RDD 的分区,对输入进行非协同划分 D. 表现为存在一个父 RDD 的一个分区对应一个子 RDD 的多个分区,对输入进行非协同划分
A. 运行环境层为基础设施层提供运行时环境,它由 2 部分构成,即操作系统和运行时环境 B. 基础设施层由 2 部分组成:Zookeeper 集群和 Hadoop 集群。它为基础平台层提供基础设施服务 C. 基础平台层由 3 个部分组成:任务调度控制台、HBase 和 Hive。它为用户网关层提供基础服务调用接口 D. 用户网关层用于为终端客户提供个性化的调用接口以及用户的身份认证,是用户唯一可见的大数据平台操作入口
A. MapReduce 来源于 google 的学术论文 B. MapReduce 是一种分布式存储框架 C. MapReduce 程序只能用 java 语言编写 D. MapReduce 隐藏了并行计算的细节,方便使用
A. 守护进程运行在由多台主机搭建的集群上 B. Hadoop的守护程序在本地计算机上运行,是模拟的集群环境, 并且是相互独立的Java 进程 C. 是真正的生产环境 D. 无需运行任何守护进程(daemon),所有程序都在单个 JVM 上执行
A. 一次写入,一次读取 B. 一次写入,多次读取 C. 多次写入,一次读取 D. 多次写入,多次读取
A. 通过对不同高速路口收费站的原始数据记录的比对挖掘分析 B. 治安监控录像资料汇总分析 C. 通过人工观察 D. 警车上的跟踪设备产生的报告进行挖掘分析
A. 标准大页管理是预分配的方式 B. Linux 下的大页分为标准大页和透明大页两种类型 C. Linux 系统默认开启透明大页面功能 D. 透明大页管理是动态分配的方式
A. 数据在节点存储上分布不均 B. Hive 中表数量的多少 C. 运算中 Key 值分布不均 D. 业务数据本身存在分布不均