关于Hive与Hadoop生态系统中其他组件的关系,下面描述正确的是:( )
A. HDFS作为高可靠的底层存储,用来存储海量数据
B. MapReduce对这些海量数据进行批处理,实现高性能计算
C. 用HiveQL语句编写的处理逻辑,最终都要转化为MapReduce任务来运行
D. Hive的目标是取代HBase
Hive的系统架构主要包括哪几个模块:( )
A. 探查模块
B. 驱动模块
C. 元数据存储模块
D. 用户接口模块
Spark相对于MapReduce的优点包括:( )
A. Spark的计算模式也属于MapReduce,但不局限于Map和Reduce操作,还提供了多种数据集操作类型,编程模型比MapReduce更灵活
B. Spark提供了内存计算,中间结果直接放到内存中,带来了更高的迭代运算效率
C. Spark同时提供了存储功能,而MapReduce不支持存储
D. Spark基于DAG的任务调度执行机制,要优于MapReduce的迭代执行机制
在实际应用中,大数据处理主要包括哪几种类型:( )
A. 复杂的批量数据处理:时间跨度通常在数十分钟到数小时之间
B. 基于历史数据的交互式查询:时间跨度通常在数十秒到数分钟之间
C. 基于实时数据流的数据处理:时间跨度通常在数百毫秒到数秒之间
D. 基于历史数据的流查询:时间跨度在数十秒到数分钟之间