Hadoop生态系统中Hive与其他部分的关系的描述正确的是:( )
A. HDFS作为高可靠的底层存储,用来存储Hive的海量数据
B. MapReduce对这些海量数据进行批处理,实现Hive的高性能计算
C. 当采用MapRedue作为Hive的执行引擎时,用HiveQL语句编写的处理逻辑,最终都要转化为MapReduce任务来运行
D. HBase与Hive的功能是互补的,它实现了Hive不能提供的功能
关于Hive与传统关系数据库的对比分析,下面描述正确的是:( )
A. 在数据存储方面,Hive一般依赖于分布式文件系统HDFS,而传统数据库则依赖于本地文件系统
B. 在索引方面,传统的关系数据库可以针对多个列构建复杂的索引,大幅度提升数据查询性能,而Hive不像传统的关系型数据库那样有键的概念,它只能提供有限的索引功能
C. 在分区方面,传统的数据库提供分区功能来改善大型表以及具有各种访问模式的表的可伸缩性、可管理性,以及提高数据库效率;Hive不支持分区功能
D. 在执行引擎方面,传统的关系数据库依赖自身的执行引擎,而Hive则依赖于MapReduce、Tez和Spark等执行引擎
Hive主要由哪三个模块组成:( )
A. 用户接口模块
B. 用户查询模块
C. 驱动模块
D. 元数据存储模块
当采用MapReduce作为Hive的执行引擎时,下面描述正确的是:( )
A. 当用户向Hive输入一段命令或查询(即HiveQL语句)时,Hive需要与Hadoop交互工作来完成该操作
B. 命令或查询首先进入到驱动模块,由驱动模块中的编译器进行解析编译,并由优化器对该操作进行优化计算,然后交给执行器去执行
C. 执行器通常的任务是启动一个或多个MapReduce任务,有时也不需要启动MapReduce任务
D. 执行器通常的任务一定会包含Map和Reduce操作第十章 Spark单选题