题目内容

下列说法正确的是( )。

A. Combiner发生在Reduce端
B. MapReduce默认的输人格式是KeyValueInputFormat
C. Partitioner的作用是对key进行分区
D. 自定义值类型需要实现WritableComparable接口

查看答案
更多问题

不属于 Hive 优点的选项是? ( )

A. 提供与 SQL 相近的语法,容易上手,可以非常容易地完成数据 ETL
B. 适合处理结构化的数据
C. 存储格式灵活多样,有较强的扩展性
D. 适用于海量结构化数据分析汇总,查询速度非常快

关干 Hive SQL 运行原理,描述不正确的选项有?()

A. 所有 HQL 都会转化为 MapReduce 任务执行
B. DDL 语句不提交任务到 MapReduce,而是直接操作元数据
C. 对于 select count(*)from table 操作,一定会启 reduce 任务
D. 对于 select*from table 语句不会启 MapReduce

关与 Hive 与传统关系型数据库的对比,错误的是?()

A. Hive 基于 HDFS 存储,理论上存储量可无限扩展,而传统数据库存储量会有上限
B. 由于 Hive 基于大数据平台,所以查询效率比传统数据库快
C. 传统关系型数据库的索引机制发展的已经非常成熟,而 Hive 的索引机制还很低效
D. 由于 Hive 的数据存储在 HDFS 中,所以可以保证数据的高容错、高可靠

对于 Hive 中的分区(partition)概念,如下描述错误的是?()

A. 分区字段要在创建表时定义
B. 分区字段只能有一个,不可以创建多级分区
C. 使用分区,可以减少某些查询的数据扫描范围,进而提高查询效率
D. 分区字段可以作为 where 字句的条件

答案查题题库