A. 实时的在线数据分析 B. 非实时分析,例如日志分析,统计分析 C. 数据汇总,例如每天,每周用户点击数,点击排行 D. 数据挖掘,例如用户行为分析,兴趣分区,区域展示
A. 可直接访问HDFS文件以及HBase B. 灵活方便的ETL C. 仅支持MapReduce计算引擎 D. 易用易编程
A. UNION ALL B. JOIN C. SELECT D. GROUP BY
A. 修改文件格式 B. 删除表 C. 创建表 D. 添加列
A. Hive最终将数据存储在HDFS中 B. Hive SQL其本质是执行MapReduce任务 C. Hive是Hadoop平台的数据仓库工具 D. Hive对HBase有强依赖
A. 由于Hive的数据存储在HDFS中,所以可以保证数据的高容错、高可靠。 B. 由于Hive基于大数据平台,所以查询效率比传统数据仓库快 C. Hive基于HDFS存储,理论上存储量可以无限扩展,而传统的数据仓库存储量会有上限 D. Hive元数据存储独立于数据存储之外,从而解偶合元数据和数据,灵活性高,而传统数据仓库数据应用单一,灵活性低
A. 直接将本地路径的文件load到hive表中 B. 将HDFS上的文件load到Hive表中 C. Hive支持insert into单条记录的方法,所以可以直接在命令行插入单条记录 D. 将其他表的结果集insert into到Hive表
A. Hive可以实现在大规模数据集上实现低延迟快速的查询 B. Hive构建在基于静态批处理的Hadoop之上,Hadoop通常都有较高的延迟并且在作业提交和调度的时候需要大量的开销。 C. Hive的最佳使用场合是大数据集的批处理作业 D. Hive查询操作过程严格遵守Hadoop MapReduce的作业执行模型,Hive将用户的HiveQL语句通过解释器转为MapReduce作业提交到Hadoop集群上。
A. HFile B. TexFile C. SequenceFile D. RCFile
A. HFile B. TextFile C. SequenceFile D. RCFile