题目内容

关于数据仓库Impala的描述正确的是:( )

A. Impala是由Oracle公司开发的查询系统
B. 与Hive类似,Impala也可以直接与HDFS和HBase进行交互
C. Impala采用了与商用MPP并行关系数据库类似的分布式查询引擎,可以直接从HDFS或者HBase中用SQL语句查询数据,而不需要把SQL语句转化成MapReduce任务来执行
D. Impala和Hive采用了不同的SQL语法、ODBC驱动程序和用户接口

查看答案
更多问题

Spark的特点主要包括:( )

A. 运行速度快
B. 容易使用
C. 通用性
D. 运行模式单一

不同的计算框架统一运行在YARN中,可以带来哪些好处:( )

A. 减少了所使用的编程语言的种类
B. 计算资源按需伸缩
C. 不用负载应用混搭,集群利用率高
D. 共享底层存储,避免数据跨集群迁移

下面关于Spark的运行架构的描述,正确的是:( )

A. Spark运行架构包括Cluster Manager、Worker Node、Driver Program和Executor
B. Spark集群资源管理器可以是Spark自带的资源管理器,也可以是YARN或Mesos等资源管理框架
C. Spark采用“P2P架构”
D. Spark利用多线程来执行具体的任务

下面关于RDD的描述正确的是:( )

A. 一个RDD就是一个分布式对象集合
B. 一个RDD本质上是一个只读的分区记录集合
C. RDD提供了一组丰富的操作以支持常见的数据运算,分为“行动”(Action)和“转换”(Transformation)两种类型
D. RDD不适合对于数据集中元素执行相同操作的批处理式应用,而比较适合用于需要异步、细粒度状态的应用

答案查题题库