题目内容

下面对于MapReduce的描述哪一个是正确的。()

A. 分布式文件系统
B. 分布式并行编程模型
C. 资源管理和调度器
D. 运行在YARN之上的下一代Hadoop查询处理框架

查看答案
更多问题

以下哪些选项属于 FusionInsight SparkSQL 的优点?()

A. 稳定和高性能
B. 长稳测试
C. SQL 兼容性
D. 支持数据插入,更新和删除
E. 其余全都正确

Spark是以下哪种编程语言实现的?

A. C
B. C++
C. JAVA
D. Scala

Spark应用在运行时,Stage划分的依据是什么?()

A. task
B. taskSet
C. action
D. shuffle

在很多小文件场景下,Spark会其很多Task,但SQL逻辑中存在Shuffle操作是,会大大增加hash分桶树,严重影响性能。FusionInsight中,针对小文件生成的partition进行合并,减少partition数,从而避免在shuffle的时候,车过多的hash分桶,提升性能?()

A. group by
B. coalosce
C. connect
D. jion

答案查题题库