题目内容

SparkSQL表中,经常会存在很多小文件(大小远小于HDFS块大小),在这种情况下,Spark会启动更多的Task来处理这些小文件,当SQL逻辑中存在Shuffle操作时,会大大增加hash分桶数,从而严重影响性能()

A. 对
B. 错

查看答案
更多问题

FusionInsight系统中,Hive不支持子查询功能()

A. 对
B. 错

SparkonYARN模式下,开启日志归集功能后,Spark任务的container日志在运行完之后,存放在HDFS文件系统中()

A. 对
B. 错

Spark任务的每个stage可划分为几个job,划分的标记是shuffle()

A. 对
B. 错

Sink取走数据并写入目的地后,会将event从channel中删除()

A. 对
B. 错

答案查题题库