在Spark生态系统组件的应用场景中,下列哪项是错误的?
A. Spark应用在复杂的批量数据处理
B. SparkSQL是基于历史数据的交互式查询
C. Spark Streaming是基于历史数据的数据挖掘
D. GraphX是图结构数据的处理
下列说法错误的是?
A. RDD是运行在工作节点上的一个进程,负责运行Task
B. Application是用户编写的Spark应用程序
C. 一个Job包含多个RDD及作用于相应RDD上的各种操作
Directed Acyclic Graph反映RDD之间的依赖关系
Spark生态系统组件MLib的应用场景是?
A. 图结构数据的处理
B. 基于历史数据的交互式查询
C. 复杂的批量数据处理
D. 基于历史数据的数据挖掘
Scala具有以下哪几个主要特点?
A. Scala的优势是提供了REPL,提高程序开发效率
B. Scala兼容Java,运行速度快,且能融合到Hadoop生态圈中
C. Scala具备强大的并发性,支持函数式编程
D. Scala可以更好地支持分布式系统