下列关于Scala特性的描述,错误的是哪一项?
A. Scala语法复杂,但是能提供优雅的API计算
B. Scala具备强大的并发性,支持函数式编程,可以更好地支持分布式系统
C. Scala兼容Java,运行速度快,且能融合到Hadoop生态圈中
D. Scala是Spark的主要编程语言
下列说法哪项有误?
A. 相对于Spark来说,使用Hadoop进行迭代计算非常耗资源
B. Spark将数据载入内存后,之后的迭代计算都可以直接使用内存中的中间结果作运算,避免了从磁盘中频繁读取数据
C. Hadoop的设计遵循“一个软件栈满足不同应用场景”的理念
D. Spark可以部署在资源管理器YARN之上,提供一站式的大数据解决方案
在Spark生态系统组件的应用场景中,下列哪项说法是错误的?
A. Spark应用在复杂的批量数据处理
B. Spark SQL是基于历史数据的交互式查询
C. Spark Streaming是基于历史数据的数据挖掘
D. GraphX是图结构数据的处理
下列说法错误的是?
A. RDD(Resillient Distributed Dataset)是运行在工作节点(WorkerNode)的一个进程,负责运行Task
B. Application是用户编写的Spark应用程序
C. 一个Job包含多个RDD及作用于相应RDD上的各种操作
Directed Acyclic Graph反映RDD之间的依赖关系