在Spark生态系统组件的应用场景中,下列哪项说法是错误的?
A. Spark应用在复杂的批量数据处理
B. Spark SQL是基于历史数据的交互式查询
C. Spark Streaming是基于历史数据的数据挖掘
D. GraphX是图结构数据的处理
查看答案
下列说法错误的是?
A. RDD(Resillient Distributed Dataset)是运行在工作节点(WorkerNode)的一个进程,负责运行Task
B. Application是用户编写的Spark应用程序
C. 一个Job包含多个RDD及作用于相应RDD上的各种操作
Directed Acyclic Graph反映RDD之间的依赖关系
下列关于RDD说法,描述有误的是?
A. 一个RDD就是一个分布式对象集合,本质上是一个只读的分区记录集合
B. 每个RDD可分成多个分区,每个分区就是一个数据集片段
C. RDD是可以直接修改的
D. RDD提供了一种高度受限的共享内存模型
Spark生态系统组件Spark Streaming的应用场景是?
A. 基于历史数据的数据挖掘
B. 图结构数据的处理
C. 基于历史数据的交互式查询
D. 基于实时数据流的数据处理
Spark生态系统组件MLlib的应用场景是?
A. 图结构数据的处理
B. 基于历史数据的交互式查询
C. 复杂的批量数据处理
D. 基于历史数据的数据挖掘多选题