下列说法错误的是?
A. RDD(Resillient Distributed Dataset)是运行在工作节点(WorkerNode)的一个进程,负责运行Task
B. Application是用户编写的Spark应用程序
C. 一个Job包含多个RDD及作用于相应RDD上的各种操作
Directed A,Cyclic Graph反映RDD之间的依赖关系
下列哪个说法是错误的?
A. 从编程的灵活性来讲,Storm是比较理想的选择,它使用ApA,Che Thrift,可以用任何编程语言来编写拓扑结构(Topology)
B. Spark Streaming可以实现毫秒级的流计算
C. Spark Streaming无法实现毫秒级的流计算
D. 在Spark上可以统一部署Spark SQL,Spark Streaming、MLlib,GraphX等组件,提供便捷的一体化编程模型
以下哪个不属于数据分析应用?
A. 基于规则的报警
B. 移动应用中的产品更新及实验评估分析
C. 消费者技术中的实时数据即席分析
D. 大规模图分析
采用MapReduce实现PageRank的计算过程包括三个阶段,下列哪一项是错的?
A. 第一阶段:解析网页
B. 第二阶段:PageRank分配
C. 第三阶段:收敛阶段
D. 第一阶段:收集网页