题目内容

下列说法错误的是?

A. RDD(Resillient Distributed Dataset)是运行在工作节点(WorkerNode)的一个进程,负责运行Task
B. Application是用户编写的Spark应用程序
C. 一个Job包含多个RDD及作用于相应RDD上的各种操作
Directed A,Cyclic Graph反映RDD之间的依赖关系

查看答案
更多问题

下列哪个说法是错误的?

A. 从编程的灵活性来讲,Storm是比较理想的选择,它使用ApA,Che Thrift,可以用任何编程语言来编写拓扑结构(Topology)
B. Spark Streaming可以实现毫秒级的流计算
C. Spark Streaming无法实现毫秒级的流计算
D. 在Spark上可以统一部署Spark SQL,Spark Streaming、MLlib,GraphX等组件,提供便捷的一体化编程模型

以下哪个不属于数据分析应用?

A. 基于规则的报警
B. 移动应用中的产品更新及实验评估分析
C. 消费者技术中的实时数据即席分析
D. 大规模图分析

采用MapReduce实现PageRank的计算过程包括三个阶段,下列哪一项是错的?

A. 第一阶段:解析网页
B. 第二阶段:PageRank分配
C. 第三阶段:收敛阶段
D. 第一阶段:收集网页

下列关于PageRank 算法在MapReduce 中的实现的描述,错误的是?

A. 解析网页的任务就是分析一个页面的链接数,但是不赋初值
B. PageRank 分配就是多次迭代计算页面的PageRank值
C. 收敛阶段的任务就是由一个非并行组件决定是否达到收敛
D. 一般判断是否收敛的条件是所有网页的PageRank值不再变化,或者运行30次以后我们就认为已经收敛了

答案查题题库