题目内容

下列关于Scala特性的描述,错误的是哪一项?

A. Scala语法复杂,但是能提供优雅的API计算
B. Scala具备强大的并发性,支持函数式编程,可以更好地支持分布式系统
C. Scala兼容Java,运行速度快,且能融合到Hadoop生态圈中
D. Scala是Spark的主要编程语言

查看答案
更多问题

下列说法哪项有误?

A. 相对于Spark来说,使用Hadoop进行迭代计算非常耗资源
B. Spark将数据载入内存后,之后的迭代计算都可以直接使用内存中的中间结果作运算,避免了从磁盘中频繁读取数据
C. Hadoop的设计遵循“一个软件栈满足不同应用场景”的理念
D. Spark可以部署在资源管理器YARN之上,提供一站式的大数据解决方案

在Spark生态系统组件的应用场景中,下列哪项说法是错误的?

A. Spark应用在复杂的批量数据处理
B. Spark SQL是基于历史数据的交互式查询
C. Spark Streaming是基于历史数据的数据挖掘
D. GraphX是图结构数据的处理

下列说法错误的是?

A. RDD(Resillient Distributed Dataset)是运行在工作节点(WorkerNode)的一个进程,负责运行Task
B. Application是用户编写的Spark应用程序
C. 一个Job包含多个RDD及作用于相应RDD上的各种操作
Directed Acyclic Graph反映RDD之间的依赖关系

下列关于RDD说法,描述有误的是?

A. 一个RDD就是一个分布式对象集合,本质上是一个只读的分区记录集合
B. 每个RDD可分成多个分区,每个分区就是一个数据集片段
C. RDD是可以直接修改的
D. RDD提供了一种高度受限的共享内存模型

答案查题题库