题目内容

( )作为Spark大数据框架的一部分,主要用于结构化数据处理和对Spark数据执行类SQL的查询。

A. Data Manager
B. Cluster Manager
C. Spark Runtime
D. Spark SQL

查看答案
更多问题

( )是一个分布式机器学习库,即在Spark平台上对一些常用的机器学习算法进行了分布式实现。

A. Data Manager
B. MLlib
C. Spark Runtime
D. Spark SQL

( )是构建在Spark上的图计算模型,它利用Spark框架提供的内存缓存RDD、DAG和基于数据依赖的容错等特性,实现高效健壮的图计算框架。

A. Data Manager
B. MLlib
C. Spark Runtime
D. GraphX

大数据处理的基本流程可概括为()阶段。

A. 数据采集
B. 数据预处理
C. 数据存储
D. 数据分析挖掘

大数据呈现出的特征有( )。

A. 数据量大
B. 多样化
C. 数据价值 密度低
D. 速度快,时效高

答案查题题库