题目内容

以下哪个方法可以创建RDD()。

A. textFile
B. parallelize
C. makeRDD
D. loadFile

查看答案
更多问题

Spark是一个()计算框架。

A. 快速
B. 容错
C. 可扩展
D. 分布式

SparkSQL可以处理()。

A. RDD
B. Parquet文件
C. JSON文件
D. Hive表

以下哪种方法可以让Spark不自定义分区也能对任何类型RDD简单重分区()。

A. resetpartition
B. repartiton
C. coalesce
D. Partition

MLlib中进行数据标准化的方式有()。

A. StandardScaleer
B. Standard
C. Normalizer
D. MinMaxScaler

答案查题题库