Spark是一个()计算框架。
A. 快速
B. 容错
C. 可扩展
D. 分布式
SparkSQL可以处理()。
A. RDD
B. Parquet文件
C. JSON文件
D. Hive表
以下哪种方法可以让Spark不自定义分区也能对任何类型RDD简单重分区()。
A. resetpartition
B. repartiton
C. coalesce
D. Partition
MLlib中进行数据标准化的方式有()。
A. StandardScaleer
B. Standard
C. Normalizer
D. MinMaxScaler