题目内容

Spark的关键特征包括弹性分布式数据集(RDD) 、RDD操作和共享变量、容错。

A. 对
B. 错

查看答案
更多问题

数据变换指的是通过平滑聚集、数据概化、规范化等方式将数据转换成适用于数据挖掘的形式。

A. 对
B. 错

数据的集成是将多个数据集整合为一个数据库的过程。

A. 对
B. 错

数据规约主要通过属性和数据本身两个方面实现数据精简。

A. 对
B. 错

针对大数据中“脏”数据的各种问题,数据清洗的主要内容分两类:一致性检查、无效值和缺失值处理。

A. 对
B. 错

答案查题题库