题目内容

()的目的在于提高数据质量,将脏数据清洗干净,使原数据具有完整性、唯一性、权威性、合法性、一致性等特点。

查看答案
更多问题

Spark继承了()分布 式计算的优点,同时也弥补了它的缺陷。

数据清洗主要包括()处理和噪声处理

()的设计思想是将数据文件以指定的大小切分成数据块,将数据块以多副本的方式存储在多个节点上,这样的设计使它可以更方便地做数据负载 均衡以及容错,而且这些功能对用户都是透明的。

大数据分析方法有哪些类型?

答案查题题库