题目内容

192脏数据即数据有空缺、噪声等缺陷,而且在数据仓库的各数据源之间,其内容也可能存在着不一致的现象这也称之为脏数据。对这些数据的处理过程称之为数据清洗,常见的处理方式有()。

A. 针对数据空缺通常采用忽略元组、用一个全局常量填充空缺值、用属性的平均值填充空缺值、使用与给定元组同类的所有样本的平均值填充空缺值、使用最可能的值填充空缺值、使用Bayesian公式或判定树这样的基于推断的方法
B. 对于噪声数据可以用分箱或聚类等方法处理
C. 数据不一致则需要根据具体的业务场景来采取不同的处理方法
D. .对于噪声数据可以用删除或替换等方法处理

查看答案
更多问题

193下列数据分析方法中属于定量分析法的有?

A. 分组分析
B. 结构分析
C. 交叉分析
D. 对比分析

196数据分析方法包括定量分析法和定性分析法,下列数据分析方法中属于定性分析法的有?

A. 分组分析
B. 结构分析
C. 交叉分析
D. 对比分析

197以下数据常见的数据分析工具的是?

A. Tableau
B. QuickBI
C. DataV
D. PowerBI

198自定义函数分为以下哪几类?

A. UDF
B. UDT
C. UDTF
D. UDAF

答案查题题库