脏数据的表现形式有哪些?()
A. 缺失数据
B. 重复数据
C. 不一致数据
D. 不可用数据
下面属于维归约处理的线性代数方法的是( )。
A. 主成分分析
B. 特征提取
C. 奇异值分解
D. 特征加权
E. 离散小 波转换
大数据的主要特征表现为
A. 价值密度低
B. 数据类型多
C. 处理速度快
D. 数据容量大
数据清理的基本内容包括( )
A. 尽可能复印属性名和属性值明确的含义
B. 统一多数据源的属性值编码
C. 去除无用的唯一属性或键值
D. 去除重复属性
E. 去除可以忽略的属性
F. 合理选择关联字段
G. 去掉数据中的噪声,填充空值,丢失值和处理不一致的数据