A. 价值密度低 B. 数据类型多 C. 处理速度快 D. 数据容量大
A. 尽可能复印属性名和属性值明确的含义 B. 统一多数据源的属性值编码 C. 去除无用的唯一属性或键值 D. 去除重复属性 E. 去除可以忽略的属性 F. 合理选择关联字段 G. 去掉数据中的噪声,填充空值,丢失值和处理不一致的数据
A. 数据清理 B. 数据可视化 C. 数据变换 D. 数据归约
A. 对 B. 错