数据清洗的处理步骤有( )。
A. 数据接入观测
B. 缺失值填补
C. 逻辑错误处理
D. 剔除无用数据
数据清洗一般遵循以下哪些原则( )。
A. 每份数据连入时都针对这份数据清洗,清洗干净后再做数据合并、联接
B. 数据量小的数据连入时,先合并、联接数据后再清洗
C. 在大规模数据计算前,先执行数据清洗
D. 数据清洗结果有问题时,从数据源头开始检查数据质量问题
以下哪些内容是常见的数据清洗问题( )。
A. 数值为空,有缺失
B. 有影响指标计算的非法字符,如英文逗号、空格等
C. 重复数据
D. 日期、时间格式不一致
在案例数据集中可以使用清除所有空格的全局清洗规则。( )
A. 对
B. 错