A. 来源于真实世界的原始数据 B. 可以利用抽样数据模拟、逼近真实数据 C. 并非要采集大量数据,数据量过大,误差也会随之放大 D. 大数据的复杂算法与小数据的简单算法同等效果,所以可以不必采集全样数据
A. ETL抽取、转换、加载 B. 网络爬虫 C. 敏感元件感知 D. OLTP
A. HDFS B. flume C. ETL D. URL
A. 缺失值处理 B. 异常值处理 C. 压缩数据 D. 去除冗余数据
A. 实体识别 B. 元组冗余 C. 属性冗余 D. 统一性