以下属于数据采集要求的是?
A. 来源于真实世界的原始数据
B. 可以利用抽样数据模拟、逼近真实数据
C. 并非要采集大量数据,数据量过大,误差也会随之放大
D. 大数据的复杂算法与小数据的简单算法同等效果,所以可以不必采集全样数据
传感器数据如何采集?
A. ETL抽取、转换、加载
B. 网络爬虫
C. 敏感元件感知
D. OLTP
以下属于日志文件采集工具的是?
A. HDFS
B. flume
C. ETL
D. URL
数据集成的主要目的是?
A. 缺失值处理
B. 异常值处理
C. 压缩数据
D. 去除冗余数据