题目内容

以下属于日志文件采集工具的是?

A. HDFS
B. flume
C. ETL
D. URL

查看答案
更多问题

数据集成的主要目的是?

A. 缺失值处理
B. 异常值处理
C. 压缩数据
D. 去除冗余数据

数据集成时首要解决的问题是?

A. 实体识别
B. 元组冗余
C. 属性冗余
D. 统一性

数据归约的目的是?

A. 精简数据集
B. 清洗脏数据
C. 缺失值填充
D. 冗余数据去除

数据清洗的主要目的是?

A. 去除冗余数据
B. 残缺数据完整
C. 压缩数据
D. 对数据进行归一化处理

答案查题题库