A. 计算机产生的数据 B. 人类的记录 C. 对现实世界的测量 D. 为分析数据而提供的虚拟数据
A. 数据源 B. 数据通道 C. 数据槽 D. 数据订阅者
A. 数据传输通道 B. 服务代理 C. 消息接收者 D. 消息发布者
A. “脏数据”清洗 B. 冗余数据去除 C. 异常数据处理 D. 压缩数据
A. 众数填充 B. 只要数据中的某属性残缺即可将该残缺数据删除 C. 最有可能的值填充 D. 中位数填充
A. 数据归一化 B. 分箱法 C. 回归分析 D. 聚类
A. 属性名重复 B. 属性描述相同实体的相同属性,但属性名不同 C. 属性可被导出 D. 属性不相关
A. 卡方检测 B. 实体识别 C. 协方差 D. 相关系数
A. 来源于真实世界的原始数据 B. 可以利用抽样数据模拟、逼近真实数据 C. 并非要采集大量数据,数据量过大,误差也会随之放大 D. 大数据的复杂算法与小数据的简单算法同等效果,所以可以不必采集全样数据
A. ETL抽取、转换、加载 B. 网络爬虫 C. 敏感元件感知 D. OLTP