A. 结构化数据 B. 半结构化数据 C. 非结构化数据 D. 混合结构数据
A. [2,3,1,3,7,6,5] B. [2,3,1,5,7,6,5] C. [2,3,1, 3.8,7,6,5] D. [2,3,1,4,7,6,5]
A. 3和5 B. 5和3 C. 3和3 D. 5和5
A. Extract、Transform、Load三个单词的首字母缩写,即数据抽取、转换、加载的过程。 B. Extract、Transport、Load三个单词的首字母缩写,即数据抽取、运输、加载的过程。 C. Extract、Translate、Load三个单词的首字母缩写,即数据抽取、转译、加载的过程。 D. Extract、Transform、Link三个单词的首字母缩写,即数据抽取、转换、连接的过程。
A. Map-Reduce B. Storm C. Spark D. Flink
A. HBASE B. MongoDB C. Redis D. MySQL
A. 深度优先遍历策略 B. 反向链接数策略 C. U-V最大策略 D. 宽度优先遍历策略
A. 消除数据的量纲差异的影响 B. 消除数值量级即取值范围差异的影响 C. 将特征值按比例缩放到一个特定的区间 D. 转换为标准的字符体系
A. 空缺值处理 B. 异常值处理 C. 0-1标准化处理 D. 噪声过滤处理
A. 有界:批处理的数据集是数据的有限集合。 B. 无界:批处理的数据集是无限的数据的集合。 C. 持久:数据通常存储在某种类型的持久存储系统中,如HDFS或数据库。 D. 大量:批处理操作通常处理极为海量的数据集。