报纸上的一篇文章属于
A. 表格数据
B. 非结构化数据
C. 多媒体数据
D. 网络数据
下列关于数据标准化的表述正确的是
A. Min-Max标准化只能将数据映射到[0, 1]区间
B. Min-Max标准化对于离群值不敏感
C. Logistic标准化会改变原始数据的分布
D. Z-score标准化不会改变原始数据的分布
文本数据的预处理过程包括:
A. 哑变量处理
B. 处理停用词
C. 提取文本特征
D. 分词,词性标注
与传统互联网行业大数据相比,下列哪些是现代大数据具备的特点?
A. 数据体积更大
B. 数据产生速度更快
C. 具有总价值上升,价值密度下降
D. 数据种类更丰富