超星 - 2021-12-3-作业 - 查题吧

单选题

上传到视频库中的小视频属于( )。

A. 结构化数据
B. 半结构化数据
C. 非结构化数据
D. 混合结构数据

单选题

数据[2 , 3 , 1 , NaN, 7 , 6 , 5]存在缺失值,使用均值填充后的结果是( )。

A. [2,3,1,3,7,6,5]
B. [2,3,1,5,7,6,5]
C. [2,3,1, 3.8,7,6,5]
D. [2,3,1,4,7,6,5]

单选题

数据[3,5,7,4,5,6,5,4,3,5,5,8]的众数和均值分别是( )。

A. 3和5
B. 5和3
C. 3和3
D. 5和5

单选题

ETL是( )。

A. Extract、Transform、Load三个单词的首字母缩写,即数据抽取、转换、加载的过程。
B. Extract、Transport、Load三个单词的首字母缩写,即数据抽取、运输、加载的过程。
C. Extract、Translate、Load三个单词的首字母缩写,即数据抽取、转译、加载的过程。
D. Extract、Transform、Link三个单词的首字母缩写,即数据抽取、转换、连接的过程。

单选题

Hadoop1.x可以支持的计算框架有( )。

A. Map-Reduce
B. Storm
C. Spark
D. Flink

单选题

下列不属于NoSQL数据库的是( )。

A. HBASE
B. MongoDB
C. Redis
D. MySQL

单选题

下列不属于爬虫的网页抓取策略的是( )。

A. 深度优先遍历策略
B. 反向链接数策略
C. U-V最大策略
D. 宽度优先遍历策略

单选题

关于数据标准化错误的描述是( )。

A. 消除数据的量纲差异的影响
B. 消除数值量级即取值范围差异的影响
C. 将特征值按比例缩放到一个特定的区间
D. 转换为标准的字符体系

单选题

以下不属于数据清洗的处理是( )

A. 空缺值处理
B. 异常值处理
C. 0-1标准化处理
D. 噪声过滤处理

单选题

下列不属于批处理计算的特点是( )。

A. 有界:批处理的数据集是数据的有限集合。
B. 无界:批处理的数据集是无限的数据的集合。
C. 持久:数据通常存储在某种类型的持久存储系统中,如HDFS或数据库。
D. 大量:批处理操作通常处理极为海量的数据集。

2