题目内容

关于数据标准化错误的描述是( )。

A. 消除数据的量纲差异的影响
B. 消除数值量级即取值范围差异的影响
C. 将特征值按比例缩放到一个特定的区间
D. 转换为标准的字符体系

查看答案
更多问题

以下不属于数据清洗的处理是( )

A. 空缺值处理
B. 异常值处理
C. 0-1标准化处理
D. 噪声过滤处理

下列不属于批处理计算的特点是( )。

A. 有界:批处理的数据集是数据的有限集合。
B. 无界:批处理的数据集是无限的数据的集合。
C. 持久:数据通常存储在某种类型的持久存储系统中,如HDFS或数据库。
D. 大量:批处理操作通常处理极为海量的数据集。

关于HBASE错误的表述是( )。

A. HBase中执行更新操作时,并不会删除数据旧的版本,而是生成一个新的版本,旧有的版本仍然保留(这是和HDFS只允许追加不允许修改的特性相关的)
B. HBase是一个稀疏、多维度、排序的映射表,这张表的索引是行键、列族、列限定符
C. HBase的列族支持动态扩展,可以很轻松地添加一个列族或列,无需预先定义列的数量以及类型,所有列均以字符串形式存储,用户需要自行进行数据类型转换
D. HBase的每个单元格都保存着同一份数据的多个版本,这些版本采用时间戳进行索引

下列选项中支持流计算的计算框架是( )。

A. Map-Reduce
B. Storm
C. Kafka
D. Flume

答案查题题库