假设12个销售价格记录组已经排序如下:5, 10, 11, 13, 15, 35, 50, 55, 72, 92, 204, 215 使用等宽划分(宽度为52.5)将它们划分成四个箱,15又在哪个箱子里?
A. 第一个
B. 第二个
C. 第三个
D. 第四个
查看答案
假设收入属性的最小最大值分别是10000和90000,现在想把当前值30000映射到区间[0,1],若采用最大最小规范化方法,计算结果是多少?
A. 0.25
B. 0.375
C. 0.125
D. 0.5
假定用于分析的数据包含属性age。数据元组中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70, 问题:等深分箱,箱的深度为3,使用按箱平均值平滑方法对上述数据进行平滑。第二个箱子值为:
A. 18.3
B. 22.6
C. 26.8
D. 27.9
( )的目的缩小数据量,使其更适合于数据挖掘算法的需要,并且能够得到和原始数据相同的分析结果。
A. 数据清洗
B. 数据集成
C. 数据变换
D. 数据归约
数据清理的目的是处理数据中的( )
A. 空缺值
B. 噪声数据
C. 不一致的数据
D. 敏感数据