在实际的问题中我们遇到的数据量往往是巨大的。为了保证我们所用的方法能够在原始数据的支持下得以实现,我们必须要对数据进行( )。
A. 筛选
B. 离散化
C. 标准化
D. 量化
层次聚类的缺点( )
A. 计算复杂度太高
B. 奇异值也能产生很大影响
C. 算法很可能聚类成链状
D. 不需要预先制定聚类数
关于离散化说法错误的有()
A. 离散化是将数值属性转换为字符串型属性
B. 有监督离散化有两种等宽和等频方法
C. 等宽离散化是使实例分布均匀的
D. 离散化包括无监督离散化和有监督离散化
以下工作流节点中属于“算法”的有( )
A. 逻辑回归
B. 线性回归
C. 量化
D. 行转列