SVM普遍使用的准则描述不正确的是:( )(n为特征数,m为训练样本数。)
A. 如果相较于m而言,n要大许多,即训练集数据量不够支持我们训练一个复杂的非线性模型,我们选用逻辑回归模型或者不带核函数的支持向量机。
B. 如果n较小,而且m大小中等,例如n在 1-1000 之间,而m在10-10000之间,使用高斯核函数的支持向量机。
C. 支持向量机理论上不能处理太多的特征。
D. 如果n较小,而m较大,例如n在1-1000之间,而m大于50000,则使用支持向量机会非常慢,解决方案是创造、增加更多的特征,然后使用逻辑回归或不带核函数的支持向量机。
查看答案
关于聚类的说法正确的有 ( )
A. 其目的是根据过去的观测结果来预测新样本的标签为聚类
B. 聚类的算法训练样本往往都不含有标签
C. 聚类算法对于孤立的野值不敏感
D. 聚类算法的更新步骤可解释性不强
关于kmean算法的实现描述错误的是 ( )
A. 收敛速度慢
B. 原理简单,实现容易
C. 可以轻松发现非凸形状的簇
D. 需要事先确定k的值
以下哪些不是聚类中用于衡量度量距离的指标 ( )。
A. 汉明距离
B. 马氏距离
C. 曼哈顿距离
D. 欧式距离
以下哪些可作为kmeans方法停止循环的指标 ( )。
A. 当各个类中心还在发生偏移的时候
B. 当所有的野值点均隶属于一个簇的时候
C. 当循环数超过某一个阈值的时候
D. 当所有数据隶属的簇不再发生变化的时候