下列关于聚类说法正确是 ( ) 。
A. 聚类样本一定要有标签
B. 应该将所有特征数据作为聚类依据
C. 聚类的k值可以随意指定
D. 聚类质心就是各簇群特征的平均值
下列 ( ) 聚类性能评价指标在[-1,1]之间,值越接近1说明聚类效果越好。
A. CH分数
B. 戴维森堡丁指数DBI
C. 轮廓系数
D. inertia
k-means模型的 ( ) 参数能保证聚类结果复现。
A. random_state
B. init
C. max_iter
D. algorithm
衡量聚类效果好坏的主要依据是 ( ) 。
A. 各类之间的界限明显
B. 各样本离各自质心之和最小
C. 类别之间的协方差越大越好
D. 同类样本紧促,不同类样本相距远