如果一个训练好的模型在测试集上有100%的准确率,这是不是意味着在一个新的数据集上,也会有同样好的表现()
A. 是的,这说明这个模型的范化能力已经足以支持新的数据集合了
B. 不对,依然后其他因素模型没有考虑到,比如噪音数据
查看答案
下面的交叉验证方法
i.有放回的Bootstrap方法
ii.留一个测试样本的交叉验证
iii.5折交叉验证
iv.重复两次的5折教程验证当样本是1000时,下面执行时间的顺序,正确的是()
A. i>ii>iii>iv
B. ii>iv>iii>i
C. iv>i>ii>iii
D. ii>iii>iv>i
以下哪个图是KNN算法的训练边界()
A. B
B. A
C. D
D. C
E. 都不是
对应GradientBoostingtree算法,以下说法正确的是()
1.当增加最小样本分裂个数,我们可以抵制过拟合
2.当增加最小样本分裂个数,会导致过拟合
3.当我们减少训练单个学习器的样本个数,我们可以降低variance
4.当我们减少训练单个学习器的样本个数,我们可以降低bias
A. 2和4
B. 2和3
C. 1和3
D. 1和4
在有监督学习中,我们如何使用聚类方法()
1.我们可以先创建聚类类别,然后在每个类别上用监督学习分别进行学习
2.我们可以使用聚类“类别id”作为一个新的特征项,然后再用监督学习分别进行学习
3.在进行监督学习之前,我们不能新建聚类类别
4.我们不可以使用聚类“类别id”作为一个新的特征项,然后再用监督学习分别进行学习
A. 2和4
B. 1和2
C. 3和4
D. 1和3