使用k=1的knn算法,下图二类分类问题,“+”和“o”分别代表两个类,那么,用仅拿出一个测试样本的交叉验证方法,交叉验证的错误率是多少()
A. 0%
B. 100%
C. 0%到100
D. 以上都不是
查看答案
假设我们要解决一个二类分类问题,我们已经建立好了模型,输出是0或1,初始时设阈值为0.5,超过0.5概率估计,就判别为1,否则就判别为0;如果我们现在用另一个大于0.5的阈值,那么现在关于模型说法,正确的是()
1.模型分类的召回率会降低或不变
2.模型分类的召回率会升高
3.模型分类准确率会升高或不变
4.模型分类准确率会降低()
A. 1
B. 2
C. 1和3
D. 2和4E以上都不是
我们想在大数据集上训练决策树,为了使用较少时间,我们可以()
A. 增加树的深度
B. 增加学习率(learnin grate)
C. 减少树的深度
D. 减少树的数量
对于信息增益,决策树分裂节点,下面说法正确的是()
1.纯度高的节点需要更多的信息去区分
2.信息增益可以用”1比特-熵”获得
3.如果选择一个属性具有许多归类值,那么这个信息增益是有偏差的
A. 1
B. 2
C. 2和3
D. 所有以上
回归模型中存在多重共线性,你如何解决这个问题()
1.去除这两个共线性变量
2.我们可以先去除一个共线性变量
3.计算VIF(方差膨胀因子),采取相应措施
4.为了避免损失信息,我们可以使用一些正则化方法,比如,岭回归和lasso回归
A. 1
B. 2
C. 2和3
D. 2,3和4