变量选择是用来选择最好的判别器子集,如果要考虑模型效率,我们应该做哪些变量选择的考虑()
1.多个变量其实有相同的用处
2.变量对于模型的解释有多大作用
3.特征携带的信息
4.交叉验证
A. 1和4
B. 1,2和3
C. 1,3和4
D. 以上所有
查看答案
对于线性回归模型,包括附加变量在内,以下的可能正确的是()
1.R-Squared和AdjustedR-squared都是递增的
2.R-Squared是常量的,AdjustedR-squared是递增的
3.R-Squared是递减的,AdjustedR-squared也是递减的
4.R-Squared是递减的,AdjustedR-squared是递增的
A. 1和2
B. 1和3
C. 2和4
D. 以上都不是
下面对集成学习模型中的弱学习者描述错误的是()
A. 他们经常不会过拟合
B. 他们通常带有高偏差,所以其并不能解决复杂学习问题
C. 他们通常会过拟合
当我们构造线性模型时,我们注意变量间的相关性.在相关矩阵中搜索相关系数时,如果我们发现3对变量的相关系数是(Var1和Var2,Var2和Var3,Var3和Var1)是-0.98,0.45,1.23.我们可以得出什么结论:1.Var1和Var2是非常相关的2.因为Var1和Var2是非常相关的,我们可以去除其中一个3.Var3和Var1的1.23相关系数是不可能的()
A. 1and3
B. 1and2
C. 1,2and3
D. 1
对于下面三个模型的训练情况,下面说法正确的是()
1.第一张图的训练错误与其余两张图相比,是最大的
2.最后一张图的训练效果最好,因为训练错误最小
3.第二张图比第一和第三张图鲁棒性更强,是三个里面表现最好的模型
4.第三张图相对前两张图过拟合了
5.三个图表现一样,因为我们还没有测试数据集
A. 1和3
B. 1和3
C. 1,3和4
D. 5