在随机森林里,你生成了几百颗树(T1, T2 …..Tn),然后对这些树的结果进行综合,下面关于随机森林中每颗树的说法正确的是?( )
A. 每棵树是通过数据集的子集和特征的子集构建的
B. 每棵树是通过所有的特征构建的
C. 每棵树是通过所有的数据构建的
D. 以上都不对
查看答案
以下关于集成学习特性说法错误的是( )。
A. 集成学习需要各个弱分类器之间具备一定的差异性
B. 弱分类器的错误率不能高于0.5
C. 集成多个线性分类器也无法解决非线性分类问题
D. 当训练数据集较大时,可分为多个子集,分别进行训练分类器再合成
以下关于随机森林(Random Forest)说法正确的是( )。
A. 随机森林由若干决策树组成,决策树之间存在关联性
B. 随机森林学习过程分为选择样本、选择特征、构建决策树、投票四个部分
C. 随机森林算法容易陷入过拟合
D. 随机森林构建决策树时,是无放回的选取训练数据
以下关于AdaBoost算法说法正确的是( )。
AdaBoost使用的损失函数是指数函数
B. 在训练过程中,若某个样本点已经被准确分类,则在构造下一个训练集时,该样本的权重会下降
C. 在投票时,分类误差小的弱分类器权重较小
D. 以上说法都不对
以下关于GBDT算法说法错误的是( )。
A. GBDT是由多棵回归树组成
B. GBDT泛化能力较强
C. GBDT使用的是放回采样
D. GBDT需要使用剪枝操作