关于信息增益和决策树分裂节点说法正确的是(___)
A. 纯度高的节点需要更多的信息去区分
B. 信息增益对可取值数目较小的属性有所偏好
C. ID3 算法每次选择最大信息增益的属性作为当前的划分属性
D. 如果选择一个属性具有许多归类值, 那么这个信息增益是无偏差的
关于信息增益率说法正确的是(____)。
A. 信息增益率越大,表示使用该属性划分样本集所获得的“纯度提升”越小
B. 信息增益率对可取值数目较多的属性有所偏好
C4.5 算法直接选择信息增益率最大的候选划分属性
D. 以上说法都不对
关于基尼指数说法正确的是(____)。
A. “基尼值”反映了从数据集中随机抽取两个样本,其类别一致的概率
B. 基尼指数越小,数据集的纯度越高
CART 决策树采用“基尼指数”来选择划分属性
D. 以上说法都不对
决策树学习算法ID3对付“过拟合”的主要手段有(____)
A. 剪枝处理
B. 预剪枝
C. 后剪枝
D. 以上都不是