关于基尼指数说法正确的是(____)。
A. “基尼值”反映了从数据集中随机抽取两个样本,其类别一致的概率
B. 基尼指数越小,数据集的纯度越高
CART 决策树采用“基尼指数”来选择划分属性
D. 以上说法都不对
决策树学习算法ID3对付“过拟合”的主要手段有(____)
A. 剪枝处理
B. 预剪枝
C. 后剪枝
D. 以上都不是
关于预剪枝和后剪枝说法正确的是(____)。
A. 预剪枝能够降低过拟合风险,所以泛化性能往往优于后剪枝决策树
B. 后剪枝能够显著减少决策树的训练时间和测试时间开销
C. 预剪枝需要自顶向下对所有非叶节点逐一考察
D. 以上说法都不对
给定正例点 x1(3,3)、x2(4,3)和反例点 x3(1,1),其线性可分支持向量机为(____)。
A. f(x)=sign(x1+x2-1)
B. f(x)=sign(0.5x1+0.5x2-1)
C. f(x)=sign(x1+x2-2)
D. f(x)=sign(0.5x1+0.5x2-2)