下列哪一种情况被称为过学习现象( )。
A. 在训练集上A优于B,在测试集上A也优于B
B. 在训练集上A优于B,在测试集上B优于A
C. 相对于分类数据集,决策树过于简单
D. 在训练集上决策树的误差很小
特征向量维度太多时,可以使用()方法来解决。
A. 直接删除
B. 无需处理
C. 特征选择
D. 选用不同模型
下列关于C4.5算法的描述不正确的是( )。
A. C4.5算法与ID3算法的总体思路是类似的
B. C4.5算法使用信息增益做为选择属性的度量标准
C4.5算法使用信息增益率做为选择属性的度量标准
D. 信息增益相同的属性,SplitInformation值越大,信息增益率越小
有两个箱子,第一个4个黑球1个白球,第二个3个黑球2个白球,现在任取一箱,再从箱子取出一个球,则取到白球的概率是()。
A. 3/10
B. 2/5
C. 3/5
D. 1/10