有监督的学习和无监督的学习的根本区别在于( )。
A. 学习过程是否需要人工干预
B. 学习样本是否需要人工标记
C. 学习结果是否需要人工解释
D. 学习参数是否需要人工设置
下列哪一种情况被称为过学习现象( )。
A. 在训练集上A优于B,在测试集上A也优于B
B. 在训练集上A优于B,在测试集上B优于A
C. 相对于分类数据集,决策树过于简单
D. 在训练集上决策树的误差很小
特征向量维度太多时,可以使用()方法来解决。
A. 直接删除
B. 无需处理
C. 特征选择
D. 选用不同模型
下列关于C4.5算法的描述不正确的是( )。
A. C4.5算法与ID3算法的总体思路是类似的
B. C4.5算法使用信息增益做为选择属性的度量标准
C4.5算法使用信息增益率做为选择属性的度量标准
D. 信息增益相同的属性,SplitInformation值越大,信息增益率越小