如果在大型数据集上训练决策树。为了花费更少的时间来训练这个模型,下列哪种做法是正确的(_____)
A. 增加树的深度
B. 增加学习率
C. 减小树的深度
D. 减少树的数量
查看答案
我们想要训练一个机器学习模型,样本数量有100万个,特征维度是5000,面对如此大数据,如何有效地训练模型(____)
A. 对训练集随机采样,在随机采样的数据上建立模型
B. 尝试使用在线机器学习算法
C. 使用 PCA 算法减少特征维度
D. 以上都不对
下列说法不正确的是(_____)
A. 分类和回归属于有监督学习
B. 聚类属于无监督学习
C. 监督学习和无监督学习的区别在于监督学习的数据中,每一个数据样本都包含一个准确的输出值
D. 有监督学习和无监督学习过程中使用的训练样本都没有标记信息
关于监督机器学习,下列说法正确的是(_____ )
A. 一个精度高的机器学习模型通常是一个好的分类器
B. 学习模型越复杂,测试错误率会越低
C. 学习模型越复杂,训练错误率会越低
D. 以上说法都不对
小明通过操作手柄上的摇杆使小车绕椭圆形赛道行驶了10圈,并采集了行驶过程中小车正前方赛道图像及其转弯角度数据。为实现小车在赛道内竞速竞赛,他设计了一个10层卷积神经网络模型,但他不晓得如何将这10 圈的图像和转弯角度数据划分训练集和测试集。请问下列数据划分说法最佳的是(______)。
A. 随机选70%数据为训练集,余下为测试集
B. 随机选7圈数据为训练集,余下为测试集
C. 每圈随机取70%为训练集,余下为测试集
D. 每圈每帧取70%为训练集,余下为测试集