题目内容

我们想要训练一个机器学习模型,样本数量有100万个,特征维度是5000,面对如此大数据,如何有效地训练模型(____)

A. 对训练集随机采样,在随机采样的数据上建立模型
B. 尝试使用在线机器学习算法
C. 使用 PCA 算法减少特征维度
D. 以上都不对

查看答案
更多问题

下列说法不正确的是(_____)

A. 分类和回归属于有监督学习
B. 聚类属于无监督学习
C. 监督学习和无监督学习的区别在于监督学习的数据中,每一个数据样本都包含一个准确的输出值
D. 有监督学习和无监督学习过程中使用的训练样本都没有标记信息

关于监督机器学习,下列说法正确的是(_____ )

A. 一个精度高的机器学习模型通常是一个好的分类器
B. 学习模型越复杂,测试错误率会越低
C. 学习模型越复杂,训练错误率会越低
D. 以上说法都不对

小明通过操作手柄上的摇杆使小车绕椭圆形赛道行驶了10圈,并采集了行驶过程中小车正前方赛道图像及其转弯角度数据。为实现小车在赛道内竞速竞赛,他设计了一个10层卷积神经网络模型,但他不晓得如何将这10 圈的图像和转弯角度数据划分训练集和测试集。请问下列数据划分说法最佳的是(______)。

A. 随机选70%数据为训练集,余下为测试集
B. 随机选7圈数据为训练集,余下为测试集
C. 每圈随机取70%为训练集,余下为测试集
D. 每圈每帧取70%为训练集,余下为测试集

在以下不同的场景中,使用的分析方法不正确的有(_____)。

A. 根据商家近一年经营及服务数据,用聚类算法判断出天猫商家在各自主营类目下所属的商家层级
B. 根据商家近几年的成交数据,用聚类算法拟合出用户未来一个月可能的消费金额公式
C. 用关联规则算法分析出购买了汽车坐垫的买家,是否适合推荐汽车脚垫
D. 根据用户最近购买商品信息,用决策树算法识别出淘宝买家可能是男还是女

答案查题题库