我们建立一个5000个特征,100万数据的机器学习模型.我们怎么有效地应对这样的大数据训练()
A. 我们随机抽取一些样本,在这些少量样本之上训练
B. 我们可以试用在线机器学习算法
C. 我们应用PCA算法降维,减少特征数
D. B和C
E. A和B
F. 以上所有
查看答案
我们想要减少数据集中的特征数,即降维.选择以下适合的方案()
1.使用前向特征选择方法
2.使用后向特征排除方法
3.我们先把所有特征都使用,去训练一个模型,得到测试集上的表现.然后我们去掉一个特征,再去训练,用交叉验证看看测试集上的表现.如果表现比原来还要好,我们可以去除这个特征.
4.查看相关性表,去除相关性最高的一些特征
A. 1和2
B. 2,3和4
C. 1,2和4
D. All
以下哪些算法,可以用神经网络去构造()1.KNN2.线性回归3.对数几率回归
A. 1和2
B. 2和3
C. 1,2和3
D. 以上都不是
训练完SVM模型后,不是支持向量的那些样本我们可以丢掉,也可以继续分类()
A. 正确
B. 错误
请选择下面可以应用隐马尔科夫(HMM)模型的选项()
A. 基因序列数据集
B. 电影浏览数据集
C. 股票市场数据集
D. 所有以上