最出名的降维算法是PCA和t-SNE。将这两个算法分别应用到数据「X」上,并得到数据集「X_projected_PCA」,「X_projected_tSNE」。下面哪一项对「X_projected_PCA」和「X_projected_tSNE」的描述是正确的?
A. X_projected_PCA在最近邻空间能得到解释
B. X_projected_tSNE在最近邻空间能得到解释
C. 两个都在最近邻空间能得到解释
D. 两个都不能在最近邻空间得到解释
查看答案
给定三个变量X,Y,Z。(X,Y)、(Y,Z)和(X,Z)的Pearson相关性系数分别为C1、C2和C3。现在X的所有值加2(即X+2),Y的全部值减2(即Y-2),Z保持不变。那么运算之后的(X,Y)、(Y,Z)和(X,Z)相关性系数分别为D1、D2和D3。现在试问D1、D2、D3和C1、C2、C3之间的关系是什么()
A. D1=C1,D2C3
B. D1=C1,D2>C2,D3>C3
C. D1=C1,D2>C2,D3D.D1=C1,D2
如果在一个高度非线性并且复杂的一些变量中,一个树模型可能比一般的回归模型效果更好.这是()
A. 对的
B. 错的
对于线性回归,我们应该有以下哪些假设()
1.找到离群点很重要,因为线性回归对离群点很敏感
2.线性回归要求所有变量必须符合正态分布
3.线性回归假设数据没有多重线性相关性
A. 1和2
B. 2和3
C. 1,2和3
D. 以上都不是
变量选择是用来选择最好的判别器子集,如果要考虑模型效率,我们应该做哪些变量选择的考虑()
1.多个变量其实有相同的用处
2.变量对于模型的解释有多大作用
3.特征携带的信息
4.交叉验证
A. 1和4
B. 1,2和3
C. 1,3和4
D. 以上所有