下列有关机器学习项目实施过程说法错误的是()
A. 合适的机器学习算法在分析前一般很难确定
B. 这是数据分析师的工作,不需要用户参加
C. 很多机器学习工具的使用遵循一定的机器学习步骤
D. 机器学习项目实施过程并不简单
下列关于特征编码的叙述错误的是( )
A. One-Hot编码适用于离散特征的取值之间没有大小顺序的情况
B. 若离散特征的取值有大小顺序,那么就可以使用数值与特征的映射来对特征进行编码
C. One-Hot编码解决了分类器不好处理属性数据的问题,在一定程度上也起到了扩充特征的作用
D. One-Hot编码将有k个不同取值的特征转化为k-1个特征
箱线图是检测离群值的方法,下面关于箱线图的说法不正确的是( )
A. 箱外的两条线(胡须)分别延伸到最小和最大非异常点
B. 四分位距IQR = 1.5(Q3-Q1),其中Q3为上四分位数, Q1为下四分位数
C. 箱中高于上边缘和低于下边缘的值为离群点
D. 箱线图中框的上边线表示上四分位数,框的下边线表示下四分位数
下列关于数据标准化的说法不正确的是( )
A. 数据经过Min-Max标准化后的取值范围为[0,1]
B. 数据经过Z-Score标准化后的取值范围为[0,1]
C. Z-Score标准化方法适用于特征的最大值或最小值未知,样本分布非常离散的情况
D. 标准化可以去除数据特征之间存在的量纲问题