题目内容

以下关于缺失值检测的说法中,正确的是( )

A. null和notnull可以对缺失值进行处理
B. dropna方法既可以删除观测记录,亦可以删除特征
C. fillna方法中用来替换缺失值的值只能是数据库
D. pandas库中的interpolate模块包含了多种插值方法

查看答案
更多问题

以下关于异常值检测的说法中错误的是( )

A. 3σ原则利用了统计学中小概率事件的原理
B. 使用箱线图方法时要求数据服从或近似正太分布
C. 基于聚类的方法可以进行离群点检测
D. 基于分类的方法可以进行离群点检测

下列与标准化方法有关的说法错误的是( )

A. 离差标准化简单易懂,对最大值和最小值敏感度不高
B. 标准差标准化是最常用的标准化方法,又称零一均值标准化
C. 小数定标标准化实质上就是将数据按照一定的比例缩小
D. 多个特征的数据的K-Means聚类不需要对数据进行标准化

以下关于pandas数据预处理说法正确的是( )

A. pandas没有做哑变量的函数
B. cut函数默认情况下做的是等宽离散法
C. 在不导入其他库的情况下,仅仅使用pandas就可实现聚类分析离散化
D. pandas可以实现所有的数据预处理操作

使用如下方法规范如下数据组:200,300,400,600,1000(1).令min =0,max = 1,进行最小-最大规范化。(2).标准差标准化。(3).小数定标规范化

答案查题题库