题目内容

以下关于drop_duplicates函数的说法中错误的是( )

A. 仅对DataFrame和Series类型的数据有效
B. 仅支持单一特征的数据去重
C. 数据重复时默认保留第一个数据
D. 该函数不会改变原始数据排列

查看答案
更多问题

以下关于缺失值检测的说法中,正确的是( )

A. null和notmull可以对缺失值进行处理
B. dropna方法既可以删除观测记录,亦可以删除特征
C. fillna方法中用来替换缺失值的值只能是数据框
D. pandas库中的interpolate模块包含了多种插值方法

以下关于异常值检测的说法中错误的是( )

A. 3σ原则利用了统计学中小概率事件的原理
B. 使用箱线图方法时要求数据服从或近似服从正态分布
C. 基于聚类的方法可以进行离群点检测
D. 基于分类的方法可以进行离群点检测

以下关于pandas数据预处理说法正确的是( )

A. pandas 没有做哑变量的函数
B. 在不导入其他库的情况下,仅仅使用pandas就可实现聚类分析离散化
C. pandas可以实现所有的数据预处理操作
D. cut函数默认情况下做的是等宽法离散化

下面描述属于广播机制的是( )

A. 让所有的输入数组都向其中shape最长的数组看齐,shape中不足的部分通过在前面加1补齐
B. 输出数组的shape是输入数组shape的各个轴上的最大值
C. 如果输入数组的某个轴和输出数组的对应轴的长度相同或者其长度为1,则这个数组能够用来计算,否则出错
D. 当输入数组的某个轴的长度为1时,沿着此轴运算时都用此轴上的第一组值

答案查题题库