题目内容

假设numpy、pandas库已经导入到Python环境,执行以下语句:>>>data=np.random.randn(1000,4)>>>df=pd.DataFrame(data,columns=list(‘ABCD’))则语句df.describe()[‘A’].mean()的作用是:

A. 计算并返回所有列的平均值
B. 计算并返回第二列的平均值
C. 计算并返回“A”列的平均值,结果为一个数组
D. 计算并返回“A”列的平均值,结果为一个数值

查看答案
更多问题

假设df为已经创建的DataFrame对象,且其列标识分别为“A”、“B”、“C”、“D”,则语句df.sort_values(by=[‘B’,’D’])的作用是:

A. 分别按B列、D列降序排序
B. 先按B列降序排序,B列相同时再按D列降序排序
C. 分别按B列、D列升序排序
D. 先按B列升序排序,B列相同时再按D列升序排序

创建pandas模块的Series对象时,以下不可以作为其数据参数的有:

A. list(‘abcd’)
B. range(4)
C. {'a': 1, 'b': 2, 'c': 3, 'd': 4}
D. tuple(1,2,3,4)

在进行数据预处理时,可以被pandas理解为缺失值的有:

A. Python内置的None
B. numpy模块提供的nan
C. pandas模块提供的NaN
D. 以上都是

假设已经创建DataFrame对象df,且其列标识分别为“A”、“B”、“C”、“D”,共4列,则以下语句中能够同时访问C列、D列所有数据的是:

A. df.iloc[:,[2,3]]
B. df.iloc[:,2:3]
C. df[['C','D']]
D. df.loc[:,['C','D']]

答案查题题库