假设numpy、pandas库已经导入到Python环境,执行以下语句:>>>data=np.random.randn(1000,4)>>>df=pd.DataFrame(data,columns=list(‘ABCD’))则语句df.describe()[‘A’].mean()的作用是:
A. 计算并返回所有列的平均值
B. 计算并返回第二列的平均值
C. 计算并返回“A”列的平均值,结果为一个数组
D. 计算并返回“A”列的平均值,结果为一个数值
假设df为已经创建的DataFrame对象,且其列标识分别为“A”、“B”、“C”、“D”,则语句df.sort_values(by=[‘B’,’D’])的作用是:
A. 分别按B列、D列降序排序
B. 先按B列降序排序,B列相同时再按D列降序排序
C. 分别按B列、D列升序排序
D. 先按B列升序排序,B列相同时再按D列升序排序
创建pandas模块的Series对象时,以下不可以作为其数据参数的有:
A. list(‘abcd’)
B. range(4)
C. {'a': 1, 'b': 2, 'c': 3, 'd': 4}
D. tuple(1,2,3,4)
在进行数据预处理时,可以被pandas理解为缺失值的有:
A. Python内置的None
B. numpy模块提供的nan
C. pandas模块提供的NaN
D. 以上都是