假设已经创建DataFrame对象df,且其列标识分别为“A”、“B”、“C”、“D”,共4列,则以下语句中能够同时访问C列、D列所有数据的是:
A. df.iloc[:,[2,3]]
B. df.iloc[:,2:3]
C. df[['C','D']]
D. df.loc[:,['C','D']]
查看答案
使用如下语句,创建DataFrame对象df:>>>data=[[4,5,6], [4,5,6], [4,5,6]]>>>df=pd.DataFrame(data,columns=list(‘ABC’))则可以将df中值为5的数据修改为10的语句是:
A. df[df.values==5]=10
B. df[‘B’]=10
C. df.replace(5,10,inplace=True)
D. df.loc[:,’B’]=10
若DataFrame对象df中存在重复数据,以下说法不正确的是:
A. 执行df. drop_duplicates()语句,将真正删除df中原有的重复数据
B. 使用df. drop_duplicates()方法仅可以删除重复的行数据
C. 使用df. drop_duplicates()方法将删除所有重复的数据
D. 使用df. drop_duplicates()方法可以删除指定列的全部重复数据
在进行数据处理时,很多的数据来源于不同格式的文件。使用pandas库可以读取的文件格式包括:
A. Excel格式文件
B. CSV格式文件
C. XML格式文件
D. HTML格式文件
以下属于图表基本组成的有:
A. 坐标轴
B. 绘图区
C. 图例
D. 图表标题