2021.06.13 技術シェア
【技术浅谈】数据分析—Pandas常用操作合集(1)

图片

前言


 


Pandas 是Python的一个数据分析包,它纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法,这是使Python成为强大而高效的数据分析环境的重要因素之一。本文将介绍Pandas基础和常用的操作,适合数据分析的初学者,供大家参考和交流。


在进行数据分析的时候,需要对Dataframe里的数据进行添加、删除、选取、合并、比较等等操作,与其在需要的时候去查资料,不如花点时间掌握常用操作,这样能大大加快写代码的速度;对于已经入门数据分析的朋友们,也可以查漏补缺,熟悉一下常用操作。


 

Pandas常用操作

1. 导入Pandas


图片


 

2. 数据的导入和保存


图片

 

3. 数据查看


图片


 

4. 数据选取


数据的选取一般有切片法,loc定位法和iloc定位法。.iloc()与.loc()的区别在于,loc是根据标签名选取,iloc是根据位置选取, 官方解释:


loc for label based indexing


iloc for positional indexing


数据选取按功能可以分为行选取,列选取和单元格选取,具体用法如下:


图片


 

总结一下:


 


(1)loc[ ]的用法,df.loc[A:B, ["C","D"]]表示:选取行标签为A~B,列名为C和D的数据。


(2)df.loc[ ]还可以用来赋值, 在给表格中的数据赋值时,不要用df[“column”][n]=value, 而要用df.loc[n,”A”]=value, 不然会出现warning的情况。


(3)选取数据时,返回值存在以下3种情况:


如果返回值包括单行多列或多行单列时,返回值为Series对象;


如果返回值包括多行多列时,返回值为DataFrame对象;


如果返回值仅为一个单元格(单行单列)时,返回值为基本数据类型。


 

5. 其他常用操作


图片


 


到这里,我们总结了Pandas中最常用的一些基本操作,包括数据的查看,选取,删除和其他常用操作。下一章中,我们会介绍里数据的比较,排序和Dataframe合并等操作。


 


#代码部分可以参照以下链接#


https://github.com/MENG-CHENRUI/Project/tree/master/Project5_tech_essay


 


图片