2021.06.20 技術シェア
【技术浅谈】数据分析—Pandas常用操作合集(2)

图片

前言


在进行数据分析的时候,需要对Dataframe里的数据进行添加、删除、选取、合并、比较等等操作,与其在需要的时候去查资料,不如花点时间掌握常用操作或者总结常用方法作为一个查询手册,这样能大大加快写代码的速度。


 

数据的条件查询


数据的条件查询主要有以下几种方法:


1.使用.loc方法查询;


2.使用.query()函数查询;


3.使用lambda表达式查询等方法。


其中.loc方法和.query()函数查询最为常用,而.query()可以以简洁优雅的方式进行条件查询,非常实用。


三种条件查询的其使用方法如下:


图片


 

列表的排序(sort_values,reindex, reset_index, set_index)


列表的排序主要有sort_values (), reindex(), reset_index(), set_index()四种方法。


sort_values ()用于对列的值进行排序;reindex()用于改变行索引和列索引;reset_index()用于从0开始对行索引进行重新排序;set_index()用于设置索引,可以设置单索引和复合索引。


具体使用方法如下:


图片


 

列表的拼接(concat,merge,join和append)


Pandas提供了concat,merge,join和append四种方法用于dataframe的拼接,其区别如下:


图片


四种列表拼接函数的使用方法如下:


图片



其他常用操作


图片


本章总结了pandas中常用的数据条件查询,列表的排序方法(sort_values,reindex, reset_index, set_index),列表的合并方法(concat,merge,join,append)。


我们只给出了常用的使用方法,如果想要了解列表的合并方法的详细参数和更加详细的用法,可以参考以下文章。


https://blog.csdn.net/weixin_42782150/article/details/89546357


 


在第一章和第二章中,我们已经总结了pandas中列表的常用操作,下一章中我们会介绍数据分析中matplotlib中常用的画图方法,包括散点图,折线图,柱状图和饼状图等的常用画法。


 


图片