全国服务热线:400-6136-679

位置:南京CDA数据分析师培训机构 > 学校动态 > 一文搞懂Pandas数据排序

一文搞懂Pandas数据排序

来源:南京CDA数据分析师培训机构时间:2022/12/9 14:40:37

  数据排序,是使用非常高频的功能,Pandas排序支持做的非常好,主要涉及两个函数,两种数据类型,组合起来四种情况。

  Series排序

  Series.sort_index 索引排序

  Series.sort_values 值引排序

  DataFrame排序

  DataFrame.sort_index 索引排序

  DataFrame.sort_values 值引排序

  一、Series的排序

  1、sort_index 索引排序

  定义一个Series用于实验

  s = Series([4,1,2,3],index=['d','a','c','b'])d 4 a 1 c 2 b 3

  对Series的索引进行升序排序,默认即可,无需使用其他参数

  s.sort_index() a 1 b 3 c 2 d 4

  对Series的索引进行降序排序,使用ascending=False参数

  s.sort_index(ascending=False) d 4 c 2 b 3 a 1

  2、sort_values 值引排序

  用 法:

  Series.sort_values(ascending=True, inplace=Flase)

  参数:

  ascending:默认为True升序排列,为Flase降序排序

  inplace:是否修改原始的Series

  对Series的值进行升序排序,默认即可,无需使用其他参数

  s.sort_values() a 1 c 2 b 3 d 4

  对Series的值进行降序排序,使用ascending=False参数

  s.sort_values(ascending=False) d 4 b 3 c 2 a 1

  二、 DataFrame的排序

  1、sort_index 索引排序

  DataFrame.sort_index(by=None,axis=0, level=None, ascending=True, inplace=False, kind='quicksort', na_position='last', sort_remaining=True)

  by:按照某一列或几列数据进行排序,但是by参数貌似不建议使用

  axis:0按照行名排序;1按照列名排序

  level:默认None,否则按照给定的level顺序排列---貌似并不是,文档

  ascending:默认True升序排列;False降序排列

  inplace:默认False,否则排序之后的数据直接替换原来的数据框

  kind:排序方法,{‘quicksort’, ‘mergesort’, ‘heapsort’}, default ‘quicksort’。似乎不用太关心。

  na_position:缺失值默认排在较后{"first","last"}

  构建数据集

  import numpy as np import pandas as pd data = pd.DataFrame( np.arange(9).reshape(3,3),                 index   = ["0","2","1"],                 columns = ["col_a","col_c","col_b"]) data col_a  col_c  col_b 0 0 1 2 2 3 4 5 1 6 7 8

  按行的索引升序进行排序,默认按行,升序

  data.sort_index() col_a col_c col_b 0 0 1 2 1 6 7 8 2 3 4 5

  按行的索引按降序进行排序

  data.sort_index(ascending=False) col_a col_c col_b 2 3 4 5 1 6 7 8 0 0 1 2

  按列升序的索引进行排序

  data.sort_index(axis=1) Out[10]: col_a col_c col_b 0 0 1 2 1 6 7 8 2 3 4 5

  2、sort_values 值引排序

  用 法:

  DataFrame.sort_values(by, axis=0, ascending=True, inplace=False,kind='quicksort', na_position='last')

  参 数:

  by:字符串或者List<字符串>;如果axis=0,那么by="列名";如果axis=1,那么by="行名"。

  axis:{0 or ‘index’, 1 or ‘columns’}, default 0,默认按照列排序,即纵向排序;如果为1,则是横向排序。

  ascending:布尔型,True则升序,如果by=['列名1','列名2'],则该参数可以是[True, False],即字段升序,第二个降序。

  inplace:布尔型,是否用排序后的数据框替换现有的数据框。

  kind:排序方法,{‘quicksort’, ‘mergesort’, ‘heapsort’}, default ‘quicksort’。似乎不用太关心。

  na_position:{‘first’, ‘last’}, default ‘last’,默认缺失值排在较后面。

  构建实验用数据

  data =pd.DataFrame([[2,3,12],[6,2,8],[9,5,7]], index=["0", "2", "1"], columns=["col_a", "col_c", "col_b"]) col_a col_c col_b 0 2 3 12 2 6 2 8 1 9 5 7

  按指定列的值大小顺序进行排序

  data.sort_values(by='col_c') col_a col_c col_b 2 6 2 8 0 2 3 12 1 9 5 7

  按多列进行排序

  data.sort_values(by=['col_b','col_a']) col_a col_c col_b 1 9 5 7 2 6 2 8 0 2 3 12

  先按col_b列降序,再按col_a列升序排序

  data.sort_values(by=['col_b','col_a'],axis=0,ascending=[False,True]) col_a col_c col_b 0 2 3 12 2 6 2 8 1 9 5 7

  按行升序排列

  data.sort_values(by='2',axis=1) col_c col_a col_b 0 3 2 12 2 2 6 8 1 5 9 7

  按 2行 升序,0行降排列

  data.sort_values(by=['2','0'],axis=1) col_c col_a col_b 0 3 2 12 2 2 6 8 1 5 9 7

领取试听课
每天限量名额,先到先得

尊重原创文章,转载请注明出处与链接:http://www.peixun360.com/6186/news/582414/违者必究! 以上就是南京CDA数据分析师培训机构 小编为您整理 一文搞懂Pandas数据排序的全部内容。

温馨提示:提交留言后老师会第一时间与您联系!热线电话:400-6136-679