3.3 数据排序
创建数据
import numpy as np import pandas as pd df = pd.DataFrame(data = np.random.randint(0, 30, size = (30, 3)), index = list('qwertyuioijhgfcasdcvbnerfghjcf'), columns = ['Python', 'Keras', 'Pytorch']) df
是一个看起来乱糟糟的数据,我们排序介绍三种方法
3.3.1 根据索引行列名进行排序
# 按行名排序,升序 display(df.sort_index(axis = 0, ascending = True)) # 按列名排序,降序 display(df.sort_index(axis = 1, ascending = False))
当然,按照索引行列名进行排序是不常用的,我们一般都是对数据进行排序
3.3.2 属性值排序
# 按Python属性值排序 display(df.sort_values(by = ['Python'])) # 先按Python,再按Keras排序 display(df.sort_values(by = ['Python', 'Keras']))
3.3.3 返回属性n大或者n小的值
# 根据属性Keras排序,返回最大3个数据 display(df.nlargest(3, columns = 'Keras')) # 根据属性Python排序,返回最小5个数据 display(df.nsmallest(5, columns = 'Python'))