“针对数值型数据”进行排序,可能是大家最喜欢,并且最熟悉的操作,然而如何“针对文本型数据”进行排序呢?这个问题,你可以在心里默想一下,应该如何操作。
有时候,如果一个小数据,直接在Excel中就可以完成该需求,那么如何用它进行操作呢?如果数据量很大,你想用Python实现这个目标,又应该怎么办呢?
基于此,黄同学今天就带着大家,分别在Excel和Python中,实现这两个需求。
数据介绍
有下面三列数据,针对“学历”这个字段,按照“大专”、“本科”、“研究生”进行排序。对于不同学历,又按照“基本工资”降序排列。
Excel实现
① 选中所有数据
② 点击开始 --> 排序和筛选 --> 自定义排序
③ 当出现如下界面,完成图中操作
④ 当出现如下界面,完成图中操作
⑤ 当出现如下界面,完成图中操作
⑥ 效果如下
Python实现
import pandas as pd # 自定义一个序列 x = [ '研究生', '本科', '大专'] # 读取数据 df = pd.read_excel("测试.xlsx") # 将“学历”列设置为category数据类型 df["学历"] = df["学历"].astype("category") # reorder_categories表示重新排序在x序列中指定的类别 # inplace=True表示对现有类别重新排序 df["学历"].cat.reorder_categories(x, inplace=True) # 然后采用多列排序的方式,对“学历”列按照指定x顺序排列,对“基本工资”列进行降序排列 df.sort_values(by=["学历","基本工资"], inplace=True,ascending=[True,False]) df
最终效果: