Pandas 按照两列分组后只选排序第一名
1、问题背景
每日有多条信息,即 updateTime 栏每天有多条,现需要按照国家、日期分组,只保留最后更新的一条数据。
2、代码
import pandas as pd data = pd.read_csv('test.csv',header = 0) df = pd.DataFrame(data) df = df.sort_values('updateTime', ascending=False).groupby(['countryName','date']).first().reset_index()
以上,问题解决~