pandas 按某一列A排序,按B和C两列分组,选择分组后A列值最大的行

简介: pandas 按某一列A排序,按B和C两列分组,选择分组后A列值最大的行

pandas 按某一列A排序,按B和C两列分组,选择分组后A列值最大的行


一、需求

按 updateTime 列倒序排序,按 B 和 C 两列分组,分组后选择最后更新的时间的那一行,并将结果加上新索引。

二、代码

import pandas as pd
data = pd.read_csv('test.csv')
df = pd.DataFrame(data)
df = df.sort_values('updateTime', ascending=False).groupby(['B','C']).first().reset_index()

first() 函数代表选择第一行,如果要选取多行,可以使用 head() 函数: head(5)表示选择前五行。

如下例:

import pandas as pd
data = pd.read_csv('test.csv',header = 0)
df = pd.DataFrame(data)
# 按日期分组,分组后对 value 列从大到小排序,取每组前十行
df = df.groupby('date', group_keys=False).apply(lambda x: x.sort_values('value', ascending=False)).groupby('date').head(10).reset_index()

在不能直接使用sort_values() 函数时,使用 apply() 函数。关于这一点,在本人另一篇博客中有详细解释,参见:

https://blog.csdn.net/u011675334/article/details/105328857

相关文章
|
14天前
|
数据处理 Python
如何使用Python的Pandas库进行数据排序和排名
【4月更文挑战第22天】Pandas Python库提供数据排序和排名功能。使用`sort_values()`按列进行升序或降序排序,如`df.sort_values(by='A', ascending=False)`。`rank()`函数用于计算排名,如`df['A'].rank(ascending=False)`。多列操作可传入列名列表,如`df.sort_values(by=['A', 'B'], ascending=[True, False])`和分别对'A'、'B'列排名。
24 2
|
14天前
|
存储 Python
使用Pandas库对非数值型数据进行排序和排名
在Pandas中,支持对非数值型数据排序和排名。可按以下方法操作:1) 字符串排序,使用`sort_values()`,如`sorted_df = df.sort_values(by='Name', ascending=False)`进行降序排序;2) 日期排序,先用`to_datetime()`转换,再排序,如`sorted_df = df.sort_values(by='Date')`;3) 自定义排序,结合`argsort()`和自定义规则。
25 2
|
2月前
|
数据处理 Python
如何使用Python的Pandas库进行数据排序和排名?
Pandas在Python中提供数据排序和排名功能。使用`sort_values()`进行排序,如`df.sort_values(by='A', ascending=False)`进行降序排序;用`rank()`进行排名,如`df['A'].rank(ascending=False)`进行降序排名。多列操作可传入列名列表,如`df.sort_values(by=['A', 'B'], ascending=[True, False])`。
30 6
|
4天前
|
Python
使用Python pandas的sort_values()方法可按一个或多个列对DataFrame排序
使用Python pandas的sort_values()方法可按一个或多个列对DataFrame排序。示例代码展示了如何按'Name'和'Age'列排序 DataFrame。先按'Name'排序,再按'Age'排序。sort_values()的by参数接受列名列表,ascending参数控制排序顺序(默认升序),inplace参数决定是否直接修改原DataFrame。
11 1
|
7天前
|
Python
Pandas进阶--map映射,分组聚合和透视pivot_table详解
Pandas进阶--map映射,分组聚合和透视pivot_table详解
|
14天前
|
数据可视化 Python
如何在Pandas中对数据集进行多级分组并进行聚合计算?
在Pandas中进行多级分组与聚合计算的步骤包括导入库(如pandas和matplotlib),准备数据集,使用`groupby()`方法分组,应用聚合函数(如`sum()`、`mean()`)及可视化结果。
23 11
|
24天前
|
Python
pandas判断某列是否已按从小到大排序
其中,`is_monotonic_increasing`是pandas的一个方法,用于判断某列是否按从小到大排序。如果返回True,则表示该列已按从小到大排序,否则表示没有排序或排序不是从小到大。 买CN2云服务器,免备案服务器,高防服务器,就选蓝易云。百度搜索:蓝易云
21 1
|
2月前
|
存储 Python
如何使用Pandas库对非数值型数据进行排序和排名?
在Pandas中,非数值型数据如字符串、日期和自定义类别也可排序。使用`sort_values()`对字符串列进行升序或降序排序,如`df.sort_values(by='Name', ascending=False)`。日期数据先用`pd.to_datetime()`转换,再排序。自定义排序可通过`argsort()`结合映射规则实现,例如根据预定义类别顺序排序。
20 7
|
2月前
|
数据可视化 Python
如何使用Python的Pandas库进行数据分组和聚合操作?
【2月更文挑战第29天】【2月更文挑战第105篇】如何使用Python的Pandas库进行数据分组和聚合操作?
|
5月前
|
数据挖掘 索引 Python
Pandas 高级教程——高级分组与聚合
Pandas 高级教程——高级分组与聚合
103 7