Python机器学习小技巧:GroupBy 和 Shift实现 Pandas分组错位-阿里云开发者社区

开发者社区> 北方的郎> 正文

Python机器学习小技巧:GroupBy 和 Shift实现 Pandas分组错位

简介:
+关注继续查看

使用Pandas进行数据操作的时候,有时需要分组将数据错位进行操作。

在数据分析中经常遇到需要分组使用a列的第n行数据与去b列的第n+1行数据进行对比或者计算的要求,下面是我使用pandas解决该问题的方法。首先要说的试这个问题可以通过操作Index来实现。不过Pandas针对这种情况已经提供了一种方法了,就是shift函数,用起来更加方便。shift函数定义如下:

pandas.DataFrame.shift

DataFrame.shift(self,periods=1,freq=None,axis=0,fill_value=None)[source]

Shift index by desired number of periods with an optional time freq.

When freq is not passed, shift the index without realigning the data. If freq is passed (in this case, the index must be date or datetime, or it will raise a NotImplementedError), the index will be increased using the periods and the freq.

比如我们要分析一个汽车的形式记录,需要对比每个位置的前一个点和后一个点的情况,如下代码即可:

df1['x_pre']=df1.groupby('CARID')['x'].shift(1)

df1['x_next']=df1.groupby('CARID')['x'].shift(-1)

df1['y_pre']=df1.groupby('CARID')['y'].shift(1)

df1['y_next']=df1.groupby('CARID')['y'].shift(-1)

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
python/pandas数据挖掘(十四)-groupby,聚合,分组级运算
groupby import pandas as pd df = pd.DataFrame({'key1':list('aabba'), 'key2'...
1716 0
python/pandas数据分析(十五)-聚合与分组运算实例
用特定于分组的值填充缺失值 用平均值去填充nan s=pd.Series(np.random.
885 0
Pandas学习
点击以下链接阅读原文 Pandas, Intro to Data Structures http://pandas.pydata.org/pandas-docs/stable/dsintro.
814 0
+关注
北方的郎
一个IT老兵,在这行摸爬滚打快20年了,很多工作都做过,也熟悉不少技术。现在对云计算,大数据以及机器学习很感兴趣。
44
文章
31
问答
文章排行榜
最热
最新
相关电子书
更多
《2021云上架构与运维峰会演讲合集》
立即下载
《零基础CSS入门教程》
立即下载
《零基础HTML入门教程》
立即下载