Pandas时间索引DataFrame按时差分组-问答-阿里云开发者社区-阿里云

开发者社区> 问答> 正文

Pandas时间索引DataFrame按时差分组

2020-03-24 20:35:57 146 1

我有一个时间索引的DataFrame看起来像这样:

>>> df
                             A
index
2019-07-13 13:01:27.100      1
2019-07-13 13:01:27.674      2
2019-07-13 13:01:28.233      4
2019-07-13 13:01:28.534      1
2019-07-13 13:01:29.005      6
2019-07-13 13:01:29.732      7
2019-07-13 13:01:35.353      1
2019-07-13 13:01:35.547      9
2019-07-13 13:01:36.125      2
2019-07-13 13:01:36.626      3
2019-07-13 13:01:37.046      4
2019-07-13 13:01:37.734      7
2019-07-13 13:01:43.156      4
2019-07-13 13:01:43.523      6
2019-07-13 13:01:44.291      2
2019-07-13 13:01:44.784      5
2019-07-13 13:01:50.046      3
2019-07-13 13:01:50.563      8
2019-07-13 13:01:51.912      5

我希望有一个分组,其中所包含的数据点相隔不超过5秒。例如,第一组从13:01:27.100到13:01:29.732,第二组从13:01:35.353到13:01:37.734,依此类推...

是否有针对大型数据集的快速方法?

问题来源:stackoverflow

取消 提交回答
全部回答(1)
  • is大龙
    2020-03-24 20:36:04

    通常是在diffgroupby的帮助下完成的:

    df['group'] = df.index.to_series().diff().gt('5sec').cumsum()
    

    输出:

                             A  group
    index                            
    2019-07-13 13:01:27.100  1      0
    2019-07-13 13:01:27.674  2      0
    2019-07-13 13:01:28.233  4      0
    2019-07-13 13:01:28.534  1      0
    2019-07-13 13:01:29.005  6      0
    2019-07-13 13:01:29.732  7      0
    2019-07-13 13:01:35.353  1      1
    2019-07-13 13:01:35.547  9      1
    2019-07-13 13:01:36.125  2      1
    2019-07-13 13:01:36.626  3      1
    2019-07-13 13:01:37.046  4      1
    2019-07-13 13:01:37.734  7      1
    2019-07-13 13:01:43.156  4      2
    2019-07-13 13:01:43.523  6      2
    2019-07-13 13:01:44.291  2      2
    2019-07-13 13:01:44.784  5      2
    2019-07-13 13:01:50.046  3      3
    2019-07-13 13:01:50.563  8      3
    2019-07-13 13:01:51.912  5      3
    

    回答来源:stackoverflow

    0 0
相关问答

54

回答

阿里云已停止对MySQL5.1的版本维护,快快快升级版本吧

rds-pd 2014-11-12 16:21:57 62188浏览量 回答数 54

38

回答

干货分享:DBA专家门诊一期:索引与sql优化问题汇总

xiaofanqie 2014-12-25 15:13:38 92099浏览量 回答数 38

8

回答

OceanBase 使用动画(持续更新)

mq4096 2019-02-20 17:16:36 337043浏览量 回答数 8

36

回答

SQL Server优化案例分享【精品问答集锦】

管理贝贝 2016-08-25 10:14:03 45535浏览量 回答数 36

27

回答

阿里云开源软件镜像站点上线啦!!

qilu 2014-01-06 18:14:06 96114浏览量 回答数 27

11

回答

【精品问答合集】MongoDB热门问答

李博 bluemind 2019-05-29 16:50:19 121354浏览量 回答数 11

31

回答

【入门教程系列】Linux系统建站完整教程(适用于新手初级站长)

wujian8150 2011-09-26 16:53:51 49098浏览量 回答数 31

11

回答

速戳 | 20位阿里出题专家-备战阿里必不可少的题目

Runt 2020-04-15 10:54:04 57630浏览量 回答数 11

19

回答

云数据库RDS MySQL版【问答合集】

我是管理员 2018-08-03 15:10:37 48183浏览量 回答数 19

1

回答

阿里云各种产品使用索引(更新2015.08.17)

梦丫头 2015-07-18 12:19:16 71677浏览量 回答数 1
+关注
0
文章
1138
问答
问答排行榜
最热
最新
相关电子书
更多
《2021云上架构与运维峰会演讲合集》
立即下载
《零基础CSS入门教程》
立即下载
《零基础HTML入门教程》
立即下载