蓝桥杯-日志统计-python

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介: 蓝桥杯-日志统计-python

题目描述


小明维护着一个程序员论坛。现在他收集了一份"点赞"日志,日志共有 NN 行。其中每一行的格式是:

ts\ idtsid

表示在 tsts 时刻编号 idid 的帖子收到一个"赞"。

现在小明想统计有哪些帖子曾经是"热帖"。如果一个帖子曾在任意一个长度为 DD 的时间段内收到不少于 KK 个赞,小明就认为这个帖子曾是"热帖"。

具体来说,如果存在某个时刻 T 满足该帖在 [T,T+D)[T,T+D) 这段时间内(注意是左闭右开区间)收到不少于 KK 个赞,该帖就曾是"热帖"。

给定日志,请你帮助小明统计出所有曾是"热帖"的帖子编号。


输入描述


第一行包含三个整数 N,D,KN,D,K

以下 N 行每行一条日志,包含两个整数 ts 和 id。

其中,1 \leq K \leq N \leq 10^5, 0 \leq ts \leq 10^5,0 \leq id \leq 10^51≤KN≤105,0≤ts≤105,0≤id≤105。


输出描述

按从小到大的顺序输出热帖 idid。每个 idid 一行。

样例输入

样例输出


思路:

构建一个二维列表m,存储每个id点赞的时间,set() 函数创建一个无序不重复元素集post来存储id。对帖子的id排序,之后遍历每个帖子,把每个帖子被点赞的时间排序。

对帖子的被点赞时间进行遍历,计算出td为帖子被点赞的时间加上时间段D,利用bisect_left()函数的特性,通过bisect_left(m[idd],td)-i,我们可以判断出时间窗口内的点赞数,再做出判断即可

bisect_left()资料d

代码:

1. from bisect import bisect_left
2. maxn=int(1e5+50)
3. n,d,k=map(int,input().split())
4. m=[[] for _ in range(maxn)]
5. post=set()
6. for _ in range(n):
7.     ts,idd=map(int,input().split())
8.     post.add(idd)      #添加id,后续遍历id时使用
9.     m[idd].append(ts)  #读每个帖子的赞的时间
10. post = sorted(post)    #对帖子id排序
11. for idd in post:       #检查每个帖子
12.     m[idd]=sorted(m[idd])  #把某个帖子的ts排序
13. for i in range(len(m[idd])):   #统计这个帖子是不是热帖
14.         td = m[idd][i]+d    #算出了当前点赞时间加上区间后的时间
15. #我们之前对m[idd]进行过排序,通过bisect_left()-i
16. #可以得出这个区间内有多少赞
17. if(bisect_left(m[idd],td)-i >= k):
18. print(idd)
19. break
相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
目录
相关文章
|
9天前
|
消息中间件 安全 Python
Python日志管理之Loguru
Python日志管理之Loguru
|
13天前
|
存储 程序员 开发者
Python|日志记录详解(1)
Python|日志记录详解(1)
27 0
Python|日志记录详解(1)
|
16天前
|
应用服务中间件 Linux nginx
在Linux中,如何统计ip访问情况?分析 nginx 访问日志?如何找出访问页面数量在前十位的ip?
在Linux中,如何统计ip访问情况?分析 nginx 访问日志?如何找出访问页面数量在前十位的ip?
|
16天前
|
消息中间件 JSON 自然语言处理
Python多进程日志以及分布式日志的实现方式
python日志模块logging支持多线程,但是在多进程下写入日志文件容易出现下面的问题: PermissionError: [WinError 32] 另一个程序正在使用此文件,进程无法访问。 也就是日志文件被占用的情况,原因是多个进程的文件handler对日志文件进行操作产生的。
|
23天前
|
数据采集 机器学习/深度学习 数据挖掘
如何使用 Python 统计分析 access 日志?
【8月更文挑战第14天】如何使用 Python 统计分析 access 日志?
33 0
如何使用 Python 统计分析 access 日志?
|
7天前
|
运维 监控 数据可视化
自动化运维:使用Python脚本进行日志分析
【8月更文挑战第31天】当系统出现问题时,我们通常会查看日志寻找线索。然而,手动阅读大量日志既费时又易出错。本文将介绍如何使用Python脚本自动分析日志,快速定位问题,提高运维效率。我们将从简单的日志读取开始,逐步深入到复杂的正则表达式匹配和错误统计,最后实现一个自动化的日志监控系统。无论你是新手还是老手,这篇文章都将为你提供有价值的参考。让我们一起探索如何用代码解放双手,让运维工作变得更加轻松吧!
|
1月前
|
存储 安全 Python
[python]使用标准库logging实现多进程安全的日志模块
[python]使用标准库logging实现多进程安全的日志模块
|
9天前
|
存储 搜索推荐 Python
Python|日志记录详解(2)
Python|日志记录详解(2)
10 0
|
2月前
|
数据可视化 数据挖掘 定位技术
Seaborn统计图表指南
【7月更文挑战第12天】Seaborn是Python的数据可视化库,基于Matplotlib,提供美观的统计图形。要开始使用,需通过`pip install seaborn`安装。它支持多种图表,如分布图、热图、聚类图、箱线图、小提琴图、联合分布图、点图、多变量分布图、线性关系图、树地图、时间序列图、分面绘图、分类数据图、分布对比图、多变量图和气泡图等,适用于复杂数据分析和展示。Seaborn简化了创建这些高级图表的过程,使数据可视化更直观和高效。
43 5
|
2月前
|
数据可视化 Python
时间序列分析是一种统计方法,用于分析随时间变化的数据序列。在金融、经济学、气象学等领域,时间序列分析被广泛用于预测未来趋势、检测异常值、理解周期性模式等。在Python中,`statsmodels`模块是一个强大的工具,用于执行各种时间序列分析任务。
时间序列分析是一种统计方法,用于分析随时间变化的数据序列。在金融、经济学、气象学等领域,时间序列分析被广泛用于预测未来趋势、检测异常值、理解周期性模式等。在Python中,`statsmodels`模块是一个强大的工具,用于执行各种时间序列分析任务。
下一篇
DDNS