题目描述
小明维护着一个程序员论坛。现在他收集了一份"点赞"日志,日志共有 NN 行。其中每一行的格式是:
ts\ idtsid
表示在 tsts 时刻编号 idid 的帖子收到一个"赞"。
现在小明想统计有哪些帖子曾经是"热帖"。如果一个帖子曾在任意一个长度为 DD 的时间段内收到不少于 KK 个赞,小明就认为这个帖子曾是"热帖"。
具体来说,如果存在某个时刻 T 满足该帖在 [T,T+D)[T,T+D) 这段时间内(注意是左闭右开区间)收到不少于 KK 个赞,该帖就曾是"热帖"。
给定日志,请你帮助小明统计出所有曾是"热帖"的帖子编号。
输入描述
第一行包含三个整数 N,D,KN,D,K。
以下 N 行每行一条日志,包含两个整数 ts 和 id。
其中,1 \leq K \leq N \leq 10^5, 0 \leq ts \leq 10^5,0 \leq id \leq 10^51≤K≤N≤105,0≤ts≤105,0≤id≤105。
输出描述
按从小到大的顺序输出热帖 idid。每个 idid 一行。
样例输入
样例输出
思路:
构建一个二维列表m,存储每个id点赞的时间,set() 函数创建一个无序不重复元素集post来存储id。对帖子的id排序,之后遍历每个帖子,把每个帖子被点赞的时间排序。
对帖子的被点赞时间进行遍历,计算出td为帖子被点赞的时间加上时间段D,利用bisect_left()函数的特性,通过bisect_left(m[idd],td)-i,我们可以判断出时间窗口内的点赞数,再做出判断即可
代码:
1. from bisect import bisect_left 2. maxn=int(1e5+50) 3. n,d,k=map(int,input().split()) 4. m=[[] for _ in range(maxn)] 5. post=set() 6. for _ in range(n): 7. ts,idd=map(int,input().split()) 8. post.add(idd) #添加id,后续遍历id时使用 9. m[idd].append(ts) #读每个帖子的赞的时间 10. post = sorted(post) #对帖子id排序 11. for idd in post: #检查每个帖子 12. m[idd]=sorted(m[idd]) #把某个帖子的ts排序 13. for i in range(len(m[idd])): #统计这个帖子是不是热帖 14. td = m[idd][i]+d #算出了当前点赞时间加上区间后的时间 15. #我们之前对m[idd]进行过排序,通过bisect_left()-i 16. #可以得出这个区间内有多少赞 17. if(bisect_left(m[idd],td)-i >= k): 18. print(idd) 19. break