摄影:产品经理一家小酒馆
有时候,我们想实现一个非常简单的定时功能,例如让一个程序每天早上8点调用某个函数。但我们又不想安装任何第三方库,也不会使用 crontab 或者任务计划功能,就想使用纯 Python 来实现。
可能有同学会这样写代码:
import time import datetime def run(): print('我是需要被每天调用的函数') def schedule(): target_time = datetime.time(8, 0, 0) today = datetime.date.today() target_date = today + datetime.timedelta(days=1) target_datetime = datetime.datetime.combine(target_date, target_time) now = datetime.datetime.now() delta = (target_datetime - now).total_seconds() time.sleep(delta) run() while True: time.sleep(24 * 3600) run() if __name__ == '__main__': schedule()
这段程序,首先计算出现在距离明天早上8点相差的秒数。睡这么多秒以后,第一次运行目标函数。然后进入一个死循环,每隔86400秒,程序调用一次 run 函数。
这个程序初看起来,似乎没有什么问题。但如果你每天观察它的运行时间,你会发现随着时间的推移,时间会越来越不准确。
这是因为,run 函数不是一瞬间就运行完成的。它运行也会消耗时间。假设程序第一次运行 run 函数的时候,确实刚刚好是8:00,run 函数运行了2秒。那么,程序睡眠86400秒以后,时间实际上是8:00:02.从第二天开始,每天晚2秒钟。一个月就会晚一分钟。
但实际上,我们如果付出一点点微不足道的代价,我们就可以防止这种误差的发生,并且程序代码会变得更简单:
import time import datetime def run(): print('我是需要被每天调用的函数') def schedule(): last_run = None while True: now = datetime.datetime.now() if now.strftime('%H:%M') == '08:00' and last_run != now.date(): run() last_run = now.date() time.sleep(1) if __name__ == '__main__': schedule()
程序在一个死循环中,每秒做一次检查,如果当前的时分正好是08:00,并且上一次运行不是今天,那么就调用 run 函数,并把上一次运行的时间设置为今天。否则,就睡眠1秒钟。
这样做,相当于每秒都会校对时间,从而避免了长时间运行导致的时间误差。虽然看起来这个死循环会非常消耗 CPU,但只要你算一下,实际上它只不过每天循环86400次而已。这个次数并不多。
但无论如何,专业的事情应该交由专业的工具来做。time.sleep用来设置周期性的时间间隔可以,但它实际上不适合用来做定时任务。
因为一个支持定时任务的库,例如 Python 的schedule
或者APScheduler
,他们在确保定时时间准确上,做了很多工作。还有一些库甚至用到了时间轮
这样的数据结构来确保时间的准确性。这不是我们简单用两三行 Python 代码就能完成的。
总结
如果能用 crontab 或者任务计划,那么这是最优选择。其次,使用 Python 专用的定时模块。最次,才是使用 time.sleep 来实现。如果不得不用 time.sleep,那么应该尽量缩短检查的间隔,避免长时间睡眠。