一日一技:为什么不建议使用 time.sleep 实现定时功能?

简介: 一日一技:为什么不建议使用 time.sleep 实现定时功能?

摄影:产品经理一家小酒馆

有时候,我们想实现一个非常简单的定时功能,例如让一个程序每天早上8点调用某个函数。但我们又不想安装任何第三方库,也不会使用 crontab 或者任务计划功能,就想使用纯 Python 来实现。

可能有同学会这样写代码:

import time
import datetime
def run():
    print('我是需要被每天调用的函数')
def schedule():
    target_time = datetime.time(8, 0, 0)
    today = datetime.date.today()
    target_date = today + datetime.timedelta(days=1)
    target_datetime = datetime.datetime.combine(target_date, target_time)
    now = datetime.datetime.now()
    delta = (target_datetime - now).total_seconds()
    time.sleep(delta)
    run()
    while True:
        time.sleep(24 * 3600)
        run()
if __name__ == '__main__':
    schedule()

这段程序,首先计算出现在距离明天早上8点相差的秒数。睡这么多秒以后,第一次运行目标函数。然后进入一个死循环,每隔86400秒,程序调用一次 run 函数。

这个程序初看起来,似乎没有什么问题。但如果你每天观察它的运行时间,你会发现随着时间的推移,时间会越来越不准确。

这是因为,run 函数不是一瞬间就运行完成的。它运行也会消耗时间。假设程序第一次运行 run 函数的时候,确实刚刚好是8:00,run 函数运行了2秒。那么,程序睡眠86400秒以后,时间实际上是8:00:02.从第二天开始,每天晚2秒钟。一个月就会晚一分钟。

但实际上,我们如果付出一点点微不足道的代价,我们就可以防止这种误差的发生,并且程序代码会变得更简单:

import time
import datetime
def run():
    print('我是需要被每天调用的函数')
def schedule():
    last_run = None
    while True:
        now = datetime.datetime.now()
        if now.strftime('%H:%M') == '08:00' and last_run != now.date():
            run()
            last_run = now.date()
        time.sleep(1)
if __name__ == '__main__':
    schedule()

程序在一个死循环中,每秒做一次检查,如果当前的时分正好是08:00,并且上一次运行不是今天,那么就调用 run 函数,并把上一次运行的时间设置为今天。否则,就睡眠1秒钟。

这样做,相当于每秒都会校对时间,从而避免了长时间运行导致的时间误差。虽然看起来这个死循环会非常消耗 CPU,但只要你算一下,实际上它只不过每天循环86400次而已。这个次数并不多。

但无论如何,专业的事情应该交由专业的工具来做。time.sleep用来设置周期性的时间间隔可以,但它实际上不适合用来做定时任务。

因为一个支持定时任务的库,例如 Python 的schedule或者APScheduler,他们在确保定时时间准确上,做了很多工作。还有一些库甚至用到了时间轮这样的数据结构来确保时间的准确性。这不是我们简单用两三行 Python 代码就能完成的。

总结

如果能用 crontab 或者任务计划,那么这是最优选择。其次,使用 Python 专用的定时模块。最次,才是使用 time.sleep 来实现。如果不得不用 time.sleep,那么应该尽量缩短检查的间隔,避免长时间睡眠。

目录
相关文章
|
Linux
Linux下使用ls查看文件颜色全部为白色的解决方法,以及Linux中文件颜色介绍
Linux下使用ls查看文件颜色全部为白色的解决方法,以及Linux中文件颜色介绍
867 3
|
消息中间件 数据挖掘 数据处理
Pandas高级数据处理:数据流式计算
在大数据时代,Pandas作为Python强大的数据分析库,在处理结构化数据方面表现出色。然而,面对海量数据时,如何实现高效的流式计算成为关键。本文探讨了Pandas在流式计算中的常见问题与挑战,如内存限制、性能瓶颈和数据一致性,并提供了详细的解决方案,包括使用`chunksize`分批读取、向量化操作及`dask`库等方法,帮助读者更好地应对大规模数据处理需求。
287 17
|
存储 Python
Python Logging 限制文件大小
Python Logging 限制文件大小
287 0
|
调度 Python
揭秘Python并发编程核心:深入理解协程与异步函数的工作原理
在Python异步编程领域,协程与异步函数成为处理并发任务的关键工具。协程(微线程)比操作系统线程更轻量级,通过`async def`定义并在遇到`await`表达式时暂停执行。异步函数利用`await`实现任务间的切换。事件循环作为异步编程的核心,负责调度任务;`asyncio`库提供了事件循环的管理。Future对象则优雅地处理异步结果。掌握这些概念,可使代码更高效、简洁且易于维护。
320 1
|
人工智能 NoSQL Redis
如何将分布式锁性能提升100倍【含面试题】
如何将分布式锁性能提升100倍
780 0
|
数据采集 安全 测试技术
【专栏】阿里云RPA浏览器自动化插件是一款基于AI的创新工具
【4月更文挑战第29天】阿里云RPA浏览器自动化插件是一款基于AI的创新工具,能模拟浏览器操作,实现自动化业务流程,提升效率,降低成本。其特点包括强大的自动化能力、智能识别处理、灵活定制、稳定性能及安全保障。适用于数据采集、表单填写、网页测试、办公自动化和电商运营等场景,助力企业数字化转型。
1465 5
|
程序员 Linux C++
Python中的WinForms类桌面应用程序开发
Python中的WinForms类桌面应用程序开发
429 4
|
传感器 数据处理 Android开发
Camera基本代码架构
Camera基本代码架构