Python asyncio之协程学习总结 1

简介: Python asyncio之协程学习总结

实践环境

Python 3.6.2

什么是协程

协程(Coroutine)一种电脑程序组件,该程序组件通过允许暂停和恢复任务,为非抢占式多任务生成子程序。协程也可以简单理解为协作的程序,通过协同多任务处理实现并发的函数的变种(一种可以支持中断的函数)。

下面,我们通过日常生活场景为例,对什么是协程进行说明。

假设A某在家每天都要做3件事:洗衣服(使用洗衣机),蒸饭(使用电饭煲),扫地(使用扫地机器人),这三样电器在完成任务后都会发出不一样响声来告诉A某事情已经完成。

这里,暂且假设A某智商有问题,每次都是严格按顺序做这三件事:先洗完衣服,再把饭蒸好,最后才开始扫地。

接下来,我们用一段简单的代码来模拟上述整个过程,并记录整个过程的耗时,其中使用了3个简单的普通函数,分别模拟上述3件事情,如下:

import time
from datetime import datetime
def do_washing():
    print(datetime.now(), ':开始洗衣服')
    time.sleep(3)  # 洗衣服 # 用程序休眠来模拟过程,且别计较时间大小
    print(datetime.now(), ':通知A某衣服洗好了') 
def steame_rice():
    print(datetime.now(), ':开始蒸饭')
    time.sleep(5)  # 蒸饭
    print(datetime.now(), ':通知A某饭蒸好了')
def do_clearing():
    print(datetime.now(), ':开始扫地')
    time.sleep(2)  # 扫地
    print(datetime.now(), ':通知A某地扫完了')
if __name__ == '__main__':
    startTime = time.time()
    do_washing()
    steame_rice()
    do_clearing()
    endTime = time.time()
    print("扫地+蒸饭+洗衣服总耗时: ", endTime - startTime)

程序输出:

2023-04-09 23:33:50.001204 :开始洗衣服
2023-04-09 23:33:53.002765 :衣服洗好了
2023-04-09 23:33:53.002765 :开始蒸饭
2023-04-09 23:33:58.013337 :通知A某饭蒸好了
2023-04-09 23:33:58.013337 :通知A某开始扫地
2023-04-09 23:34:00.024784 :通知A某地扫完了
扫地+蒸饭+洗衣服总耗时:  10.023579835891724

直到有一天,A某的朋友来他家做客,体验到他的“高效”办事效率后,建议他不用等每件事情都做完才做下一件事情。A某听后,虚心采纳,并告诉自己要开始培养新的习惯。

第二天开始呢,A某开始改变自己,把衣服扔洗衣机,并启动机洗程序后,就去淘米蒸饭了,等电饭煲开始蒸饭后,就去清扫地板了。

接下来,我们对上述代码进行稍微修改,以便模拟上述过程,并记录整个过程的耗时,如下:

import time
from datetime import datetime
import asyncio
async def do_washing():
    print(datetime.now(),':开始洗衣服')
    await asyncio.sleep(3)
    print(datetime.now(),':通知A某衣服洗好了')
async def do_clearing():
    print(datetime.now(), ':开始扫地')
    await asyncio.sleep(5)
    print(datetime.now(), ':通知A某地扫完了')
async def steame_rice():
    print(datetime.now(), ':开始蒸饭')
    await asyncio.sleep(2)
    print(datetime.now(), ':通知A某饭蒸好了')
tasks = [
    do_washing(),
    steame_rice(),
    do_clearing()
]
if __name__ == '__main__':
    loop = asyncio.get_event_loop()
    start_time = time.time()
    loop.run_until_complete(asyncio.wait(tasks))
    loop.close()
    end_time = time.time()
    print("扫地+蒸饭+洗衣服总耗时: ", end_time - start_time)

程序输出:

2023-04-09 23:35:17.422790 :开始扫地
2023-04-09 23:35:17.422790 :开始蒸饭
2023-04-09 23:35:17.422790 :开始洗衣服
2023-04-09 23:35:19.427500 :通知A某饭蒸好了
2023-04-09 23:35:20.427813 :通知A某衣服洗好了
2023-04-09 23:35:22.429780 :通知A某地扫完了
扫地+蒸饭+洗衣服总耗时:  5.0069899559021

不得不夸A某进步真大,相比之前,这次耗时减少了近一半。

以上这段代码就是协程的简单实现,充分体现了协程的3个特点:

  1. 多任务并行:A某同时完成了3项任务--分别代表3个协程。
  2. 异步任务:3项任务中,没有一项是需要A某在一旁一直看着直到做完的,每项任务开启后,A某都可以离开去做别的任务。
  3. 协作式(非抢占式):每项任务能否“占用”A某,取决于A某是否正被其它任务“占用”,即是否有任务主动“让出”A某,不是靠“抢占”,更像是协商。

有了线程为啥还要协程?

协程是用户视角的一种抽象,操作系统并没有这个概念,其主要思想是在用户态实现调度算法,用少量线程完成大量任务的调度。

相对线程而言,协程具备以下优势:

  • 减少内存占用
    协程的创建成本远小于线程,可以设计得很小,小到KB级别,大大降低内存占用。所以,内存资源有限的情况下,可以创建更多协程,从而实现更高的并发。
  • 减少上下文切换开销,节约CPU资源

如上图,线程之间的切换请求,由系统内核来实现,而协程之间的切换,则可由用户自由控制,即交由用户态的代码来完成,极大程度避免了系统内核级线程上下文切换造成的CPU资源浪费。具体实现思路如下:

  1. 尽量减少可执行的线程,这样切换次数必然会少
  2. 让线程尽可能的处于运行状态,而不是阻塞让出时间片

一个线程可以拥有多个协程,主要注意的是,一个线程内的多个协程却是串行的,无论CPU有多少个核,因为协程本质上还是一个函数,当一个协程运行时,其它协程必须挂起。实际开发过程中,可以使用协程在将一些耗时的IO操作异步化,例如写文件、耗时IO请求等来提升程序执行效率。

相关语法说明

接下来,就上面的例子,对协程相关语法进行说明。

async def do_washing()

使用async def语法定义协程函数do_washing

协程函数示例:

async def func(param1, param2):
    do_stuff()
    await some_coroutine()

注意:

  1. 使用async def语法定义的函数始终是协程函数,即使它们不包含waitasync关键字。
  2. 采用传统的函数调用方式,直接调用协程函数,函数不会被立即执行,会产生类似RuntimeWarning: coroutine 'xxxx协程函数' was never awaited的告警日志,并返回一个协程对象。仅运行事件循环时才会运行协程。
  3. await挂起当前协程以等待一个可等待(awaitable)对象--协程函数或者实现了__await__()的对象,直到可等待对象返回结果。可以将这个可等待对象,简单的理解为待执行的异步任务(一般是比较耗时的任务,比如开篇示例中用作比拟的煲饭)。注意:
  1. await只能在协程函数内部使用。
  2. 程序遇到await关键词时,会将程序控制权交给主程序,由主程序分配给其它协程。当可等待对象返回结果,并且此时程序控制权还被其它协程占用时,则被挂起的协程依旧无法继续往下运行,直到获取程序控制权。关于这个结论,可用下述示例代码进行验证:
from datetime import datetime
import asyncio
async def do_washing():
    print(datetime.now(),':开始洗衣服')
    await asyncio.sleep(0.5)
    for i in range(10000):
        if i % 4000 == 0:
            print('洗衣服')
    print(datetime.now(),':衣服洗好了')
async def do_cooking():
    print(datetime.now(), ':开始煲饭')
    for i in range(100000):
        if i%20000 == 0:
            print('煲饭')
    await asyncio.sleep(5)
    print(datetime.now(), ':饭煲好了')
tasks = [
    do_cooking(),
    do_washing()
]
if __name__ == '__main__':
    loop = asyncio.get_event_loop()
    loop.run_until_complete(asyncio.wait(tasks))
    loop.close()
  1. 输出:
2023-04-10 23:53:37.804727 :开始洗衣服
2023-04-10 23:53:37.804727 :开始煲饭
煲饭
煲饭
煲饭
煲饭
煲饭
洗衣服
洗衣服
洗衣服
2023-04-10 23:53:38.310586 :衣服洗好了
2023-04-10 23:53:42.811876 :饭煲好了
asyncio.sleep(2)

给定秒数后完成的协程--阻塞指定的秒数。sleep函数还可以指定result参数,协程完成时将该参数值返回给调用者(默认返回None),如下:

result = await asyncio.sleep(0.5, result='task done')
print(result) # 输出:task done

sleep总是会挂起当前任务,以允许其他任务运行。可以利用这个特性,将秒数设置为0,即asyncio.sleep(0),以便提供一个经优化的路径以允许其他任务运行。 这可供长时间运行的函数使用,避免调用该函数时阻塞事件循环。

asyncio.get_event_loop()

为当前上下文获取事件循环(event loop),返回一个实现了AbstractEventLoop接口的事件循环对象。如果没有为当前上下文设置任何事件循环,且当前策略没有指定创建一个事件循环,则抛出异常。必须返回非None值。

AbstractEventLoop.run_until_complete(asyncio.wait(tasks))

运行直到asyncio.wait(tasks)运行完成。返回asyncio.wait(tasks)的运行结果,或者抛出异常。

asyncio.run(coro, *, debug=False)

执行协程 coro 并返回结果。

此函数会运行传入的协程,负责管理 asyncio 事件循环,终结异步生成器,并关闭线程池。

当有其他 asyncio 事件循环在同一线程中运行时,此函数不能被调用。

如果debugTrue,事件循环将以调试模式运行。

此函数总是会创建一个新的事件循环并在结束时关闭之。它应当被用作 asyncio 程序的主入口点,理想情况下应当只被调用一次。

示例:

async def main():
    await asyncio.sleep(1)
    print('hello')
asyncio.run(main())

3.7 新版功能.

asyncio.wait(tasks)

具备完整参数列表的wait函数定义如下

asyncio.wait(fs, *, loop=None, timeout=None, return_when=ALL_COMPLETED)

并发地运行 fs可迭代对象中的可等待对象,并进入阻塞状态直到满足return_when参数所指定的条件(缺省参值为ALL_COMPLETED)。

注意,aws参数不能为空。

函数返回 Future 集合: (done, pending)

请注意,此函数不会引发 asyncio.TimeoutError。当超时发生时,未完成的 Future 将在指定秒数后被返回。

return_when 指定此函数应在何时返回,可选值如下:

  • FIRST_COMPLETED
    函数将在任意可等待对象结束或取消时返回。
  • FIRST_EXCEPTION
    函数将在任意可等待对象因引发异常而结束时返回。当没有引发任何异常时它就相当于ALL_COMPLETED
  • ALL_COMPLETED
    函数将在所有可等待对象结束或取消时返回。
目录
相关文章
|
21天前
|
Python 容器
Python学习的自我理解和想法(9)
这是我在B站跟随千锋教育学习Python的第9天,主要学习了赋值、浅拷贝和深拷贝的概念及其底层逻辑。由于开学时间紧张,内容较为简略,但希望能帮助理解这些重要概念。赋值是创建引用,浅拷贝创建新容器但元素仍引用原对象,深拷贝则创建完全独立的新对象。希望对大家有所帮助,欢迎讨论。
|
3天前
|
数据可视化 数据挖掘 大数据
1.1 学习Python操作Excel的必要性
学习Python操作Excel在当今数据驱动的商业环境中至关重要。Python能处理大规模数据集,突破Excel行数限制;提供丰富的库实现复杂数据分析和自动化任务,显著提高效率。掌握这项技能不仅能提升个人能力,还能为企业带来价值,减少人为错误,提高决策效率。推荐从基础语法、Excel操作库开始学习,逐步进阶到数据可视化和自动化报表系统。通过实际项目巩固知识,关注新技术,为职业发展奠定坚实基础。
|
12天前
|
Python
Python学习的自我理解和想法(10)
这是我在千锋教育B站课程学习Python的第10天笔记,主要学习了函数的相关知识。内容包括函数的定义、组成、命名、参数分类(必须参数、关键字参数、默认参数、不定长参数)及调用注意事项。由于开学时间有限,记录较为简略,望谅解。通过学习,我理解了函数可以封装常用功能,简化代码并便于维护。若有不当之处,欢迎指正。
|
23天前
|
存储 索引 Python
Python学习的自我理解和想法(6)
这是我在B站千锋教育学习Python的第6天笔记,主要学习了字典的使用方法,包括字典的基本概念、访问、修改、添加、删除元素,以及获取字典信息、遍历字典和合并字典等内容。开学后时间有限,内容较为简略,敬请谅解。
|
27天前
|
存储 程序员 Python
Python学习的自我理解和想法(2)
今日学习Python第二天,重点掌握字符串操作。内容涵盖字符串介绍、切片、长度统计、子串计数、大小写转换及查找位置等。通过B站黑马程序员课程跟随老师实践,非原创代码,旨在巩固基础知识与技能。
|
26天前
|
程序员 Python
Python学习的自我理解和想法(3)
这是学习Python第三天的内容总结,主要围绕字符串操作展开,包括字符串的提取、分割、合并、替换、判断、编码及格式化输出等,通过B站黑马程序员课程跟随老师实践,非原创代码。
|
23天前
|
Python
Python学习的自我理解和想法(7)
学的是b站的课程(千锋教育),跟老师写程序,不是自创的代码! 今天是学Python的第七天,学的内容是集合。开学了,时间不多,写得不多,见谅。
|
22天前
|
存储 安全 索引
Python学习的自我理解和想法(8)
这是我在B站千锋教育学习Python的第8天,主要内容是元组。元组是一种不可变的序列数据类型,用于存储一组有序的元素。本文介绍了元组的基本操作,包括创建、访问、合并、切片、遍历等,并总结了元组的主要特点,如不可变性、有序性和可作为字典的键。由于开学时间紧张,内容较为简略,望见谅。
|
23天前
|
存储 索引 Python
Python学习的自我理解和想法(4)
今天是学习Python的第四天,主要学习了列表。列表是一种可变序列类型,可以存储任意类型的元素,支持索引和切片操作,并且有丰富的内置方法。主要内容包括列表的入门、关键要点、遍历、合并、判断元素是否存在、切片、添加和删除元素等。通过这些知识点,可以更好地理解和应用列表这一强大的数据结构。
|
23天前
|
索引 Python
Python学习的自我理解和想法(5)
这是我在B站千锋教育学习Python的第五天笔记,主要内容包括列表的操作,如排序(`sort()`、``sorted()``)、翻转(`reverse()`)、获取长度(`len()`)、最大最小值(`max()`、``min()``)、索引(`index()`)、嵌套列表和列表生成(`range`、列表生成式)。通过这些操作,可以更高效地处理数据。希望对大家有所帮助!