python 协程

简介: python 协程

python 协程

文章目录

1. 协程

协程 (coroutine),又称微线程,是一种用户级的轻量级线程。协程 拥有自己的寄存器上下文和栈。协程调度切换时,将寄存器上下文和栈保存到其他 地方,在切回来的时候,恢复先前保存的寄存器上下文和栈。因此协程能保留上一 次调用时的状态,每次过程重入时,就相当于进入上一次调用的状态。


在并发编程 中,协程与线程类似,每个协程表示一个执行单元,有自己的本地数据,与其他协 程共享全局数据和其他资源。协程需要用户自己来编写调度逻辑,对于CPU来说,协程其实是单线程,所以 CPU不用去考虑怎么调度、切换上下文,这就省去了CPU的切换开销,所以协程在一 定程度上又好于多线程。那么在Python中是如何实现协程的呢?


Python通过yield提供了对协程的基本支持,但是不完全,而使用第三方 gevent库是更好的选择,gevent提供了比较完善的协程支持。gevent是一个基于 协程的Python网络函数库,使用greenlet在libev事件循环顶部提供了一个有高级 别并发性的API。主要特性有以下几点:


·基于libev的快速事件循环,Linux上是epoll机制。

·基于greenlet的轻量级执行单元。

·API复用了Python标准库里的内容。

·支持SSL的协作式sockets。

·可通过线程池或c-ares实现DNS查询。

·通过monkey patching功能使得第三方模块变成协作式。

gevent对协程的支持,本质上是greenlet在实现切换工作。greenlet工作流 程如下:假如进行访问网络的IO操作时,出现阻塞,greenlet就显式切换到另一段 没有被阻塞的代码段执行,直到原先的阻塞状况消失以后,再自动切换回原来的代 码段继续处理。因此,greenlet是一种合理安排的串行方式。


由于IO操作非常耗时,经常使程序处于等待状态,有了gevent为我们自动切换 协程,就保证总有greenlet在运行,而不是等待IO,这就是协程一般比多线程效率 高的原因。由于切换是在IO操作时自动完成,所以gevent需要修改Python自带的一 些标准库,将一些常见的阻塞,如socket、select等地方实现协程跳转,这一过程 在启动时通过monkey patch完成。下面通过一个的例子来演示gevent的使用流 程,代码如下:

from gevent import monkey; monkey.patch_all()
import gevent
import urllib.request
def run_task(url):
  print('Visit --> %s' % url)
  try:
      response = urllib.request.urlopen(url)
      data = response.read()
      print('%d bytes received from %s.' % (len(data), url))
  except Exception as e:
      print(e)
if __name__=='__main__':
  urls = ['https://github.com/','https://www.python.org/','http://www.cnblogs.com/']
  greenlets = [gevent.spawn(run_task, url) for url in urls ]
  gevent.joinall(greenlets)

输出:

$ python coroutine1.py 
Visit --> https://github.com/
Visit --> https://www.python.org/
Visit --> http://www.cnblogs.com/
50895 bytes received from https://www.python.org/.
75936 bytes received from http://www.cnblogs.com/.
307979 bytes received from https://github.com/.

以上程序主要用了gevent中的spawn方法和joinall方法。spawn方法可以看做

是用来形成协程,joinall方法就是添加这些协程任务,并且启动运行。从运行结

果来看,3个网络操作是并发执行的,而且结束顺序不同,但其实只有一个线程。


gevent中还提供了对池的支持。当拥有动态数量的greenlet需要进行并发管理

(限制并发数)时,就可以使用池,这在处理大量的网络和IO操作时是非常需要

的。接下来使用gevent中pool对象,对上面的例子进行改写,程序如下:

from gevent import monkey
monkey.patch_all()
import urllib.request
from gevent.pool import Pool
def run_task(url):
  print('Visit --> %s' % url)
  try:
    response = urllib.request.urlopen(url)
    data = response.read()
    print('%d bytes received from %s.' % (len(data), url))
  except Exception as e:
    print(e)
  return('url:%s --->finish'% url)
if __name__=='__main__':
  pool = Pool(2)
  urls = ['https://github.com/','https://www.python.org/','http://www.cnblogs.com/']
  results = pool.map(run_task,urls)
  print(results)

输出信息:

$ python coroutine2.py 
Visit --> https://github.com/
Visit --> https://www.python.org/
50895 bytes received from https://www.python.org/.
Visit --> http://www.cnblogs.com/
307979 bytes received from https://github.com/.
76015 bytes received from http://www.cnblogs.com/.
['url:https://github.com/ --->finish', 'url:https://www.python.org/ --->finish', 'url:http://www.cnblogs.com/ --->finish']

通过运行结果可以看出,Pool对象确实对协程的并发数量进行了管理,先访问

了前两个网址,当其中一个任务完成时,才会执行第三个。


参考:


Python爬虫开发与项目实战

gevent调度流程解析

Python process, thread and coroutine

Difference between Multi-Processing, Multi-threading and Coroutine

Choosing between Python threads vs coroutines vs processes

python process thread coroutine

Combining Coroutines with Threads and Processes


相关文章
|
1月前
|
网络协议 调度 开发者
python中gevent基于协程的并发编程模型详细介绍
`gevent`是Python的第三方库,提供基于协程的并发模型,适用于I/O密集型任务的高效异步编程。其核心是协程调度器,在单线程中轮流执行多个协程,通过非阻塞I/O实现高并发。主要特点包括协程调度、事件循环的I/O模型、同步/异步编程支持及易用性。示例代码展示了一个使用`gevent`实现的异步TCP服务器,当客户端连接时,服务器以协程方式处理请求,实现非阻塞通信。
15 0
|
1月前
|
数据采集 数据库 C++
python并发编程:并发编程中是选择多线程呢?还是多进程呢?还是多协程呢?
python并发编程:并发编程中是选择多线程呢?还是多进程呢?还是多协程呢?
22 0
|
2天前
|
调度 Python
探索Python中的异步编程:从回调到协程
本文将介绍Python中的异步编程技术,从最初的回调函数到现代的协程模型。通过对比传统的同步编程方式和异步编程的优劣势,我们深入探讨了Python中异步编程的实现原理,以及如何利用asyncio库和async/await关键字来构建高效的异步应用程序。最后,我们还将讨论一些异步编程的最佳实践和常见问题的解决方法。
|
5天前
|
Python
Python中的协程:异步编程的利器
Python中的协程:异步编程的利器
14 1
|
12天前
|
缓存 安全 Linux
深入探索Python中的协程
深入探索Python中的协程
|
18天前
|
调度 数据库 Python
探索Python中的异步编程:从回调到协程
本文将探讨Python中异步编程的演变过程,从最初的回调函数到现代的协程机制。我们将深入了解异步编程的原理、优势以及如何使用Python的asyncio库来实现高效的异步程序。通过本文,读者将了解到异步编程的基本概念、常见的应用场景,以及如何利用Python的强大功能来提升程序的性能和可维护性。
|
19天前
|
关系型数据库 数据处理 数据库
Python中的异步编程与协程详解
Python作为一门流行的编程语言,其异步编程与协程机制在近年来备受关注。本文将深入探讨Python中的异步编程概念、asyncio模块的运用以及协程的原理和使用方法,帮助读者更好地理解和应用异步编程技术。
|
22天前
|
Python
探索Python中的异步编程:从回调到协程
传统的Python编程模式中,使用回调函数处理异步任务是常见的做法。然而,随着Python 3.5引入的asyncio模块,异步编程有了更加优雅和高效的解决方案:协程。本文将深入探讨Python中异步编程的发展历程,从回调函数到协程的演变,并介绍如何使用asyncio模块来实现异步任务,提高程序的性能和响应速度。
|
24天前
|
调度 Python
Python多线程、多进程与协程面试题解析
【4月更文挑战第14天】Python并发编程涉及多线程、多进程和协程。面试中,对这些概念的理解和应用是评估候选人的重要标准。本文介绍了它们的基础知识、常见问题和应对策略。多线程在同一进程中并发执行,多进程通过进程间通信实现并发,协程则使用`asyncio`进行轻量级线程控制。面试常遇到的问题包括并发并行混淆、GIL影响多线程性能、进程间通信不当和协程异步IO理解不清。要掌握并发模型,需明确其适用场景,理解GIL、进程间通信和协程调度机制。
32 0
|
1月前
|
存储 Python
python使用gevent库来创建协程,并通过协程实现并发执行不同的任务
```markdown 这段Python代码利用`gevent`库实现并发执行协程。定义了两个打印函数`f1`和`f2`,分别输出"csdn"和"yyds"。代码首先创建列表`t_l`,并启动5个`f1`协程,将其加入列表并等待所有协程完成。随后,同样方式启动5个`f2`协程,存入`t1_l`列表并等待执行完毕。整体展示了`gevent`的协程并发操作。 ```
13 1