为什么要引入并发编程
假设以下两个场景:
场景一:
一个网络爬虫,按顺序爬取花了一个小时,采用并发下载减少到20分钟
场景二:
一个APP应用,优化前每次打开页面需要花费3秒,采用异步并发提升到每次200毫秒
python中的并发编程
- 第一列为单线程串行,即CPU和IO是串起来执行的。IO的速度会严重制约CPU的运算速度
- 第二列为多线程并发,即当前线程遇到IO,释放CPU,可以提高CPU的运行效率
- 第三列为多进程并行,即使用的是多个CPU,然后进行计算
- 第四列为多机器并行,即使的的是多个机器同时计算同一个任务。
Python 对并发编程的支持
Python 有多种方法来支持并发编程,包括多线程、多进程、异步I/O和协程等。
多线程
Python 的threading 模块提供了多线程编程的支持,它允许创建并发执行的线程,从而实现程序的并发性。
多进程
Python 的 multiprocessing模块提供了多进程编程的支持,它允许创建多个进程来同时执行不同的任务,从而实现程序的并发性。
异步 I/O
Python 3.4 引入了asyncio模块,它提供了异步 I/O 编程的支持,使得程序可以在等待 I/O 操作时进行其他任务的处理,从而提高程序的并发性能。
协程
Python的greenlet模块和gevent模块提供了协程编程的支持,它们允许在同一个线程中运行多个协程,从而实现程序的并发性。
这些并发编程方法在不同的场景下有各自的优缺点,开发者需要根据具体的需求和情况来选择合适的方法。
线程通信方式
线程通信的主要方式有共享变量、消息传递和同步机制。
- 共享变量:多个线程共享同一份数据,需要考虑数据的访问和修改问题,如线程安全等。
- 消息传递:多个线程通过传递消息进行通信,常用的实现方式是消息队列。
- 同步机制:多个线程之间需要协调和同步,以避免出现数据不一致或者死锁等问题。常见的同步机制有锁、条件变量、信号量等。
Python 提供了多种并发编程的方式,如多线程、多进程、协程等。在多线程编程中,Python 的 threading 模块提供了对线程的支持,并且还提供了一些同步机制,如 Lock、RLock、Semaphore、Condition 等。
- 使用Lock对资源加锁,防止冲突访问
- 使用Queue实现不同线程/进程之间的数据通信,实现生产者-消费者模式
- 使用线程池Pool/进程池Pool,简化线程/进程的任务提交、等待结束、获取结果
- 使用subprocess启动外部程序的进程,并进行输入输出交互
总结
Python是一门广泛应用于多种领域的高级编程语言,其内置了丰富的库和工具,支持多种编程范式,包括并发编程。Python提供了多种并发编程的方法,包括线程、进程、协程等。Python的并发编程支持使其在处理大规模数据和高并发访问时具有良好的性能和可扩展性,使得Python成为了许多领域中首选的编程语言之一。