Python并发编程的艺术:掌握线程、进程与协程的同步技巧

简介: 并发编程在Python中涵盖线程、进程和协程,用于优化IO操作和响应速度。`threading`模块支持线程,`multiprocessing`处理进程,而`asyncio`则用于协程。线程通过Lock和Condition Objects同步,进程使用Queue和Pipe通信。协程利用异步事件循环避免上下文切换。了解并发模型及同步技术是提升Python应用性能的关键。

并发编程是现代软件开发中的重要组成部分,尤其在处理大量IO操作、提升应用响应速度和资源利用率方面发挥着关键作用。Python,作为一门广泛应用于科学计算、Web开发、数据分析等多个领域的高级编程语言,提供了多种并发编程模型,包括线程、进程以及更高级的协程。本文将深入探讨这三种并发模型,特别是它们的同步技巧,通过理论讲解与实战代码案例相结合,帮助读者掌握Python并发编程的艺术。

1. 并发编程基础

并发是指程序在一段时间内同时处理多个任务的能力。这并不意味着所有的任务都在同一时刻执行(这在单核处理器上是不可能的),而是指通过时间切片、多处理器或异步IO等方式,让多个任务看似同时进行。并发提高了资源利用率,使得程序能够更高效地处理任务。

1.1 并发与并行的区别

  • 并发:指任务在宏观上同时进行,微观上可能交替执行。
  • 并行:指任务在微观上同时执行,通常需要多核处理器支持。

2. Python中的线程

线程是操作系统能够进行调度的最小执行单位。在Python中,可以通过threading模块创建和管理线程。

2.1 创建线程

import threading
import time

def thread_function(name):
    print(f"Thread {name}: starting")
    time.sleep(2)
    print(f"Thread {name}: finishing")

if __name__ == "__main__":
    threads = list()
    for index in range(3):
        thread = threading.Thread(target=thread_function, args=(index,))
        threads.append(thread)
        thread.start()

    for thread in threads:
        thread.join()
    print("Main thread finished")

2.2 同步:Locks与Condition Objects

Locks

为了避免多个线程同时修改共享资源引发的数据不一致性,可以使用Lock

import threading

counter = 0
lock = threading.Lock()

def increment():
    global counter
    with lock:
        local_counter = counter
        local_counter += 1
        time.sleep(0.1)  # 模拟IO延迟
        counter = local_counter

threads = [threading.Thread(target=increment) for _ in range(100)]
for thread in threads:
    thread.start()
for thread in threads:
    thread.join()

print(f"Counter: {counter}")

Condition Objects

Condition对象允许一个或多个线程等待直到某个条件满足。

import threading

condition = threading.Condition()
workers = 5

def worker(num):
    with condition:
        while True:
            if workers > 0:
                print(f"Worker {num} starts working")
                workers -= 1
                condition.notify_all()
                break
            else:
                print(f"No work for worker {num}, waiting...")
                condition.wait()

threads = [threading.Thread(target=worker, args=(i,)) for i in range(10)]
for thread in threads:
    thread.start()
for thread in threads:
    thread.join()

3. Python中的进程

进程是资源分配的最小单位,拥有独立的内存空间。Python的multiprocessing模块提供了创建和管理进程的功能。

3.1 进程间通信

使用Queue

from multiprocessing import Process, Queue

def worker(q):
    item = q.get()
    print(f'Processing {item}')

if __name__ == '__main__':
    q = Queue()
    p = Process(target=worker, args=(q,))
    p.start()
    q.put(1)
    p.join()

使用Pipe

from multiprocessing import Process, Pipe

def sender(conn, msgs):
    for msg in msgs:
        conn.send(msg)
    conn.close()

def receiver(conn):
    while True:
        msg = conn.recv()
        if msg == 'END':
            break
        print(f"Received: {msg}")
    conn.close()

if __name__ == '__main__':
    parent_conn, child_conn = Pipe()
    p = Process(target=sender, args=(child_conn, ['Hello', 'World', 'END']))
    p.start()
    receiver(parent_conn)
    p.join()

4. Python中的协程

协程是一种轻量级的线程,通过在单线程内实现任务切换,避免了线程上下文切换的开销。Python通过asyncio模块支持协程。

4.1 异步编程基础

import asyncio

async def my_coroutine():
    print('Coroutine started.')
    await asyncio.sleep(1)
    print('Coroutine finished.')

async def main():
    task = asyncio.create_task(my_coroutine())
    await task

asyncio.run(main())

4.2 使用asyncio的Event Loop与Tasks

import asyncio

async def my_task(number):
    print(f'Task {number} started')
    await asyncio.sleep(1)
    print(f'Task {number} finished')

async def main():
    tasks = []
    for i in range(5):
        tasks.append(asyncio.create_task(my_task(i)))
    await asyncio.gather(*tasks)

asyncio.run(main())

4.3 异步共享状态与Locks

尽管协程在单线程内执行,但当涉及到共享状态时,依然需要同步机制。

import asyncio

async def increment(counter, lock):
    async with lock:
        global num
        num = counter.value + 1
        counter.value = num
        await asyncio.sleep(0.1)

async def main():
    counter = asyncio.Value('i', 0)
    lock = asyncio.Lock()
    tasks = [increment(counter, lock) for _ in range(100)]
    await asyncio.gather(*tasks)
    print(f"Final count: {counter.value}")

asyncio.run(main())

5. 总结

Python的并发编程模型为开发者提供了从线程、进程到协程的多样化选择,每种模型都有其适用场景。理解这些模型的核心概念、掌握它们之间的区别与同步技巧,是提升应用性能的关键。通过上述代码案例的学习,希望读者能够深入理解Python并发编程的艺术,灵活运用线程、进程与协程,有效地解决并发场景下的各种挑战。

目录
相关文章
|
4月前
|
Java 测试技术 API
【JUC】(1)带你重新认识进程与线程!!让你深层次了解线程运行的睡眠与打断!!
JUC是什么?你可以说它就是研究Java方面的并发过程。本篇是JUC专栏的第一章!带你了解并行与并发、线程与程序、线程的启动与休眠、打断和等待!全是干货!快快快!
725 2
|
4月前
|
JSON 网络协议 安全
【Java】(10)进程与线程的关系、Tread类;讲解基本线程安全、网络编程内容;JSON序列化与反序列化
几乎所有的操作系统都支持进程的概念,进程是处于运行过程中的程序,并且具有一定的独立功能,进程是系统进行资源分配和调度的一个独立单位一般而言,进程包含如下三个特征。独立性动态性并发性。
255 1
|
4月前
|
JSON 网络协议 安全
【Java基础】(1)进程与线程的关系、Tread类;讲解基本线程安全、网络编程内容;JSON序列化与反序列化
几乎所有的操作系统都支持进程的概念,进程是处于运行过程中的程序,并且具有一定的独立功能,进程是系统进行资源分配和调度的一个独立单位一般而言,进程包含如下三个特征。独立性动态性并发性。
269 1
|
6月前
|
Go 调度 Python
Golang协程和Python协程用法上的那些“不一样”
本文对比了 Python 和 Go 语言中协程的区别,重点分析了调度机制和执行方式的不同。Go 的协程(goroutine)由运行时自动调度,启动后立即执行;而 Python 协程需通过 await 显式调度,依赖事件循环。文中通过代码示例展示了两种协程的实际运行效果。
287 7
|
5月前
|
数据采集 网络协议 API
协程+连接池:高并发Python爬虫的底层优化逻辑
协程+连接池:高并发Python爬虫的底层优化逻辑
|
7月前
|
数据采集 监控 调度
干货分享“用 多线程 爬取数据”:单线程 + 协程的效率反超 3 倍,这才是 Python 异步的正确打开方式
在 Python 爬虫中,多线程因 GIL 和切换开销效率低下,而协程通过用户态调度实现高并发,大幅提升爬取效率。本文详解协程原理、实战对比多线程性能,并提供最佳实践,助你掌握异步爬虫核心技术。
|
8月前
|
调度 开发工具 Android开发
【HarmonyOS Next】鸿蒙应用进程和线程详解
进程的定义: 进程是系统进行资源分配的基本单位,是操作系统结构的基础。 在鸿蒙系统中,一个应用下会有三类进程:
311 0
|
安全 Python
Python中的并发编程:多线程与多进程技术探究
本文将深入探讨Python中的并发编程技术,重点介绍多线程和多进程两种并发处理方式的原理、应用场景及优缺点,并结合实例分析如何在Python中实现并发编程,以提高程序的性能和效率。
|
数据采集 数据库 C++
python并发编程:并发编程中是选择多线程呢?还是多进程呢?还是多协程呢?
python并发编程:并发编程中是选择多线程呢?还是多进程呢?还是多协程呢?
489 0
|
并行计算 数据处理 调度
Python中的并发编程:探索多线程与多进程的奥秘####
本文深入探讨了Python中并发编程的两种主要方式——多线程与多进程,通过对比分析它们的工作原理、适用场景及性能差异,揭示了在不同应用需求下如何合理选择并发模型。文章首先简述了并发编程的基本概念,随后详细阐述了Python中多线程与多进程的实现机制,包括GIL(全局解释器锁)对多线程的影响以及多进程的独立内存空间特性。最后,通过实例演示了如何在Python项目中有效利用多线程和多进程提升程序性能。 ####