Python并发编程的艺术:掌握线程、进程与协程的同步技巧

本文涉及的产品
实时数仓Hologres,5000CU*H 100GB 3个月
实时计算 Flink 版,1000CU*H 3个月
智能开放搜索 OpenSearch行业算法版,1GB 20LCU 1个月
简介: 并发编程在Python中涵盖线程、进程和协程,用于优化IO操作和响应速度。`threading`模块支持线程,`multiprocessing`处理进程,而`asyncio`则用于协程。线程通过Lock和Condition Objects同步,进程使用Queue和Pipe通信。协程利用异步事件循环避免上下文切换。了解并发模型及同步技术是提升Python应用性能的关键。

并发编程是现代软件开发中的重要组成部分,尤其在处理大量IO操作、提升应用响应速度和资源利用率方面发挥着关键作用。Python,作为一门广泛应用于科学计算、Web开发、数据分析等多个领域的高级编程语言,提供了多种并发编程模型,包括线程、进程以及更高级的协程。本文将深入探讨这三种并发模型,特别是它们的同步技巧,通过理论讲解与实战代码案例相结合,帮助读者掌握Python并发编程的艺术。

1. 并发编程基础

并发是指程序在一段时间内同时处理多个任务的能力。这并不意味着所有的任务都在同一时刻执行(这在单核处理器上是不可能的),而是指通过时间切片、多处理器或异步IO等方式,让多个任务看似同时进行。并发提高了资源利用率,使得程序能够更高效地处理任务。

1.1 并发与并行的区别

  • 并发:指任务在宏观上同时进行,微观上可能交替执行。
  • 并行:指任务在微观上同时执行,通常需要多核处理器支持。

2. Python中的线程

线程是操作系统能够进行调度的最小执行单位。在Python中,可以通过threading模块创建和管理线程。

2.1 创建线程

import threading
import time

def thread_function(name):
    print(f"Thread {name}: starting")
    time.sleep(2)
    print(f"Thread {name}: finishing")

if __name__ == "__main__":
    threads = list()
    for index in range(3):
        thread = threading.Thread(target=thread_function, args=(index,))
        threads.append(thread)
        thread.start()

    for thread in threads:
        thread.join()
    print("Main thread finished")

2.2 同步:Locks与Condition Objects

Locks

为了避免多个线程同时修改共享资源引发的数据不一致性,可以使用Lock

import threading

counter = 0
lock = threading.Lock()

def increment():
    global counter
    with lock:
        local_counter = counter
        local_counter += 1
        time.sleep(0.1)  # 模拟IO延迟
        counter = local_counter

threads = [threading.Thread(target=increment) for _ in range(100)]
for thread in threads:
    thread.start()
for thread in threads:
    thread.join()

print(f"Counter: {counter}")

Condition Objects

Condition对象允许一个或多个线程等待直到某个条件满足。

import threading

condition = threading.Condition()
workers = 5

def worker(num):
    with condition:
        while True:
            if workers > 0:
                print(f"Worker {num} starts working")
                workers -= 1
                condition.notify_all()
                break
            else:
                print(f"No work for worker {num}, waiting...")
                condition.wait()

threads = [threading.Thread(target=worker, args=(i,)) for i in range(10)]
for thread in threads:
    thread.start()
for thread in threads:
    thread.join()

3. Python中的进程

进程是资源分配的最小单位,拥有独立的内存空间。Python的multiprocessing模块提供了创建和管理进程的功能。

3.1 进程间通信

使用Queue

from multiprocessing import Process, Queue

def worker(q):
    item = q.get()
    print(f'Processing {item}')

if __name__ == '__main__':
    q = Queue()
    p = Process(target=worker, args=(q,))
    p.start()
    q.put(1)
    p.join()

使用Pipe

from multiprocessing import Process, Pipe

def sender(conn, msgs):
    for msg in msgs:
        conn.send(msg)
    conn.close()

def receiver(conn):
    while True:
        msg = conn.recv()
        if msg == 'END':
            break
        print(f"Received: {msg}")
    conn.close()

if __name__ == '__main__':
    parent_conn, child_conn = Pipe()
    p = Process(target=sender, args=(child_conn, ['Hello', 'World', 'END']))
    p.start()
    receiver(parent_conn)
    p.join()

4. Python中的协程

协程是一种轻量级的线程,通过在单线程内实现任务切换,避免了线程上下文切换的开销。Python通过asyncio模块支持协程。

4.1 异步编程基础

import asyncio

async def my_coroutine():
    print('Coroutine started.')
    await asyncio.sleep(1)
    print('Coroutine finished.')

async def main():
    task = asyncio.create_task(my_coroutine())
    await task

asyncio.run(main())

4.2 使用asyncio的Event Loop与Tasks

import asyncio

async def my_task(number):
    print(f'Task {number} started')
    await asyncio.sleep(1)
    print(f'Task {number} finished')

async def main():
    tasks = []
    for i in range(5):
        tasks.append(asyncio.create_task(my_task(i)))
    await asyncio.gather(*tasks)

asyncio.run(main())

4.3 异步共享状态与Locks

尽管协程在单线程内执行,但当涉及到共享状态时,依然需要同步机制。

import asyncio

async def increment(counter, lock):
    async with lock:
        global num
        num = counter.value + 1
        counter.value = num
        await asyncio.sleep(0.1)

async def main():
    counter = asyncio.Value('i', 0)
    lock = asyncio.Lock()
    tasks = [increment(counter, lock) for _ in range(100)]
    await asyncio.gather(*tasks)
    print(f"Final count: {counter.value}")

asyncio.run(main())

5. 总结

Python的并发编程模型为开发者提供了从线程、进程到协程的多样化选择,每种模型都有其适用场景。理解这些模型的核心概念、掌握它们之间的区别与同步技巧,是提升应用性能的关键。通过上述代码案例的学习,希望读者能够深入理解Python并发编程的艺术,灵活运用线程、进程与协程,有效地解决并发场景下的各种挑战。

目录
相关文章
|
4月前
|
人工智能 安全 调度
Python并发编程之线程同步详解
并发编程在Python中至关重要,线程同步确保多线程程序正确运行。本文详解线程同步机制,包括互斥锁、信号量、事件、条件变量和队列,探讨全局解释器锁(GIL)的影响及解决线程同步问题的最佳实践,如避免全局变量、使用线程安全数据结构、精细化锁的使用等。通过示例代码帮助开发者理解并提升多线程程序的性能与可靠性。
147 0
|
6月前
|
Java 开发者 Kotlin
华为仓颉语言初识:并发编程之线程的基本使用
本文详细介绍了仓颉语言中线程的基本使用,包括线程创建(通过`spawn`关键字)、线程名称设置、线程执行控制(使用`get`方法阻塞主线程以获取子线程结果)以及线程取消(通过`cancel()`方法)。文章还指出仓颉线程与Java等语言的差异,例如默认不提供线程名称。掌握这些内容有助于开发者高效处理并发任务,提升程序性能。
208 2
|
3月前
|
Go 调度 Python
Golang协程和Python协程用法上的那些“不一样”
本文对比了 Python 和 Go 语言中协程的区别,重点分析了调度机制和执行方式的不同。Go 的协程(goroutine)由运行时自动调度,启动后立即执行;而 Python 协程需通过 await 显式调度,依赖事件循环。文中通过代码示例展示了两种协程的实际运行效果。
167 7
|
2月前
|
数据采集 网络协议 API
协程+连接池:高并发Python爬虫的底层优化逻辑
协程+连接池:高并发Python爬虫的底层优化逻辑
|
3月前
|
传感器 数据采集 监控
Python生成器与迭代器:从内存优化到协程调度的深度实践
简介:本文深入解析Python迭代器与生成器的原理及应用,涵盖内存优化技巧、底层协议实现、生成器通信机制及异步编程场景。通过实例讲解如何高效处理大文件、构建数据流水线,并对比不同迭代方式的性能特点,助你编写低内存、高效率的Python代码。
167 0
|
4月前
|
数据采集 监控 调度
干货分享“用 多线程 爬取数据”:单线程 + 协程的效率反超 3 倍,这才是 Python 异步的正确打开方式
在 Python 爬虫中,多线程因 GIL 和切换开销效率低下,而协程通过用户态调度实现高并发,大幅提升爬取效率。本文详解协程原理、实战对比多线程性能,并提供最佳实践,助你掌握异步爬虫核心技术。
|
10月前
|
安全 Java 程序员
面试直击:并发编程三要素+线程安全全攻略!
并发编程三要素为原子性、可见性和有序性,确保多线程操作的一致性和安全性。Java 中通过 `synchronized`、`Lock`、`volatile`、原子类和线程安全集合等机制保障线程安全。掌握这些概念和工具,能有效解决并发问题,编写高效稳定的多线程程序。
267 11
|
9月前
|
数据采集 Java 数据处理
Python实用技巧:轻松驾驭多线程与多进程,加速任务执行
在Python编程中,多线程和多进程是提升程序效率的关键工具。多线程适用于I/O密集型任务,如文件读写、网络请求;多进程则适合CPU密集型任务,如科学计算、图像处理。本文详细介绍这两种并发编程方式的基本用法及应用场景,并通过实例代码展示如何使用threading、multiprocessing模块及线程池、进程池来优化程序性能。结合实际案例,帮助读者掌握并发编程技巧,提高程序执行速度和资源利用率。
415 0
|
12月前
|
缓存 Java 开发者
Java多线程并发编程:同步机制与实践应用
本文深入探讨Java多线程中的同步机制,分析了多线程并发带来的数据不一致等问题,详细介绍了`synchronized`关键字、`ReentrantLock`显式锁及`ReentrantReadWriteLock`读写锁的应用,结合代码示例展示了如何有效解决竞态条件,提升程序性能与稳定性。
806 6
|
12月前
|
设计模式 安全 Java
Java 多线程并发编程
Java多线程并发编程是指在Java程序中使用多个线程同时执行,以提高程序的运行效率和响应速度。通过合理管理和调度线程,可以充分利用多核处理器资源,实现高效的任务处理。本内容将介绍Java多线程的基础概念、实现方式及常见问题解决方法。
379 1

推荐镜像

更多