Python教程:深入理解 Python multiprocessing.Queue

简介: 在 Python 编程中,多进程编程是利用计算机多核心资源的重要手段之一。然而,多进程之间的通信却是一个相对复杂的问题。在本文中,我们将深入探讨 Python 中的 multiprocessing.Queue 模块,它为多进程间的通信提供了便捷而高效的解决方案。

 在 Python 编程中,多进程编程是利用计算机多核心资源的重要手段之一。然而,多进程之间的通信却是一个相对复杂的问题。在本文中,我们将深入探讨 Python 中的 multiprocessing.Queue 模块,它为多进程间的通信提供了便捷而高效的解决方案。

1. 简介


multiprocessing.Queue 是 Python 多进程编程中的一种进程间通信(IPC)机制,它允许多个进程之间安全地交换数据。与线程间通信相比,多进程间通信更加复杂,因为每个进程有自己独立的内存空间,无法直接共享数据。multiprocessing.Queue 解决了这个问题,提供了一个线程安全的队列,多个进程可以通过该队列传递数据。

2. 基本操作


2.1 创建队列

首先,我们需要导入 multiprocessing 模块,并创建一个 multiprocessing.Queue 对象:

import multiprocessing
queue = multiprocessing.Queue()

image.gif

2.2 向队列中放入数据

我们可以使用 put() 方法向队列中放入数据:

queue.put("Hello")
queue.put(123)

image.gif

2.3 从队列中获取数据

使用 get() 方法可以从队列中获取数据:

data1 = queue.get()
data2 = queue.get()

image.gif

2.4 判断队列是否为空

我们可以使用 empty() 方法来检查队列是否为空:

if not queue.empty():
    print("Queue is not empty")

image.gif

2.5 获取队列的大小

使用 qsize() 方法可以获取队列的大小:

size = queue.qsize()
print("Queue size:", size)

image.gif

3. 进程间通信示例:生产者-消费者模型


生产者-消费者模型是一种常见的并发编程模式,用于解决多个线程(或进程)之间共享数据的问题。它通常涉及两种类型的实体:生产者和消费者。

  1. 生产者:负责生成数据或者执行任务,并将其放入共享的缓冲区(队列)中。
  2. 消费者:负责从缓冲区中获取数据,并进行相应的处理或者消费。

生产者和消费者之间通过共享的缓冲区进行通信,这个缓冲区可以是一个队列、缓冲池等数据结构。生产者将数据放入缓冲区,而消费者则从缓冲区中取出数据进行处理,从而实现了生产者和消费者之间的解耦。

生产者-消费者模型的优点在于它可以有效地控制资源的利用率和任务的执行顺序,同时能够避免资源竞争和死锁等并发编程中常见的问题。

下面我们通过一个生产者-消费者模型的示例来演示 multiprocessing.Queue 的使用:

import multiprocessing
import time
def producer(queue):
    for i in range(5):
        item = f"Item {i}"
        queue.put(item)
        print(f"Produced {item}")
        time.sleep(1)
def consumer(queue):
    while True:
        item = queue.get()
        if item is None:
            break
        print(f"Consumed {item}")
        time.sleep(2)
if __name__ == "__main__":
    queue = multiprocessing.Queue()
    producer_process = multiprocessing.Process(target=producer, args=(queue,))
    consumer_process = multiprocessing.Process(target=consumer, args=(queue,))
    producer_process.start()
    consumer_process.start()
    producer_process.join()
    queue.put(None)
    consumer_process.join()

image.gif

在这个示例中,生产者进程负责向队列中放入数据,消费者进程负责从队列中获取数据并进行处理。通过 multiprocessing.Queue 实现了生产者和消费者之间的数据交换。

4.项目实战

以下是一个简单的实际爬虫项目场景的示例,其中使用了消息队列的生产者-消费者模型。在这个示例中,生产者负责从某个网站上爬取数据,并将数据放入消息队列中,而消费者则负责从队列中获取数据并进行处理。

import multiprocessing
import requests
from bs4 import BeautifulSoup
# 生产者函数:爬取网页内容,并将内容放入队列中
def producer(url, queue):
    response = requests.get(url)
    soup = BeautifulSoup(response.content, 'html.parser')
    # 假设需要爬取网页中的所有链接
    links = [link.get('href') for link in soup.find_all('a')]
    queue.put(links)
# 消费者函数:从队列中获取数据,并进行处理
def consumer(queue):
    while True:
        data = queue.get()
        if data == 'STOP':
            break
        for link in data:
            # 在这里可以进行进一步处理,比如访问链接、提取信息等
            print("Processing link:", link)
if __name__ == "__main__":
    # 创建消息队列
    queue = multiprocessing.Queue()
    # 启动生产者进程
    producer_process = multiprocessing.Process(target=producer, args=('http://example.com', queue))
    producer_process.start()
    # 启动消费者进程
    consumer_process = multiprocessing.Process(target=consumer, args=(queue,))
    consumer_process.start()
    # 等待生产者进程结束
    producer_process.join()
    # 向队列中放入结束信号
    queue.put('STOP')
    # 等待消费者进程结束
    consumer_process.join()

image.gif


目录
相关文章
|
16天前
|
数据采集 存储 JSON
Python网络爬虫教程概览
【6月更文挑战第21天】Python网络爬虫教程概览:安装requests和BeautifulSoup库抓取网页;使用HTTP GET请求获取HTML,解析标题;利用CSS选择器提取数据;处理异步内容可选Selenium;遵循爬虫策略,处理异常,尊重法律与网站规定。
24 1
|
1天前
|
数据采集 存储 JSON
Python 数据抓取教程:完结篇
Python 数据抓取教程:完结篇
11 1
|
3天前
|
达摩院 语音技术 异构计算
语音识别-免费开源的语音转文本软件Whisper的本地搭建详细教程,python版本是3.805,ffmpeg是专门处理音视频的,ffmpeg的下载链接,现在要求安装python和ffmpeg
语音识别-免费开源的语音转文本软件Whisper的本地搭建详细教程,python版本是3.805,ffmpeg是专门处理音视频的,ffmpeg的下载链接,现在要求安装python和ffmpeg
|
5天前
|
机器学习/深度学习 自然语言处理 TensorFlow
使用Python实现深度学习模型:序列建模与生成模型的博客教程
【7月更文挑战第2天】 使用Python实现深度学习模型:序列建模与生成模型的博客教程
14 1
|
6天前
|
机器学习/深度学习 数据采集 算法
Scikit-Learn基础教程
Scikit-Learn基础教程
12 2
|
10天前
|
Shell Python
Python教程:return和yield的区别
Python教程:return和yield的区别
7 0
Python教程:return和yield的区别
|
12天前
|
数据采集 存储 数据处理
使用Python获取1688商品详情的教程
使用Python爬取1688商品详情,涉及requests库抓取页面、BeautifulSoup解析HTML,安装必要库如requests、beautifulsoup4、pandas和lxml。通过get_page发送请求,BeautifulSoup解析提取如标题、价格等信息。数据处理后可使用pandas保存至CSV。注意遵守法律法规和网站政策,避免频繁请求。[代码片段及更多详情见链接
|
18天前
|
设计模式 测试技术 Python
Python教程:一文了解PageObject模式
PageObject 模式通常用于 Web 应用程序的 UI 自动化测试,尤其是在使用 Selenium、Appium 、Airtest等工具进行测试时非常有效。但是,它并不局限于特定类型的应用或工具,而是一种通用的设计模式,可以用于任何需要进行 UI 自动化测试的场景。
26 5
|
18天前
|
存储 数据安全/隐私保护 计算机视觉
Python教程:一文了解从Bytes到Bits的数据转换
在Python编程中,处理数据时经常需要在字节(bytes)和位(bits)之间进行转换。这种转换在网络通信、数据加密、图像处理等领域尤为常见。本文将详细介绍如何在Python中进行字节与位之间的转换,并提供一个实用的功能:如何在指定的位位置替换位数据。
26 4
|
16天前
|
存储 JSON 数据格式
Python基础语法汇总【保姆级小白教程】
我将 Python语法分为14个章节,从第一章Python基础概念到第14章模块&异常处理,本篇文章将逐一为大家讲述.
49 0
Python基础语法汇总【保姆级小白教程】