Python 编程 | 连载 25 - Python 多进程(下)

简介: Python 编程 | 连载 25 - Python 多进程(下)

在alpha和bravo执行完成之后,两个进程都已经关闭。

多线程的优点是缩短脚本执行时间,提高执行效率。

多进程存在的问题有:

  • 通过进程模块执行的函数无法获取返回值
  • 多个今进程同时修改文件可能会出现错误
  • 进程数量太多会造成资源不足、死机的情况

进程池

进程池的概念与数据库连接池的概念是类似的,都是为了提高效率,避免线程创建于关闭的消耗

444cd2cc14c449bdbe621ceafb19c067_tplv-k3u1fbpfcp-zoom-in-crop-mark_4536_0_0_0.png

多进程模块multiprocessing中进程池的相关函数:

  • Pool:进程池的创建,参数为要创建的进程的个数,返回一个进程池对象
  • applu_async:任务加入线程池(异步),参数函数名和函数的参数,无返回值
  • close:关闭进程池,无参数、无返回值
  • join:等待进程池任务结束,无参数、无返回值
import multiprocessing
import os
import time
def alpha(count):
    print(count, os.getpid())
    time.sleep(5)
if __name__ == '__main__':
    pool = multiprocessing.Pool(5)
    for i in range(20):
        pool.apply_async(func=alpha, args=(i,))
    time.sleep(20)        
复制代码

136e0d70730543dc9b7c201ef60344bd_tplv-k3u1fbpfcp-zoom-in-crop-mark_4536_0_0_0.png

进程被重复利用了,这里调用了异步,异步就是非同步,导致前后使用的进程号顺序不一致。

进程池结束任务之前,主进程就已经结束了,程序结束,进程池就被关闭了。

pool.close()
pool.join()
复制代码

在time.sleep()函数下添加代码,并注释time.sleep()函数。

eaa226ea97074de19e82c70ba45f7874_tplv-k3u1fbpfcp-zoom-in-crop-mark_4536_0_0_0.png

20个任务全部完成,需要通过close()函数和join()函数,来保证在子线程执行结束之后,再结束主线程,在退出程序。

alpha()函数添加return, 异步是可以获取返回值的。

import multiprocessing
import os
import time
def alpha(count):
    print(count, os.getpid())
    time.sleep(5)
    return 'result is %s, pid is %s' % (count, os.getpid())
if __name__ == '__main__':
    pool = multiprocessing.Pool(5)
    res_list = []
    for i in range(20):
        res = pool.apply_async(func=alpha, args=(i, ))
        res_list.append(res)
    for res in res_list:
        print(res.get())
    # time.sleep(20)
    # pool.close()
    # pool.join()
复制代码

99ca0a9ce5ca44fd8059753f0caafa62_tplv-k3u1fbpfcp-zoom-in-crop-mark_4536_0_0_0.png

第一组先执行,执行完成之后打印出结果,同时第二组也开始执行。

进程锁

当一个进程开始执行任务的时候,为了避免进程被其他任务使用,需要通过锁开控制,只有解锁之后才能执行下一个任务

进程锁相关的函数:

acquire:上锁,无参数、无返回值 release:开锁,无参数、无返回值

import multiprocessing
import os
import time
def alpha(count, lock):
    # 上锁
    lock.acquire()
    print(count, os.getpid())
    time.sleep(5)
    # 解锁
    lock.release()
    return 'result is %s, pid is %s' % (count, os.getpid())
if __name__ == '__main__':
    pool = multiprocessing.Pool(5)
    manager = multiprocessing.Manager()
    lock = manager.Lock()
    res_list = []
    for i in range(20):
        res = pool.apply_async(func=alpha, args=(i, lock))
        # res_list.append(res)
    pool.close()
    pool.join()
复制代码

7c1b48426a074f95acde1a53c991c361_tplv-k3u1fbpfcp-zoom-in-crop-mark_4536_0_0_0.png

每次只有一个进程在工作,锁不可以滥用,锁没有解开就会造成死锁现象。

三、进程之间的通信

两个进程之间需要相互配合工作,就需要通信的帮助。进程之间通过队列进行通信,队列可以解决进程模块执行的函数无法获取返回值的问题

队列是一种数据结构,队列中数据存储的特点是先入先出或者后入后出

多线程模块multipartprocessing中队列相关函数

  • Queue:队列的创建,返回一个队列对象
  • put:将信息放入队列,参数为放入队列的信息,无返回值
  • get:获取队列中的信息,无参数,返回值为字符串既具体的消息
import json
import multiprocessing
class Work():
    def __init__(self, queue):
        self.queue = queue
    def send(self, message):
        if not isinstance(message, str):
            message = json.dumps(message)
        self.queue.put(message)
    def reveive(self):
        while True:
            result = self.queue.get()
            try:
                res = json.loads(result)
            except:
                res = result
            print('Message is {}'.format(res))
if __name__ == '__main__':
    queue = multiprocessing.Queue()
    work = Work(queue)
    send = multiprocessing.Process(target=work.send, args=({'name': 'stark'},))
    receive = multiprocessing.Process(target=work.reveive)
    send.start()
    receive.start()
    send.join()
复制代码

11771c979c3948e4b050764e7323e112_tplv-k3u1fbpfcp-zoom-in-crop-mark_4536_0_0_0.png

此时接收到数据之后,程序并不会停止,而是持续运行,需要通过调用函数来终止程序,在脚本末尾增加代码。

receive.terminate()
print(send.is_alive())
复制代码

3db4c8dc941d48c295932328de5913d6_tplv-k3u1fbpfcp-zoom-in-crop-mark_4536_0_0_0.png

将批量消息放入队列中,增加send_list()函数。

import json
import multiprocessing
import time
class Work():
    def __init__(self, queue):
        self.queue = queue
    # 其余代码不变
    def send_list(self):
        for i in range(10):
            self.queue.put('Mark {}'.format(i))
            time.sleep(1)
if __name__ == '__main__':
    queue = multiprocessing.Queue()
    work = Work(queue)
    send = multiprocessing.Process(target=work.send, args=({'name': 'stark'},))
    receive = multiprocessing.Process(target=work.reveive)
    # 为send_list函数创建一个进程
    send_list = multiprocessing.Process(target=work.send_list)
    # 启动该进程
    send_list.start()
    send.start()
    receive.start()
    # print(send.is_alive())
    send.join()
复制代码

d6f2b8e4fa9f418d86466475cf9e54d8_tplv-k3u1fbpfcp-zoom-in-crop-mark_4536_0_0_0.png

要想程序能够正常停止,只需阻塞最长的进程即可。

# send.join()
send_list.join()
receive.terminate()
print(send.is_alive())
复制代码

3822c5f5fb92428ca524a3075088e596_tplv-k3u1fbpfcp-zoom-in-crop-mark_4536_0_0_0.png

相关文章
|
2月前
|
人工智能 数据可视化 数据挖掘
探索Python编程:从基础到高级
在这篇文章中,我们将一起深入探索Python编程的世界。无论你是初学者还是有经验的程序员,都可以从中获得新的知识和技能。我们将从Python的基础语法开始,然后逐步过渡到更复杂的主题,如面向对象编程、异常处理和模块使用。最后,我们将通过一些实际的代码示例,来展示如何应用这些知识解决实际问题。让我们一起开启Python编程的旅程吧!
|
2月前
|
存储 数据采集 人工智能
Python编程入门:从零基础到实战应用
本文是一篇面向初学者的Python编程教程,旨在帮助读者从零开始学习Python编程语言。文章首先介绍了Python的基本概念和特点,然后通过一个简单的例子展示了如何编写Python代码。接下来,文章详细介绍了Python的数据类型、变量、运算符、控制结构、函数等基本语法知识。最后,文章通过一个实战项目——制作一个简单的计算器程序,帮助读者巩固所学知识并提高编程技能。
|
2月前
|
Unix Linux 程序员
[oeasy]python053_学编程为什么从hello_world_开始
视频介绍了“Hello World”程序的由来及其在编程中的重要性。从贝尔实验室诞生的Unix系统和C语言说起,讲述了“Hello World”作为经典示例的起源和流传过程。文章还探讨了C语言对其他编程语言的影响,以及它在系统编程中的地位。最后总结了“Hello World”、print、小括号和双引号等编程概念的来源。
128 80
|
1月前
|
存储 缓存 Java
Python高性能编程:五种核心优化技术的原理与Python代码
Python在高性能应用场景中常因执行速度不及C、C++等编译型语言而受质疑,但通过合理利用标准库的优化特性,如`__slots__`机制、列表推导式、`@lru_cache`装饰器和生成器等,可以显著提升代码效率。本文详细介绍了这些实用的性能优化技术,帮助开发者在不牺牲代码质量的前提下提高程序性能。实验数据表明,这些优化方法能在内存使用和计算效率方面带来显著改进,适用于大规模数据处理、递归计算等场景。
71 5
Python高性能编程:五种核心优化技术的原理与Python代码
|
1天前
|
数据采集 Java 数据处理
Python实用技巧:轻松驾驭多线程与多进程,加速任务执行
在Python编程中,多线程和多进程是提升程序效率的关键工具。多线程适用于I/O密集型任务,如文件读写、网络请求;多进程则适合CPU密集型任务,如科学计算、图像处理。本文详细介绍这两种并发编程方式的基本用法及应用场景,并通过实例代码展示如何使用threading、multiprocessing模块及线程池、进程池来优化程序性能。结合实际案例,帮助读者掌握并发编程技巧,提高程序执行速度和资源利用率。
11 0
|
2月前
|
Python
[oeasy]python055_python编程_容易出现的问题_函数名的重新赋值_print_int
本文介绍了Python编程中容易出现的问题,特别是函数名、类名和模块名的重新赋值。通过具体示例展示了将内建函数(如`print`、`int`、`max`)或模块名(如`os`)重新赋值为其他类型后,会导致原有功能失效。例如,将`print`赋值为整数后,无法再用其输出内容;将`int`赋值为整数后,无法再进行类型转换。重新赋值后,这些名称失去了原有的功能,可能导致程序错误。总结指出,已有的函数名、类名和模块名不适合覆盖赋新值,否则会失去原有功能。如果需要使用类似的变量名,建议采用其他命名方式以避免冲突。
56 14
|
2月前
|
存储 监控 Linux
嵌入式Linux系统编程 — 5.3 times、clock函数获取进程时间
在嵌入式Linux系统编程中,`times`和 `clock`函数是获取进程时间的两个重要工具。`times`函数提供了更详细的进程和子进程时间信息,而 `clock`函数则提供了更简单的处理器时间获取方法。根据具体需求选择合适的函数,可以更有效地进行性能分析和资源管理。通过本文的介绍,希望能帮助您更好地理解和使用这两个函数,提高嵌入式系统编程的效率和效果。
126 13
|
2月前
|
分布式计算 大数据 数据处理
技术评测:MaxCompute MaxFrame——阿里云自研分布式计算框架的Python编程接口
随着大数据和人工智能技术的发展,数据处理的需求日益增长。阿里云推出的MaxCompute MaxFrame(简称“MaxFrame”)是一个专为Python开发者设计的分布式计算框架,它不仅支持Python编程接口,还能直接利用MaxCompute的云原生大数据计算资源和服务。本文将通过一系列最佳实践测评,探讨MaxFrame在分布式Pandas处理以及大语言模型数据处理场景中的表现,并分析其在实际工作中的应用潜力。
127 2
|
2月前
|
小程序 开发者 Python
探索Python编程:从基础到实战
本文将引导你走进Python编程的世界,从基础语法开始,逐步深入到实战项目。我们将一起探讨如何在编程中发挥创意,解决问题,并分享一些实用的技巧和心得。无论你是编程新手还是有一定经验的开发者,这篇文章都将为你提供有价值的参考。让我们一起开启Python编程的探索之旅吧!
71 10
|
2月前
|
人工智能 数据挖掘 开发者
探索Python编程之美:从基础到进阶
本文是一篇深入浅出的Python编程指南,旨在帮助初学者理解Python编程的核心概念,并引导他们逐步掌握更高级的技术。文章不仅涵盖了Python的基础语法,还深入探讨了面向对象编程、函数式编程等高级主题。通过丰富的代码示例和实践项目,读者将能够巩固所学知识,提升编程技能。无论你是编程新手还是有一定经验的开发者,这篇文章都将为你提供有价值的参考和启示。让我们一起踏上Python编程的美妙旅程吧!

热门文章

最新文章