【从零学习python 】85.Python进程池的并行计算技术应用

2023-08-27 107

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 【从零学习python 】85.Python进程池的并行计算技术应用

进程池

当需要创建的子进程数量不多时，可以直接利用 multiprocessing 中的 Process 动态生成多个进程，但如果是上百甚至上千个目标，手动创建进程的工作量巨大，此时就可以使用 multiprocessing 模块提供的 Pool 方法。

初始化Pool 时，可以指定一个最大进程数，当有新的请求提交到 Pool 中时，如果池还没有满，那么就会创建一个新的进程用来执行该请求；但如果池中的进程数已经达到指定的最大值，那么该请求就会等待，直到池中有进程结束，才会用之前的进程来执行新的任务，请看下面的实例：

from multiprocessing import Pool
import os, time, random
def worker(msg):
    t_start = time.time()
    print("%s开始执行，进程号为%d" % (msg, os.getpid()))
    # random.random()随机生成0~1之间的浮点数
    time.sleep(random.random()*2)
    t_stop = time.time()
    print(msg, "执行完毕，耗时%0.2f" % (t_stop - t_start))
po = Pool(3)  # 定义一个进程池，最大进程数3
for i in range(0, 10):
    # Pool().apply_async(要调用的目标, (传递给目标的参数元组,))
    # 每次循环将会用空闲出来的子进程去调用目标
    po.apply_async(worker, (i,))
print("----start----")
po.close()  # 关闭进程池，关闭后po不再接收新的请求
po.join()  # 等待po中所有子进程执行完成，必须放在close语句之后
print("-----end-----")

运行效果

----start----
0开始执行，进程号为21466
1开始执行，进程号为21468
2开始执行，进程号为21467
0执行完毕，耗时1.01
3开始执行，进程号为21466
2执行完毕，耗时1.24
4开始执行，进程号为21467
3执行完毕，耗时0.56
5开始执行，进程号为21466
1执行完毕，耗时1.68
6开始执行，进程号为21468
4执行完毕，耗时0.67
7开始执行，进程号为21467
5执行完毕，耗时0.83
8开始执行，进程号为21466
6执行完毕，耗时0.75
9开始执行，进程号为21468
7执行完毕，耗时1.03
8执行完毕，耗时1.05
9执行完毕，耗时1.69
-----end-----

multiprocessing.Pool 常用函数解析：

apply_async(func[, args[, kwds]])：使用非阻塞方式调用 func（并行执行，阻塞方式必须等待上一个进程退出才能执行下一个进程），args 为传递给 func 的参数列表，kwds 为传递给 func 的关键字参数列表；
close()：关闭 Pool，使其不再接受新的任务；
terminate()：不管任务是否完成，立即终止；
join()：主进程阻塞，等待子进程的退出，必须在 close 或 terminate 之后使用。

进程池中的 Queue

如果要使用 Pool 创建进程，就需要使用 multiprocessing.Manager() 中的 Queue()，而不是 multiprocessing.Queue()，否则会得到一条如下的错误信息：

RuntimeError: Queue objects should only be shared between processes through inheritance.

下面的实例演示了进程池中的进程如何通信：

# 修改 import 中的 `Queue` 为 `Manager`
from multiprocessing import Manager, Pool
import os, time, random
def reader(q):
    print("reader启动(%s)，父进程为(%s)" % (os.getpid(), os.getppid()))
    for i in range(q.qsize()):
        print("reader从Queue获取到消息：%s" % q.get(True))
def writer(q):
    print("writer启动(%s)，父进程为(%s)" % (os.getpid(), os.getppid()))
    for i in "helloworld":
        q.put(i)
if __name__ == "__main__":
    print("(%s) start" % os.getpid())
    q = Manager().Queue()  # 使用 `Manager` 中的 `Queue`
    po = Pool()
    po.apply_async(writer, (q,))
    time.sleep(1)  # 先让上面的任务向 `Queue` 存入数据，然后再让下面的任务开始从中取数据
    po.apply_async(reader, (q,))
    po.close()
    po.join()
    print("(%s) End" % os.getpid())

运行结果

(4171) start
writer启动(4173)，父进程为(4171)
reader启动(4174)，父进程为(4171)
reader从Queue获取到消息：h
reader从Queue获取到消息：e
reader从Queue获取到消息：l
reader从Queue获取到消息：l
reader从Queue获取到消息：o
reader从Queue获取到消息：w
reader从Queue获取到消息：o
reader从Queue获取到消息：r
reader从Queue获取到消息：l
reader从Queue获取到消息：d
(4171) End

【从零学习python 】85.Python进程池的并行计算技术应用

进程池

运行效果

进程池中的 Queue

运行结果

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

【从零学习python 】85.Python进程池的并行计算技术应用

进程池

运行效果

进程池中的 Queue

运行结果

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像