Python | Python学习之多进程详解

2023-08-08 178

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Python | Python学习之多进程详解

进程详解

并行与并发怎么理解？

并发：当前任务数多于处理器的核心数，称之为并发
并行：当前任务数少于或等于处理器核心数，称之为并行

为了充分利用多核CPU资源，Python中大部分情况下都需要使用多进程。

在python中我们如何创建多进程？

进程和线程的区别

我们经常迷惑于多进程和多线程，长的好像一样，但是他们有本质上的区别，很多大佬也对进程和线程的概念做了很多通俗易懂的解释，这里我们引用阮一峰老师的博文，大家可以先去看看，理清楚线程和进程的区别。

进程与线程的一个简单解释(http://www.ruanyifeng.com/blog/2013/04/processes_and_threads.html)

python如何创建多进程

1.使用os.fork()的方法创建多进程
2.使用multiprocessing创建多进程
3.使用multiprocessing中Pool创建进程池对象

创建多进程的方法有什么区别？

使用os 模块中的 os.fork()创建进程

在这里使用os.fork()创建进程后会返回两个值，其中一个值为零。另一个值为创建的子进程ID，在这里可以使用os.getpid()获取子进程的ID，可以使用os.getppid()获取父进程ID。

需要注意的是：在os.fork()创建的子进程中，父进程和子进程执行的是一样的任务，并且在执行的任务结束时，父进程会自行结束，不会等待子进程结束之后结束。

import os
res = os.fork()
if res == 0:  # 子进程返回的值恒等于0
    print('这是子进程%s',os.getpid())  # 获取子进程ID
else:
    print('这是父进程%s',os.getppid())  # 获取父进程ID

使用multiprocessing模块创建多进程

multiprocessing中提供了Process类来生成进程实例
Process([group [, target [, name [, args [, kwargs]]]]])

其中：

1. group分组，实际上不使用
2. target表示调用对象，传入任务执行函数作为参数
3. args表示给调用对象以元组的形式提供参数，比如target是函数a，他有两个参数m，n，那么该参数为args=(m, n)即可，只有一个参数时。该参数为args=(m,)
4. kwargs表示调用对象的字典
5. name是别名，相当于给这个进程取一个名字

同时在Process类中提供以下几个方法用于实现进程的操作：

1. start()让进程执行target调用的对象
2. join()阻塞，默认主进程，不会等到子进程结束后结束，需要使用join()使得主进程等待子进程执行结束后结束
3. terminate()结束当前，无论任务是否完成

举个栗子：

# multiprocess
import os 
from multiprocessing import Process
def test(i):
    print('-----1111-----%s----%s' % (os.getpid(),os.getppid()),i)
if __name__ == '__main__':
    for i in range(1,10):
        p = Process(target=test,args=(i,))
        print(os.getpid())
        p.start()
# 输出
5224
5224
5224
5224
5224
5224
5224
5224
-----1111-----4704----5224 1
-----1111-----1292----5224 4
-----1111-----5276----5224 2
-----1111-----5152----5224 6
5224
-----1111-----5196----5224 5
-----1111-----5272----5224 3
-----1111-----4640----5224 7
-----1111-----5684----5224 8
-----1111-----1044----5224 9
[Finished in 1.3s]

使用multiprocessing中的Pool类创建进程池对象

使用Pool类创建进程的方法和使用Process类创建进程的方法基本类似。

但是需要注意一下几点：

1. pool.apply_async()非阻塞
2. pool.apply()阻塞
3. pool.join()主进程，创建/添加任务之后，主进程默认不会等待进程池中的任务执行完后才结束，而是当主进程的任务完成后，立马结束，如果没有添加join()会导致进程池中的任务不执行。

举个栗子：

# pool
from multiprocessing import Pool
import os,time,random
def worker(msg):
    t_start = time.time()
    print("%s开始执行,进程号为%d"%(msg,os.getpid()))
    #random.random()随机生成0~1之间的浮点数
    time.sleep(random.random()*2) 
    t_stop = time.time()
    print(msg,"执行完毕，耗时%0.2f"%(t_stop-t_start))
def main():
    po=Pool(3) #定义一个进程池，最大进程数3
    for i in range(0,10):
        #Pool.apply_async(要调用的目标,(传递给目标的参数元祖,))
        #每次循环将会用空闲出来的子进程去调用目标
        po.apply_async(worker,(i,))
    print("----start----")
    po.close() #关闭进程池，关闭后po不再接收新的请求
    po.join() #等待po中所有子进程执行完成，必须放在close语句之后
    print("-----end-----")
if __name__ == '__main__':
    main()

进程之间如何通信？

进程间通信有很多中方式，包含但不限于命名管道，无名管道，共享内存，队列等。主要学习一下队列-Queue的使用

Queue的使用

1. Queue.qsize()：返回当前队列包含的消息数量；
2. Queue.empty()：如果队列为空，返回True，反之False；
3. Queue.full()：如果队列满了，返回True,反之False；
4. Queue.get([block[, timeout]])：获取队列中的一条消息，然后将其从列队中移除，block默认值为True；
5. Queue.get_nowait()：相当Queue.get(False)；
6. Queue.put(item,[block[, timeout]])：将item消息写入队列，block默认值为True；
7. Queue.put_nowait(item)：相当Queue.put(item, False)；

首先实例化Queue对象，例如：p = Queue(num)其中num可以为空或负数代表可接受的消息无上限。

如果block使用默认值，且没有设置timeout（单位秒），消息列队如果为空，此时程序将被阻塞（停在读取状态），直到从消息列队读到消息为止，如果设置了timeout，则会等待timeout秒，若还没读取到任何消息，则抛出Queue.Empty异常；如果block值为False，消息列队如果为空，则会立刻抛出Queue.Empty异常；

举个栗子：

#coding=utf-8
from multiprocessing import Queue
q=Queue(3) #初始化一个Queue对象，最多可接收三条put消息
q.put("消息1") 
q.put("消息2")
print(q.full())  #False
q.put("消息3")
print(q.full()) #True
#因为消息列队已满下面的try都会抛出异常，第一个try会等待2秒后再抛出异常，第二个Try会立刻抛出异常
try:
    q.put("消息4",True,2)
except:
    print("消息列队已满，现有消息数量:%s"%q.qsize())
try:
    q.put_nowait("消息4")
except:
    print("消息列队已满，现有消息数量:%s"%q.qsize())
#推荐的方式，先判断消息列队是否已满，再写入
if not q.full():
    q.put_nowait("消息4")
#读取消息时，先判断消息列队是否为空，再读取
if not q.empty():
    for i in range(q.qsize()):
        print(q.get_nowait())

再举个栗子：

from multiprocessing import Process, Queue
import os, time, random
# 写数据进程执行的代码:
def write(q):
    for value in ['A', 'B', 'C']:
        print 'Put %s to queue...' % value
        q.put(value)
        time.sleep(random.random())
# 读数据进程执行的代码:
def read(q):
    while True:
        if not q.empty():
            value = q.get(True)
            print 'Get %s from queue.' % value
            time.sleep(random.random())
        else:
            break
if __name__=='__main__':
    # 父进程创建Queue，并传给各个子进程：
    q = Queue()
    pw = Process(target=write, args=(q,))
    pr = Process(target=read, args=(q,))
    # 启动子进程pw，写入:
    pw.start()    
    # 等待pw结束:
    pw.join()
    # 启动子进程pr，读取:
    pr.start()
    pr.join()
    print '所有数据都写入并且读完'

进程池中的Queue的使用

Pool创建进程，就需要使用multiprocessing.Manager()中的Queue()，而不是multiprocessing.Queue()，否则会得到一条如下的错误信息：

RuntimeError: Queue objects should only be shared between processes through inheritance.

举个栗子：

#修改import中的Queue为Manager
from multiprocessing import Manager,Pool
import os,time,random
def reader(q):
    print("reader启动(%s),父进程为(%s)"%(os.getpid(),os.getppid()))
    for i in range(q.qsize()):
        print("reader从Queue获取到消息：%s"%q.get(True))
def writer(q):
    print("writer启动(%s),父进程为(%s)"%(os.getpid(),os.getppid()))
    for i in "dongGe":
        q.put(i)
if __name__=="__main__":
    print("(%s) start"%os.getpid())
    q=Manager().Queue() #使用Manager中的Queue来初始化
    po=Pool()
    #使用阻塞模式创建进程，这样就不需要在reader中使用死循环了，可以让writer完全执行完成后，再用reader去读取
    po.apply(writer,(q,))
    po.apply(reader,(q,))
    po.close()
    po.join()
    print("(%s) End"%os.getpid())

写在后面

这是咸鱼的第一篇python学习笔记，好像很久没有更文了，不是因为懒，因为咸鱼在学习。

Python | Python学习之多进程详解

进程详解

并行与并发怎么理解？

在python中我们如何创建多进程？

进程和线程的区别

python如何创建多进程

创建多进程的方法有什么区别？

使用os 模块中的 os.fork()创建进程

使用multiprocessing模块创建多进程

使用multiprocessing中的Pool类创建进程池对象

进程之间如何通信？

Queue的使用

进程池中的Queue的使用

写在后面

热门文章

最新文章

相关课程

相关电子书

推荐镜像

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Python | Python学习之多进程详解

进程详解

并行与并发怎么理解？

在python中我们如何创建多进程？

进程和线程的区别

python如何创建多进程

创建多进程的方法有什么区别？

使用os 模块中的 os.fork()创建进程

使用multiprocessing模块创建多进程

使用multiprocessing中的Pool类创建进程池对象

进程之间如何通信？

Queue的使用

进程池中的Queue的使用

写在后面

热门文章

最新文章

相关课程

相关电子书

推荐镜像