11 Python 进程与线程编程

2022-09-17 193

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 首先我们要知道进程是系统进行资源分配和调度的基本单位，而线程是进程的一个执行路径，一个进程中至少有一个线程，进程中的多个线程共享进程的资源。

1、什么是进程和线程？

首先我们要知道进程是系统进行资源分配和调度的基本单位，而线程是进程的一个执行路径，一个进程中至少有一个线程，进程中的多个线程共享进程的资源。

比如我们打开一个 csdn 的软件,其实就打开一个叫csdn 的进程，既然一个进程汇中至少要有一个线程，那肯定就会有多线程，什么是多线程？

1、多线程是指从软硬件上实现多条执行路径的技术。
2、多线程用在哪里，有什么好处？

例如铁路12306购票系统。

例如过年回家抢票，不可能只有你一个人在买票，那每个人进来的时候都要有一个执行路径，那这个之后就需要用到多线程。

2、创建多进程

在python 中创建多进程我们要知道一个模块-- multiprocessing

函数	介绍	参数	返回值
Process	创建一个进程	target（函数）,args（函数的参数）	进程对象
start	执行进程	无	无
join	阻塞程序	无	无
kill	杀死进程	无	无
is_alive	进程是否存活	无	bool

接下来我们进入代码实操。

2.1 创建

我们创建了两个函数，并将两个都放在主函数里面执行，我们来看看执行的结果。

从控制台打印的结果可以看出，我们的两个函数和主函数都是在同一个进程内，接下来我们要进入正题，我们这里要稍微改造一下代码。

我们创建了一个进程去执行 work_a 函数，我们来看看执行的结果。

从执行结果来看我们work_a 已经执行在另外一个进程中了，work_b 和主函数的函数id 是一样的，

说明它们实在同一个进程中的。

而我们也发现执行的时间少了一半，因为我们的进程之间是无不干扰的，你跑你的，我跑我的，两个一起跑，这大大提升了我们的执行效率。

我们现在给 work_b 也放到一个进程中去，看看执行的效果是怎么样的。

我们可以看到时间直接打印了，这是为什么呢？

前面我们有说到。进程之间是无不干扰的，然后 name 是主进程，主进程没有了干扰，所以就直接执行了。

2.2 阻塞

如果我们想要让两个

子进程先执行完毕再执行主进程这个就可以使用到join。

我们来优化一下代码。

再来看看执行效果。

从执行结果来看，我们确实是实现了先执行完子线程再执行主线程，至于为什么控制台看起来优点乱，是因为有的进程它执行的时间是一致的。重叠在一起了。

3、进程池和进程锁

由于每个进程都会消耗内存和cpu 资源，所以我们不能无限创建进程，这样有可能会发生系统的死机的情况。

为了解决这个问题，我们可以使用多线程来替代，或者进程池。

还有多进程还存在同时修改一个文件的时候，会出现问题，解决方方法就是给这个文件上一把锁。

3.1 进程池

我们现在知道，进程不能创建太多，太多容易造成系统死机，所以我们要固定进程的创建数量，这个时候借助进程池的帮助。

我们可以认为进程池就是个池子，在这个池子创建好一定数量的进程。

比如上面这张图中的一个正方形的池子，里面有六个进程，这六个进程会伴随着进程池一起被创建。

我们要知道，普通的进程都要经历创建和关闭，这一建一关都要损耗一定的性能，而进程池中的性能，只需要经历一次创建就能一直往下使用，这也就避免了创建和关闭的性能损耗，伴随着进程池关闭，进程也会随之关闭。

了解了进程池的作用，我们就来了解如何去创建进程池。

函数名	介绍	参数	返回值
Pool	进程池创建	Processcount	进程池创建
apply_async	任务加入进程池（异步）	参数	无
close	关闭进程池	无	无
join	等待进程池任务结束	无	无

进入代码实操。

看看执行效果。

从执行效果来看，我们可以看到，有五个不同的进程id,这说明我们确实是在进程池创建了五个不同的进程，还有就是进程的执行，并没有按照顺序，这是因为它用了异步的处理方法，谁先干完活，谁就去接新的任务。

上面我们是用了sleep 去阻塞主进程的执行效率。因为如果不阻塞的话，主进程立马就执行完毕并关闭。这样子进程根本没有时间执行。

可不可以不用sleep就能实现子进程执行完再关闭，当然可以，这就可以使用到我们的joinl了，使用join往往伴随着我们的close。

我们来看看代码:

执行效果是一样的，需要注意的是，在某些场景中，我们是需要主进程一直启动着，只要有任务进来就执行，这个时候我们就不需要使用close,但如果是那种一次性的脚本任务，就需要使用到close 去关闭主进程了。

接下来我们来看看如何获得进程中的返回值。

3.2 进程锁

了解完进程池，我们就可以来了解一下进程锁了，其实锁，大家都理解，我们可以给大门上一把锁。

举个栗子，很多人冲向一个厕所，但是厕所只有一个马桶，肯定不能支持这么多人进去，所以第一个人进去之后，就把门锁上了，只有等第一个人解决完之后出来把锁解了，第二个人才能进去，第二个人再把门锁上，后面的以此类推。

了解了进程锁，我们就来看看如果使用进程锁进行加锁与解锁。

函数名	介绍	参数	返回值
acquire	上锁	无	无
release	开锁（解锁）	无	无

使用方式还是很简单的，执行效果得大家去试试看了，它会一个一个的执行，而不是像前面五个五个的执行。

4、进程之间的通信

进程之间的通信依赖于队列，所以我们来看看如何创建队列。

我们依然要用到 multiprocessing这个模块。

函数名	介绍	参数	返回值
Queue	队列的创建	mac_count	队列对象
put	信息放入队列	message	无
get	获取队列信息	无	str

# coding:utf-8
import time
import json
import multiprocessing


# 声明一个类
class Work(object):
    def __init__(self, q):
        self.q = q  # 初始化，创建队列

    def send(self, message):
        if not isinstance(message, str):
            message = json.dumps(message)
        self.q.put(message)  # 信息放入队列

    def send_all(self):
        for i in range(20):
            self.q.put(i)  # 信息放入队列
            time.sleep(1)

    def receive(self):
        while 1:
            result = self.q.get()  # 获取队列信息
            try:
                res = json.loads(result)
            except:
                res = result
            print('recv is %s' % res)


if __name__ == '__main__':
    q = multiprocessing.Queue()  # 队列
    work = Work(q)  # 实例化类
    send = multiprocessing.Process(target=work.send, args=({'name': '一切总会归于平淡'},))  # 创建线程
    recv = multiprocessing.Process(target=work.receive)  # 创建线程
    send_all_p = multiprocessing.Process(target=work.send_all)  # 创建线程
    send.start()  # 启动线程
    recv.start()  # 启动线程
    send_all_p.start()  # 启动线程

    send_all_p.join()  # 阻塞执行时间最长的线程
    recv.terminate()  # 关闭队列

执行结果：

这样我们就通过队列实现进程之间的通信了。

5、线程的创建

在python中有很多的多线程模块，其中最常用的就是 -- threading。

函数名	说明	用法
Thread	创建线程	Thread(target,args)
start	启动线程	start()
join	阻塞直到线程执行结束	join(timout=None)
getName	获取线程的名字	getName()
setName	设置线程的名字	setNmae(name)
is_alive	判断线程是否存活	is_alive()
setDaemon	守护线程	setDaemon(True)

看完上面的介绍，其实大家发现，线程中的方法跟我们进程中的大同小异。

接下来我们看代码演示。

现在我们还没有用到多线程，执行时间是10秒，接下来我们创建线程去提高我们代码执行的效率。

我们再看看执行效果。

哇，只花了一秒就执行完毕了。

6、线程池的创建

线程池和进程池的原理是相同的，这里就不再给大家做解释了。

我们使用Python 的配置包 -- concurrent 来帮助我们完成创建下线程池的任务。

方法名	说明	举例
futures.ThreadPoolExecutor	创建线程池	tpool = ThreadPoolExecutor(max_workers)
submit	往线程池中加入任务	submit(target,args)
done	线程池中的某个线程是否完成了任务	done()
result	获取当前线程执行任务的结果	result()

上代码

7、异步

要了解异步，我们就要只要什么是同步。

平常我们的代码是从上往下执行的，就像 1，2，3，4 ......,2要等1 执行完才能轮到2 后面的也都一样，如果其中一个要执行的特别久就容易发生阻塞。

而异步不需要这样，2不需要等1执行2完，它就可以进入执行状态，而且就算其中有一个发生了阻塞，后面的也不会受到影响，听来是不是优点类似与多进程和多线程？

确实如此，异步和多进程和多线程它们类似于兄弟，让我们看看它们之间有何相同有何不同。

首先我们要知道，异步实际上也是一种线程。只不过它是一种比较轻量级的线程，我们将其称为 ‘协程’；所以协程也是进程下的一部分，但和多线程，多进程不同的是，多线程和多进程不能获取函数的返回值，但是异步可以获取。

7.1 async 与 await 关键字

名字	说明	用法
async	定义异步	async def 方法名():
await	执行异步	async def 方法名(): 　retult = await 方法名()

注意：

使用await，方法必须被 async 定义。

这里有一个问题，我们知道最上层的代码一定不是个函数，它无法定义async,例如我们的主程序。

这里我们要借助一个帮手，asyncio,这个帮手它有太多使用异步的方法，这篇就只介绍两种。

函数名	介绍	参数	返回值
gather	将异步函数批量执行	asyncfunc	List 函数的返回值
run	执行主导异步函数	[task]	执行函数的返回结果

看看执行结果：

可以看我们确实是实现了异步操作，而它们都是在同一个进程。

2、gevent

这个模块是需要下载的。

pip install gevent

函数名	介绍	参数	返回值
spawn	创建协程对象	Func,args	协程对象
joinall	批量处理协程对象	[spawnobj]	[spawnobj]

执行效果：

11 Python 进程与线程编程

1、什么是进程和线程？

2、创建多进程

2.1 创建

2.2 阻塞

3、进程池和进程锁

3.1 进程池

3.2 进程锁

4、进程之间的通信

5、线程的创建

6、线程池的创建

7、异步

7.1 async 与 await 关键字

2、gevent

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

11 Python 进程与线程编程

1、什么是进程和线程？

2、创建多进程

2.1 创建

2.2 阻塞

3、 进程池和进程锁

3.1 进程池

3.2 进程锁

4、进程之间的通信

5、线程的创建

6、线程池的创建

7、异步

7.1 async 与 await 关键字

2、gevent

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像

3、进程池和进程锁