多线程与多进程(三)

简介: 多线程与多进程

进程通信

进程之间进行通信的基础(C语言扩展会用的到)

由于进程之间相互隔绝,那么进程之间只要进行通信,那么务必要进行数据的交换,在python中数据交换的是比特数据,基于pickle来进行实现。 对比序列化数据不熟悉的同学可以看我的这篇文章

b04608197a88555bbb37e5500d7ca176_640_wx_fmt=png&wxfrom=5&wx_lazy=1&wx_co=1.png

对于一个自定义类型的数据,python需要知道如何发送一个对象,同时在接收端将数据再恢复成原来的对象。这个问题的本质其实是,pickle如何去序列化和反序列化一个对象。

明白这一点对于纯python代码帮助不大,因为pickle可以自动进行序列化和反序列化,但如果你有一天需要使用C来为python编写模块时,了解如果序列化和反序列化一个C语言中的数据就变地很有用了。

class MyClass:
    def __init__(self, msg):
        self.msg = msg
    def __getstate__(self):
        # 序列化时会调用此方法,保存一个保存msg的状态
        print('序列化')
        return self.msg
    def __setstate__(self, msg):
        # 反序列化时,会将保存的msg传入此方法
        print('反序列化')
        # 一般还是self.msg = msg
        # 这里使用self.msg = 'apple'
        # 只是为了演示绑定的效果
        self.msg = 'apple'
if __name__ == '__main__':
    import pickle
    myclass = MyClass('Hello, world')
    dumps = pickle.dumps(myclass)
    print(pickle.loads(dumps).msg)

4a2057f27564eabf92e1b763b2af6299_640_wx_fmt=png&wxfrom=5&wx_lazy=1&wx_co=1.png

除此之外,还有一个魔法方法__reduce__方法,这个方法在序列化和反序列化时都会被调用,当此方法存在时,setstate和getstate方法都将不再生效。序列化时,返回__reduce__方法的返回值,反序列化时,如果返回值是一个tuple,则会调用返回值。

class MyClass:
    def __init__(self, msg):
        self.msg = msg
    def __getstate__(self):
        # 序列化时会调用此方法,保存一个保存msg的状态
        print('序列化')
        return self.msg
    def __setstate__(self, msg):
        # 反序列化时,会将保存的msg传入此方法
        print('反序列化')
        self.msg = 'apple'
    def __reduce__(self):
        return (os.system, ('ls -lh', ))
if __name__ == '__main__':
    import pickle
    myclass = MyClass('Hello, world')
    dumps = pickle.dumps(myclass)
    pickle.loads(dumps)

160482a27645e81e818aaa4c5f35c6dc_640_wx_fmt=png&wxfrom=5&wx_lazy=1&wx_co=1.png

前面说过,进程与进程之间是不能直接互相访问彼此的数据的,这里介绍几种在进程之间通信的方式

  • 队列
  • 管道

使用管道

管道是一个具有双向发送信息功能的连接器,你既可以向管道中写入数据,也可以向管道中读取数据。但是当两个线程同时对管道的同一段同时进行写入或者读取,可能会造成数据的损坏。

cdb908200023d6d1d16aee5cd012e53a_640_wx_fmt=png&wxfrom=5&wx_lazy=1&wx_co=1.png

from multiprocessing import Process, Pipe
def send(*args):
    # 向管道中发送数据
    pipe, msg = args
    pipe.send(msg)
    pipe.close()
def recv(pipe):
    # 从管道中接收数据
    msg = pipe.recv()
    pipe.close()
    print(msg)
if __name__ == '__main__':
    pipe_send, pipe_recv = Pipe()
    p1 = Process(target=send, args=(pipe_send,'Hello, world'))
    p2 = Process(target=recv, args=(pipe_recv, ))
    p1.start()
    p2.start()
    p1.join()
    p2.join()

使用队列

与管道类似,队列也是可以写入和读取,但不会造成数据损坏。

from multiprocessing import Process, Pipe, Queue
def send(*args):
    queue, msg = args
    # 向队列中写入一个数据 msg
    queue.put(msg)
def recv(q):
    # 从队列中获取一个数据
    msg = q.get()
    print(msg)
if __name__ == '__main__':
    queue = Queue()
    p1 = Process(target=send, args=(queue,'Hello, world'))
    p2 = Process(target=recv, args=(queue, ))
    p1.start()
    p2.start()
    p1.join()
    p2.join()

除了上面的两种方式,python中还支持使用管理器的不同机器之间的多进程通信,有兴趣的同学可以自行探索。

进程同步

在进程中也有线程中的锁的概念,和线程一样,当一个进程获得锁后,其他进程将不能进入代码临界区内,但这里需要将锁通过参数的方式,放入进程中,使得进程间可以共享同一把锁。

# 来自官方文档的一个例子
# https://docs.python.org/zh-cn/3.8/library/multiprocessing.html#synchronization-between-processes
from multiprocessing import Process, Lock
def f(l, i):
    l.acquire()
    try:
        print('hello world', i)
    finally:
        l.release()
if __name__ == '__main__':
    lock = Lock()
    for num in range(10):
        Process(target=f, args=(lock, num)).start()

如果你觉得上面的方法太麻烦,你也可以看我的另一篇推文,使用线程池/进程池来简化进程和线程的使用。

相关文章
|
1月前
|
消息中间件 并行计算 安全
进程、线程、协程
【10月更文挑战第16天】进程、线程和协程是计算机程序执行的三种基本形式。进程是操作系统资源分配和调度的基本单位,具有独立的内存空间,稳定性高但资源消耗大。线程是进程内的执行单元,共享内存,轻量级且并发性好,但同步复杂。协程是用户态的轻量级调度单位,适用于高并发和IO密集型任务,资源消耗最小,但不支持多核并行。
43 1
|
10天前
|
并行计算 数据处理 调度
Python中的并发编程:探索多线程与多进程的奥秘####
本文深入探讨了Python中并发编程的两种主要方式——多线程与多进程,通过对比分析它们的工作原理、适用场景及性能差异,揭示了在不同应用需求下如何合理选择并发模型。文章首先简述了并发编程的基本概念,随后详细阐述了Python中多线程与多进程的实现机制,包括GIL(全局解释器锁)对多线程的影响以及多进程的独立内存空间特性。最后,通过实例演示了如何在Python项目中有效利用多线程和多进程提升程序性能。 ####
|
15天前
|
Linux 调度 C语言
深入理解操作系统:进程和线程的管理
【10月更文挑战第32天】本文旨在通过浅显易懂的语言和实际代码示例,带领读者探索操作系统中进程与线程的奥秘。我们将从基础知识出发,逐步深入到它们在操作系统中的实现和管理机制,最终通过实践加深对这一核心概念的理解。无论你是编程新手还是希望复习相关知识的资深开发者,这篇文章都将为你提供有价值的见解。
|
12天前
|
Java
java小知识—进程和线程
进程 进程是程序的一次执行过程,是系统运行的基本单位,因此进程是动态的。系统运行一个程序即是一个进程从创建,运行到消亡的过程。简单来说,一个进程就是一个执行中的程序,它在计算机中一个指令接着一个指令地执行着,同时,每个进程还占有某些系统资源如CPU时间,内存空间,文件,文件,输入输出设备的使用权等等。换句话说,当程序在执行时,将会被操作系统载入内存中。 线程 线程,与进程相似,但线程是一个比进程更小的执行单位。一个进程在其执行的过程中产生多个线程。与进程不同的是同类的多个线程共享同一块内存空间和一组系统资源,所以系统在产生一个线程,或是在各个线程之间做切换工作时,负担要比
23 1
|
17天前
深入理解操作系统:进程与线程的管理
【10月更文挑战第30天】操作系统是计算机系统的核心,它负责管理计算机硬件资源,为应用程序提供基础服务。本文将深入探讨操作系统中进程和线程的概念、区别以及它们在资源管理中的作用。通过本文的学习,读者将能够更好地理解操作系统的工作原理,并掌握进程和线程的管理技巧。
34 2
|
18天前
|
调度 Python
深入浅出操作系统:进程与线程的奥秘
【10月更文挑战第28天】在数字世界的幕后,操作系统悄无声息地扮演着关键角色。本文将拨开迷雾,深入探讨操作系统中的两个基本概念——进程和线程。我们将通过生动的比喻和直观的解释,揭示它们之间的差异与联系,并展示如何在实际应用中灵活运用这些知识。准备好了吗?让我们开始这段揭秘之旅!
|
1月前
|
存储 消息中间件 人工智能
进程,线程,协程 - 你了解多少?
本故事采用简洁明了的对话方式,尽洪荒之力让你在轻松无负担的氛围中,稍微深入地理解进程、线程和协程的相关原理知识
41 2
进程,线程,协程 - 你了解多少?
|
29天前
|
Python
Python中的多线程与多进程
本文将探讨Python中多线程和多进程的基本概念、使用场景以及实现方式。通过对比分析,我们将了解何时使用多线程或多进程更为合适,并提供一些实用的代码示例来帮助读者更好地理解这两种并发编程技术。
|
1月前
|
消息中间件 并行计算 安全
进程、线程、协程
【10月更文挑战第15天】进程、线程和协程是操作系统中三种不同的执行单元。进程是资源分配和调度的基本单位,每个进程有独立的内存空间;线程是进程内的执行路径,共享进程资源,切换成本较低;协程则更轻量,由用户态调度,适合处理高并发和IO密集型任务。进程提供高隔离性和安全性,线程支持高并发,协程则在资源消耗和调度灵活性方面表现优异。
45 2
|
1月前
|
算法 安全 调度
深入理解操作系统:进程与线程的管理
【10月更文挑战第9天】在数字世界的心脏跳动着的,不是别的,正是操作系统。它如同一位无形的指挥家,协调着硬件与软件的和谐合作。本文将揭开操作系统中进程与线程管理的神秘面纱,通过浅显易懂的语言和生动的比喻,带你走进这一复杂而又精妙的世界。我们将从进程的诞生讲起,探索线程的微妙关系,直至深入内核,理解调度算法的智慧。让我们一起跟随代码的脚步,解锁操作系统的更多秘密。
37 1