并发编程实践:进程、线程和threading 模块的全面解析

本文涉及的产品
全局流量管理 GTM,标准版 1个月
云解析 DNS,旗舰版 1个月
云解析DNS,个人版 1个月
简介: 并发编程实践:进程、线程和threading 模块的全面解析

前言


国庆假期回来上班第一天,日常犯困。


一、进程和线程的区别


1-1、进程


  • 进程:一个在内存中运行的应用程序。每个进程都有自己独立的一块内存空间,一个进程可以有多个线程。是操作系统资源分配的基本单元。


6ae18169527e42538bd91ddfceb00869.png

1-2、线程

  • 线程进程中的一个执行单元,一个进程至少有一个线程,一个进程可以运行多个线程。是比进程更小的独立运行的基本单元,故也被成为轻量级进程。(协程是一种比线程更轻量级的存在,一个线程可以拥有多个协程。)


2f83e6e32c6c4fabbe2accf6a4eae12c.png


1-3、区别


  • 区别

1、根本区别:进程是操作系统资源分配的基本单位,而线程是处理器任务调度和执行的基本单位

2、资源开销:每个进程都有独立的代码和数据空间(程序上下文),程序之间的切换会有较大的开销;线程可以看做轻量级的进程,同一类线程共享代码和数据空间,每个线程都有自己独立的运行栈和程序计数器(PC),线程之间切换的开销小。

3、包含关系:如果一个进程内有多个线程,则执行过程不是一条线的,而是多条线(线程)共同完成的;线程是进程的一部分,所以线程也被称为轻权进程或者轻量级进程。

4、内存分配:同一进程的线程共享本进程的地址空间和资源,而进程之间的地址空间和资源是相互独立的。

5、影响关系:一个进程崩溃后,在保护模式下不会对其他进程产生影响,但是一个线程崩溃整个进程都死掉。所以多进程要比多线程健壮。

6、执行过程:每个独立的进程有程序运行的入口、顺序执行序列和程序出口。但是线程不能独立执行,必须依存在应用程序中,由应用程序提供多个线程执行控制,两者均可并发执行。


综上所述,进程和线程都有各自的优缺点,操作系统会根据应用程序的需求和系统资源的限制来选择合适的方式来实现多任务。


二、使用threading 模块来创建多线程


2-0、threading模块介绍


Python的 threading 模块提供了线程相关的类和方法,可以在 Python 程序中创建和控制多个线程,实现多任务并发执行。

该模块主要包含以下类和方法


  • Thread 类:表示一个线程,可以通过继承该类来创建自定义的线程类,并实现自己的 run 方法来定义线程的具体行为。
  • Lock 类:表示一个锁对象,用于控制多个线程对共享资源的访问。可以使用 acquire 和 release 方法来加锁和释放锁。
  • RLock 类:表示可重入锁对象,与 Lock 类类似,但可以在同一个线程中多次获取锁而不会导致死锁。
  • Condition 类:表示条件变量对象,用于在线程之间进行协调和同步,可以使用 wait、notify 和 notify_all 方法来等待和通知其他线程。
  • Event 类:表示事件对象,用于线程之间的通信和同步,可以使用 set 和 clear 方法来设置和清除事件状态,使用 wait 方法来等待事件触发。
  • Timer 类:表示定时器对象,用于在指定时间后触发一个函数,可以使用 start 和 cancel 方法来启动和取消定时器。


使用 threading 模块可以方便地创建和控制多个线程,实现并发执行的程序。但需要注意多线程编程可能存在的竞态条件、死锁等问题,需要合理使用锁、条件变量等同步机制来保证程序的正确性和稳定性。


2-1、使用threading.Thread()方法开启线程


使用 threading.Thread() 方法可以创建线程对象并启动线程。以下是详细的使用方法:

  • 创建 Thread 对象

创建 Thread 对象时,需要提供一个可调用对象(通常是一个函数)作为线程的执行函数。可以通过直接传递函数名或使用 lambda 表达式来创建可调用对象,使用threading.Thread()创建


启动线程


创建 Thread 对象后,可以通过调用start()方法启动线程。


等待线程结束


如果需要等待一个线程执行结束,可以使用)join()方法。join() 方法会阻塞当前线程,直到被调用的线程执行结束。


以下为案例分析

# 导入threading类
import threading
import time
def thread_job():
    print('T1 start\n')
    for i in range(10):
        time.sleep(0.1)
    print('T1 finish\n')
def T2_job():
    print('T2 start\n')
    print('T2 finish\n')
def main():
  # 每个Thread对象都代表一个线程。每个线程我们可以让程序处理不同的任务,这样就是多线程编程。
  # 将需要被调用的函数传递给参数target。
  # name: 线程的名字。
  # args=(): 使用args可以传入实参。
    added_thread = threading.Thread(target=thread_job, name='T1')
    thread2 = threading.Thread(target=T2_job, name='T2')
    # 调用start方法来让线程启动。
    added_thread.start()
    thread2.start()
    print('all done\n')
if __name__ == '__main__':
    main()


输出

T1 start

T2 start

all done

T2 finish

T1 finish

Tips:默认情况下,调用start方法使得线程开始后,并不需要等待该线程执行完毕就会往下执行,所以输出看起来没那么规则。


2-2、使用join()方法来阻塞进程

# 上边的代码几个线程是同时运行的,如果让一个先运行,一个后运行,应该怎么做呢?
import threading
import time
def thread_job():
    print('T1 start\n')
    for i in range(10):
        time.sleep(0.1)
    print('T1 finish\n')
def T2_job():
    print('T2 start\n')
    print('T2 finish\n')
def main():
    added_thread = threading.Thread(target=thread_job, name='T1')
    thread2 = threading.Thread(target=T2_job, name='T2')
    added_thread.start()
    # 调用join函数可以使得该线程结束后才会接着向下执行。
    added_thread.join()
    thread2.start()
    thread2.join()
    print('all done\n')
if __name__ == '__main__':
    main()

输出

T1 start

T1 finish

T2 start

T2 finish

all done

Tips:这样看起来规则了,但是这和不使用线程直接执行函数好像没什么区别了。


2-3、其他threading模块常用方法


  • threading.current_thread():
    返回当前线程对象。
  • threading.active_count():
    返回当前线程总数,包括主线程和所有子线程。
  • threading.enumerate():
    返回一个包含所有当前活动线程的列表。
  • threading.Lock():
    创建一个锁对象,可以用来保护共享资源,防止多个线程同时访问。
  • threading.RLock():
    创建一个可重入锁对象,可以被同一个线程多次获取锁,主要用于递归函数。
  • threading.Condition(lock=None):
    创建一个条件变量对象,可以用来实现多个线程之间的协作。
  • threading.Event():
    创建一个事件对象,可以用来实现线程间的同步。
  • threading.Timer(interval, function, args=[], kwargs={}):
    创建一个定时器对象,用于在指定时间后执行某个函数。


三、GIL锁

3-1、什么是GIL?


GIL即全局解释器锁,每个线程在执行时候都需要先获取GIL,保证同一时刻只有一个线程可以执行代码,即同一时刻只有一个线程使用CPU,也就是说多线程并不是真正意义上的同时执行。


3-2、通过threading.Lock()保证线程同步

目的:为了协调各个线程修改同一份数据。

创建锁:lock = threading.Lock()

锁定和释放:lock.acquire()和lock.release()


参考文章:

Python多线程库threading的使用.

进程和线程的区别(超详细).

Python多线程编程(一):threading 模块 Thread 类的用法详解.

Python 多线程编程(二):threading 模块中 Lock 类的用法详解.

Python多线程之threading.Thread()基本使用.


总结

Lock类这一块后续用的上的时候再研究吧,暂时还没用到,有需要的,看倒数第二篇参考文章噢。

相关文章
|
3天前
|
设计模式 安全 PHP
PHP 7新特性深度解析与应用实践
【6月更文挑战第29天】在PHP 7的发布中,开发者社区迎来了一场性能与功能的盛宴。本文将深入挖掘PHP 7的新特性,从类型声明的强化到异常处理的改进,再到匿名类的引入,我们将一一探讨这些变化如何影响日常编码实践。通过实际代码示例,我们将展示如何有效利用这些新特性来编写更加清晰、高效和安全的PHP代码。
22 11
|
1天前
|
数据可视化 安全 Linux
探索Linux命令repo-graph:深入解析与应用实践
`repo-graph`是Linux的Yum-utils工具,用于可视化仓库中软件包的依赖关系,简化复杂网络管理。它通过分析元数据生成图形,支持自定义输出格式和特定包分析。例如,`repo-graph --repoid=updates`显示更新仓库的依赖,而`--packages=httpd`则专注httpd包。注意权限、复杂性和选择合适输出格式。定期分析和图形化展示是最佳实践。
|
1天前
|
缓存 安全 编译器
PHP 8新特性解析与性能优化实践
PHP 8的发布带来了一系列新特性和性能改进,本文将深入探讨PHP 8的关键特性,如JIT编译器、类型系统的增强和语言语法的优化,以及如何利用这些特性优化现有代码和提升应用性能。
6 1
|
1天前
|
安全 算法 编译器
PHP 8新特性深度解析与实践应用
【7月更文挑战第2天】本文深入探讨了PHP 8带来的革新性特性,包括JIT编译器的引入、联合类型和属性的声明等。文章不仅剖析了这些新特性背后的技术原理,还通过实例展示了如何在现实项目中有效利用它们来提升代码质量和执行效率。读者将获得对PHP 8新特性的全面认识以及如何在实际开发中灵活运用它们的实用指南。
7 1
|
4天前
|
Java 程序员 编译器
Java内存模型深度解析与实践优化策略
在多线程编程领域,Java内存模型(Java Memory Model, JMM)是确保并发程序正确性的基石。本文深入探讨JMM的工作原理,结合最新研究成果和实际案例,揭示高效同步策略和避免常见并发缺陷的方法。文章不仅阐述理论,更注重实践,旨在为Java开发者提供全面的内存模型应用指南。
|
5天前
|
设计模式 Java 中间件
深入探索Java设计模式:责任链模式解析与实践
深入探索Java设计模式:责任链模式解析与实践
7 0
|
5天前
|
前端开发 程序员 UED
全面解析layui:掌握基础知识与实用技能(1. 核心组件与模块 2. 布局与容器 3. 弹出层与提示框;1. 数据表格与数据表单 2. 表单验证与提交 3. 图片轮播与导航菜单)
全面解析layui:掌握基础知识与实用技能(1. 核心组件与模块 2. 布局与容器 3. 弹出层与提示框;1. 数据表格与数据表单 2. 表单验证与提交 3. 图片轮播与导航菜单)
6 0
|
5天前
|
监控 Linux 应用服务中间件
探索Linux中的`ps`命令:进程监控与分析的利器
探索Linux中的`ps`命令:进程监控与分析的利器
|
5天前
|
Web App开发 运维 监控
深入探索Linux命令pwdx:揭秘进程工作目录的秘密
`pwdx`命令在Linux中用于显示指定进程的工作目录,基于`/proc`文件系统获取实时信息。简单易用,如`pwdx 1234`显示PID为1234的进程目录。结合`ps`和`pgrep`等命令可扩展使用,如查看所有进程或特定进程(如Firefox)的目录。使用时注意权限、进程ID的有效性和与其他命令的配合。查阅`man pwdx`获取更多帮助。
|
6天前
|
存储 Shell Linux
Linux进程概念(下)
本文详细的介绍了环境变量和进程空间的概念及其相关的知识。
15 0
Linux进程概念(下)

推荐镜像

更多