【Python之旅】第六篇(三):Python多线程及其使用方法

简介:

1.Python中的多线程

    执行一个程序,即在操作系统中开启了一个进程,在某一时刻,一个CPU内核只能进行一个进程的任务,现在的计算机所说的多进程/多任务其实是通过加快CPU的执行速度来实现的,因为一个CPU每秒能执行上亿次的计算,能够对进程进行很多次切换,所以在人为可以感知的时间里,看上去,计算机确实是在同时执行多个程序,即同时处理多个进程。

    一个进程中可以包含有多个线程,这多个线程为实现该进程的某个主要功能而运行着,多个线程可以进行串行工作,也可以并发同时进行工作,显然后者可以节省更多的时间。

    在Python中是支持多线程并发执行的,只是Python中的多线程只能利用单核,也就是说Python中的某一个进程的多个线程只能在一个CPU核心上运行,而不能分配在多个CPU核心中运行,这是考虑到线程安全的缘故,而Python中的GIL则保证了线程安全。关于Python中的GIL,可以参考下面一篇文章:《浅析Python的GIL和线程安全》

   下面是自己在学习过程中的一些课堂笔记,因为还没有真正学习一些理论,所以可能会有些错误,但目前是方便自己的理解:

1
2
3
4
5
6
7
8
9
即GLI是以CPU核心为单位来控制全局锁,所以是不能跨不同的CPU(核心 )的
GLI可以保证同一个进程中,某一个线程的共享数据在某一时刻只能同时被另外一个线程修改(使用),
而不能同时被多个线程修改(使用),如果去掉GLI,则需要自己为线程加锁,这样之后,性能比原来还要差。
当然,难道就不能充分利用多核CPU或多个CPU了?
做成多进程就可以了,不同的进程运行在不同的CPU(核心)上,也可以实现并发,
只是这样的话就会比较浪费内存空间,考虑同时运行 10 个QQ程序的情况,
假如 1 个QQ占用500M的内存空间,则 10 个QQ就要占用5G的内存空间了。但如果是多线程的话,
可能 10 个QQ还是共享着这500M的内存空间。还有一个缺点就是,多进程间的数据直接访问可能
会比较麻烦,但其实也是可以实现的,比如chrome浏览器就是用多进程实现的。

     目前首先要明确的是,Python中是不能把一个进程的多个线程分布在不同的CPU核心上运行的。


2.Python多线程使用方法1

    给出下面的程序代码及注释:

1
2
3
4
5
6
7
8
9
10
import  threading    #Python多线程模块
import  time
 
def run(num):
     print  'Hi, I am thread %s..lalala'  % num
     time.sleep( 1 )
 
for  in  range( 20 ):
     t = threading.Thread(target=run, args=(i,))    #多线程使用方法,target为需要执行多线程的函数,args为函数中的参数,注意这里的参数写成(i,),即如果只能一个参数,也要加上一个 ","
     t.start()    #开始执行多线程

    程序运行结果如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
xpleaf@xpleaf-machine:/mnt/hgfs/Python/day6$ python thread4.py 
Hi, I am thread  0 ..lalala
Hi, I am thread  1 ..lalala
Hi, I am thread  2 ..lalala
Hi, I am thread  3 ..lalala
Hi, I am thread  4 ..lalala
Hi, I am thread  5 ..lalala
Hi, I am thread  6 ..lalala
Hi, I am thread  7 ..lalala
Hi, I am thread  8 ..lalala
Hi, I am thread  9 ..lalala
Hi, I am thread  10 ..lalala
Hi, I am thread  11 ..lalala
Hi, I am thread  12 ..lalala
Hi, I am thread  13 ..lalala
Hi, I am thread  14 ..lalala
Hi, I am thread  15 ..lalala
Hi, I am thread  16 ..lalala
Hi, I am thread  17 ..lalala
Hi, I am thread  18 ..lalala
Hi, I am thread  19 ..lalala

    直接看执行结果是看不出什么的,这里说一下这个程序的执行过程:0到19是同时打印输入的,在打印19后,程序sleep 1秒后才结束程序的运行。

    上面这个程序有20个线程执行,每个线程都是:打印字符串+sleep(1)。我们实际看到的结果是0到19同时打印,然后才sleep 1秒,但是需要注意的是,并非是20个线程才执行一次sleep(1),而是在每个线程中都执行了一次sleep(1),即该程序实际上是执行了20次sleep(1),而我们实际看到的结果是程序运行时仅仅是暂停了1秒,那是因为这20次sleep(1)是并发执行的。

    上面的程序可以这么去理解:20个线程相当于有20匹马,20匹马同时起跑(打印字符串),然后以同时停1秒(sleep(1)),最后同时到达终点(20个线程运行结束,即程序执行结束)。

    为了更好的理解上面的程序,可以把上面的代码改为如下:

1
2
3
4
5
6
7
8
9
10
11
import  threading
import  time
 
def run(num):
     print  'Hi, I am thread %s..lalala'  % num
     time.sleep( 1 )
 
for  in  range( 20 ):
     t = threading.Thread(target=run, args=(i,))
     t.start()
     t.join()    #等上一个线程执行完后再执行下一个线程

    执行结果如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
xpleaf@xpleaf-machine:/mnt/hgfs/Python/day6$ python thread4.py 
Hi, I am thread  0 ..lalala
Hi, I am thread  1 ..lalala
Hi, I am thread  2 ..lalala
Hi, I am thread  3 ..lalala
Hi, I am thread  4 ..lalala
Hi, I am thread  5 ..lalala
Hi, I am thread  6 ..lalala
Hi, I am thread  7 ..lalala
Hi, I am thread  8 ..lalala
Hi, I am thread  9 ..lalala
Hi, I am thread  10 ..lalala
Hi, I am thread  11 ..lalala
Hi, I am thread  12 ..lalala
Hi, I am thread  13 ..lalala
Hi, I am thread  14 ..lalala
Hi, I am thread  15 ..lalala
Hi, I am thread  16 ..lalala
Hi, I am thread  17 ..lalala
Hi, I am thread  18 ..lalala
Hi, I am thread  19 ..lalala

    执行结果看上去跟前面是一样的,但执行过程却是这样的:每打印一次字符串,再暂停一秒

    通过这个程序,也就可以更好的理解Python的多线程并发执行了,当然,因为这是一个动态的过程,所以把程序执行一遍后会有更好的理解。


3.Python多线程使用方法2

    程序代码如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
import  threading,time
 
class  MyThread(threading.Thread):
     def __init__(self, num):
         threading.Thread.__init__(self)
         self.num = num
 
     def run(self): # this  name must be  'run'
         print  'I am thread %s'  % self.num
         time.sleep( 2 )
 
for  in  range( 20 ):
     t = MyThread(i)
     t.start()

    程序的执行结果与方法1是一样的,这里就不给出了,只是这里利用了面向对象编程的思想方法来设计程序代码。

相关文章
|
11天前
|
算法 Java Docker
(Python基础)新时代语言!一起学习Python吧!(三):IF条件判断和match匹配;Python中的循环:for...in、while循环;循环操作关键字;Python函数使用方法
IF 条件判断 使用if语句,对条件进行判断 true则执行代码块缩进语句 false则不执行代码块缩进语句,如果有else 或 elif 则进入相应的规则中执行
88 1
|
3月前
|
数据采集 存储 JSON
Python爬取知乎评论:多线程与异步爬虫的性能优化
Python爬取知乎评论:多线程与异步爬虫的性能优化
|
3月前
|
人工智能 安全 调度
Python并发编程之线程同步详解
并发编程在Python中至关重要,线程同步确保多线程程序正确运行。本文详解线程同步机制,包括互斥锁、信号量、事件、条件变量和队列,探讨全局解释器锁(GIL)的影响及解决线程同步问题的最佳实践,如避免全局变量、使用线程安全数据结构、精细化锁的使用等。通过示例代码帮助开发者理解并提升多线程程序的性能与可靠性。
128 0
|
3月前
|
数据采集 监控 调度
干货分享“用 多线程 爬取数据”:单线程 + 协程的效率反超 3 倍,这才是 Python 异步的正确打开方式
在 Python 爬虫中,多线程因 GIL 和切换开销效率低下,而协程通过用户态调度实现高并发,大幅提升爬取效率。本文详解协程原理、实战对比多线程性能,并提供最佳实践,助你掌握异步爬虫核心技术。
|
4月前
|
JSON 算法 Java
打造终端里的下载利器:Python实现可恢复式多线程下载器
在数字时代,大文件下载已成为日常需求。本文教你用Python打造专业级下载器,支持断点续传、多线程加速、速度限制等功能,显著提升终端下载体验。内容涵盖智能续传、多线程分块下载、限速控制及Rich库构建现代终端界面,助你从零构建高效下载工具。
274 1
|
3月前
|
数据采集 存储 Java
多线程Python爬虫:加速大规模学术文献采集
多线程Python爬虫:加速大规模学术文献采集
|
4月前
|
数据采集 网络协议 前端开发
Python多线程爬虫模板:从原理到实战的完整指南
多线程爬虫通过并发请求大幅提升数据采集效率,适用于大规模网页抓取。本文详解其原理与实现,涵盖任务队列、线程池、会话保持、异常处理、反爬对抗等核心技术,并提供可扩展的Python模板代码,助力高效稳定的数据采集实践。
208 0
|
9月前
|
并行计算 安全 Java
Python GIL(全局解释器锁)机制对多线程性能影响的深度分析
在Python开发中,GIL(全局解释器锁)一直备受关注。本文基于CPython解释器,探讨GIL的技术本质及其对程序性能的影响。GIL确保同一时刻只有一个线程执行代码,以保护内存管理的安全性,但也限制了多线程并行计算的效率。文章分析了GIL的必要性、局限性,并介绍了多进程、异步编程等替代方案。尽管Python 3.13计划移除GIL,但该特性至少要到2028年才会默认禁用,因此理解GIL仍至关重要。
595 16
Python GIL(全局解释器锁)机制对多线程性能影响的深度分析
|
8月前
|
Python
python3多线程中使用线程睡眠
本文详细介绍了Python3多线程编程中使用线程睡眠的基本方法和应用场景。通过 `time.sleep()`函数,可以使线程暂停执行一段指定的时间,从而控制线程的执行节奏。通过实际示例演示了如何在多线程中使用线程睡眠来实现计数器和下载器功能。希望本文能帮助您更好地理解和应用Python多线程编程,提高程序的并发能力和执行效率。
283 20

推荐镜像

更多