Python 编程 | 连载 26 - Python 多线程

简介: Python 编程 | 连载 26 - Python 多线程

一、多线程

线程是系统的最小调度单元,线程相比进程来说,对于资源的消耗低。线程可以通过threading模块下Thread函数来创建,线程对象的相关方法有:

  • Thread:创建线程,入参需要传入函数名以及函数的参数,返回一个线程对象
  • start:启动线程
  • join:阻塞直到线程执行结束
  • getName:获取线程名
  • setName:设置线程名
  • is_alive:判断线程是否存活
  • setDaemon:守护线程

通过random.choice函数选中一个列中的元素,从列表中移除该元素并加入另外一个列表,直至列表为空。

import random, time
heros = ['stark', 'clint', 'thor', 'hulk', 'widow', 'captain', 'park', 'loki', 'strange', 'wanda']
_heros = []
def create():
    if len(heros) == 0:
        return
    hero = random.choice(heros)
    heros.remove(hero)
    print('移除的元素为:{}'.format(hero))
    _heros.append(hero)
    time.sleep(1)
if __name__ == '__main__':
    start = time.time()
    for i in range(len(heros)):
        create()
    print('heros: {}'.format(heros))
    print('_heros: {}'.format(_heros))
    end = time.time()
    print('耗时: {}'.format(end - start))
复制代码

28e1f3b462a2442fac68393b5c58dd6a_tplv-k3u1fbpfcp-zoom-in-crop-mark_4536_0_0_0.png

使用多线程方式处理,首先导入threading模块,修改main函数中的代码。

if __name__ == '__main__':
    start = time.time()
    threads = []
    for i in range(len(heros)):
        # 创建线程执行任务
        thread = threading.Thread(target=create)
        threads.append(thread)
        thread.start()
        print('线程名为:{}'.format(thread.getName()))
    for thread in threads:
        thread.join()
        # create()
    print('heros: {}'.format(heros))
    print('_heros: {}'.format(_heros))
    end = time.time()
    print('耗时: {}'.format(end - start))
复制代码

image.png

循环创建了10个线程,每个线程都去执行任务,整个耗时非常短。

通过线程执行任务存在的问题:

  • 函数无法获取返回值
  • 多个线程同时修改文件可能造成数据混乱
  • 线程太多可能会造成资源不足

二、线程之间的通信

线程之间通信同样需要使用到队列。

import threading, time, queue, random
def send():
    while True:
        mes = random.randint(1, 10)
        print('send message {}'.format(mes))
        queue.put(mes)
        time.sleep(1)
def receive():
    while True:
        x = queue.get()
        print('receive {}'.format(x))
        time.sleep(1)
if __name__ == '__main__':
    queue = queue.Queue()
    t1 = threading.Thread(target=send)
    t2 = threading.Thread(target=receive)
    t1.start()
    t2.start()
    t1.join()
    t2.join()
复制代码

image.png

线程池的创建

线程池可以避免线程创建和销毁带来的消耗,线程池需要通过futures.ThreadPoolExecutir方法来创建,线程池相关的方法有

  • futures.ThreadPoolExecutor:创建线程池
  • submit:往线程池中加入任务
  • done:判断线程池中的某个线程是否完成任务
  • result:获取线程执行的结果

首先导入concurrent.futures.thread包

import time, threading
from concurrent.futures.thread import ThreadPoolExecutor
def hallo(info):
    print(info)
    time.sleep(1)
if __name__ == '__main__':
    # 创建线程池
    pool = ThreadPoolExecutor(2)
    for i in range(20):
        pool.submit(hallo, ('Mark {}'.format(i)))
复制代码

image.png

控制台输出结果时几乎是两条信息同时打印,这是因为此时有两个线程正在执行任务。

# 创建一个线程锁
lock = threading.Lock()
def hallo(info):
    # 上锁
    lock.acquire()
    print(info)
    time.sleep(1)
    # 开锁
    lock.release()
复制代码

image.png

上了线程锁,就只能一个一个的执行了。

修改hallo()函数,返回info参数,并将上锁和解锁代码注释

# 其余代码不变
def hallo(info):
    # 上锁
    # lock.acquire()
    # print(info)
    time.sleep(1)
    # 开锁
    # lock.release()
    # print('PID:{}'.format(os.getpid()))
    return info
if __name__ == '__main__':
    # hallo()函数返回结果的列表
    results = []
    # 创建线程池
    pool = ThreadPoolExecutor(2)
    for i in range(20):
        res = pool.submit(hallo, ('Mark {}'.format(i)))
        results.append(res)
    print(res)
    print(dir(res))
    print('是否执行结束:{}'.format(res.done()))
    # 遍历结果列表
    for res in results:
        print('遍历结果列表:{}'.format(res.result()))
    print('是否执行结束:{}'.format(res.done()))
复制代码

image.png

线程池通过submit提交一个任务执行,返回一个Future对象,可以从该对象中通过调用result()函数获取任务执行的返回值。

GIL全局锁

Python 解释器在执行的时候自动加的一把锁,造成Python中的多线程无法在多个core执行,只能在一个core上执行,这把锁就是GIL锁。GIL是全局解释器锁,并不是Python的特性,它是在Cpython解释器里引入的一个概念,而在其他语言编写的解释器里没有GIL。

GIL锁的作用:

  • 单一CPU工作
  • 确保线程安全

pypy解释器是没有GIL全局锁的,但是不推荐使用pypy解释器,推荐多进程+多线程的方式,通过多个进程在多个CPU上执行,每个进程在执行多个线程。

在CPython解释其中,当Python代码有一个线程开始访问解释器的时候,GIL就会给这个线程上锁,此时此刻线程只能等着,无法对解释器的资源进行访问,需要等待线程分配时间,这个线程把锁释放,另外的线程才开始运行。

三、异步

异步是相对于同步而言的,同步既指程序按照顺序一步一步往下执行,异步就是无序,无序等待上一步完成之后才可以执行下一步。

异步编程是一种并发编程的模式,其关注点是通过调度不同任务之间的执行和等待时间,通过减少处理器的闲置时间来达到减少整个程序的执行时间;异步编程跟同步编程模型最大的不同就是其任务的切换,当遇到一个需要等待长时间执行的任务的时候,我们可以切换到其他的任务执行。

asyncio 异步模块

async与await关键字:

  • async:定义异步
  • await:执行异步

相关函数:

  • gather:将异步函数批量执行,返回一个列表,既函数执行结果的列表
  • run:执行主异步函数,返回值是函数执行的返回值
import time, random
def zulu():
    for i in range(10):
        print('Zulu {}'.format(i))
        time.sleep(random.random() * 2)
    return 'zulu'
def tango():
    for i in range(10):
        print('Tango {}'.format(i))
        time.sleep(random.random() * 2)
    return 'tango'
if __name__ == '__main__':
    start = time.time()
    zulu()
    tango()
    end = time.time()
    print('耗时:{}'.format(end-start))
复制代码

image.png

将同步改为异步执行的方式

async def zulu():
    for i in range(10):
        print('Zulu {}'.format(i))
        await asyncio.sleep(random.random() * 2)
    return 'zulu'
async def tango():
    for i in range(10):
        print('Tango {}'.format(i))
        await asyncio.sleep(random.random() * 2)
    return 'tango'
async def main():
    result = await asyncio.gather(
        zulu(),
        tango()
    )
    print(result)
if __name__ == '__main__':
    start = time.time()
    # zulu()
    # tango()
    asyncio.run(main())
    end = time.time()
    print('耗时:{}'.format(end-start))
复制代码

image.png

zulu()和tango()两个函数交互执行,时间缩短一半

分别在zulu函数中和mian函数中打印出pid。

image.png

与多线程和多进程编程模型相比,异步编程只是在同一个线程之内的的任务调度

gevent 异步模块

gevent异步包需要通过pip进行安装

python3 -m pip install gevent -i https://pypi.tuna.tsinghua.edu.cn/simple
复制代码

gevent 异步模块常用方法:

  • spawn:创建协程对象,参数为func以及传入函数的参数,返回一个协程对象
  • joinall:批量处理协程对象
  • get:获取函数返回结果
  • value:属性,也可以获取函数返回值
  • join:阻塞等待异步程序结束
  • kill:杀掉当前协程
  • dead:判断当前协程是否销毁
import time, random, os
import gevent
def zulu_gevent():
    for i in range(10):
        print('Zulu Gevent, PID:{}'.format(os.getpid()))
        gevent.sleep(random.random() ** 2)
    return 'Zulu with Gevent'
def tango_gevent():
    for i in range(10):
        print('Tango Gevent, PID:{}'.format(os.getpid()))
        gevent.sleep(random.random() ** 2)
    return 'Tango with Gevent'
if __name__ == '__main__':
    start = time.time()
    zulu = gevent.spawn(zulu_gevent)
    tango = gevent.spawn(tango_gevent)
    res_gevent = [zulu, tango]
    res = gevent.joinall(res_gevent)
    print(res)
    print(res[0].value)
    print(res[1].get())
    end = time.time()
    print('耗时:{}'.format(end - start))
    print('PID:{}'.format(os.getpid()))
复制代码

image.png

调用value属性可以从协程对象中获取函数的返回值。


相关文章
|
2月前
|
Java
如何在Java中进行多线程编程
Java多线程编程常用方式包括:继承Thread类、实现Runnable接口、Callable接口(可返回结果)及使用线程池。推荐线程池以提升性能,避免频繁创建线程。结合同步与通信机制,可有效管理并发任务。
149 6
|
3月前
|
数据采集 机器学习/深度学习 人工智能
Python:现代编程的首选语言
Python:现代编程的首选语言
287 102
|
3月前
|
数据采集 机器学习/深度学习 算法框架/工具
Python:现代编程的瑞士军刀
Python:现代编程的瑞士军刀
312 104
|
3月前
|
人工智能 自然语言处理 算法框架/工具
Python:现代编程的首选语言
Python:现代编程的首选语言
257 103
|
3月前
|
机器学习/深度学习 人工智能 数据挖掘
Python:现代编程的首选语言
Python:现代编程的首选语言
193 82
|
2月前
|
Python
Python编程:运算符详解
本文全面详解Python各类运算符,涵盖算术、比较、逻辑、赋值、位、身份、成员运算符及优先级规则,结合实例代码与运行结果,助你深入掌握Python运算符的使用方法与应用场景。
179 3
|
2月前
|
数据处理 Python
Python编程:类型转换与输入输出
本教程介绍Python中输入输出与类型转换的基础知识,涵盖input()和print()的使用,int()、float()等类型转换方法,并通过综合示例演示数据处理、错误处理及格式化输出,助你掌握核心编程技能。
412 3
|
2月前
|
并行计算 安全 计算机视觉
Python多进程编程:用multiprocessing突破GIL限制
Python中GIL限制多线程性能,尤其在CPU密集型任务中。`multiprocessing`模块通过创建独立进程,绕过GIL,实现真正的并行计算。它支持进程池、队列、管道、共享内存和同步机制,适用于科学计算、图像处理等场景。相比多线程,多进程更适合利用多核优势,虽有较高内存开销,但能显著提升性能。合理使用进程池与通信机制,可最大化效率。
262 3
|
2月前
|
Java 调度 数据库
Python threading模块:多线程编程的实战指南
本文深入讲解Python多线程编程,涵盖threading模块的核心用法:线程创建、生命周期、同步机制(锁、信号量、条件变量)、线程通信(队列)、守护线程与线程池应用。结合实战案例,如多线程下载器,帮助开发者提升程序并发性能,适用于I/O密集型任务处理。
257 0
聊聊python多线程与多进程
为什么要使用多进程与多线程呢? 因为我们如果按照流程一步步执行任务实在是太慢了,假如一个任务就是10秒,两个任务就是20秒,那100个任务呢?况且cpu这么贵,时间长了就是浪费生命啊!一个任务比喻成一个人,别个做高铁,你做绿皮火车,可想而知!接下来我们先看个例子:

热门文章

最新文章

推荐镜像

更多