python基础篇:多线程的基本使用

本文涉及的产品
服务治理 MSE Sentinel/OpenSergo,Agent数量 不受限
可观测可视化 Grafana 版,10个用户账号 1个月
简介: python基础篇:多线程的基本使用

Python多线程是一种并发编程的方式,可以让程序同时执行多个任务。在Python中,多线程可以使用标准库中的threading模块来实现。本文将介绍如何使用threading模块来创建和管理线程。

创建线程

在Python中,创建线程可以通过创建Thread对象来实现。Thread对象有一个target参数,指定线程要执行的函数。例如:

import threading

def print_numbers():
    for i in range(10):
        print(i)

thread = threading.Thread(target=print_numbers)
thread.start()

在这个例子中,我们创建了一个名为print_numbers的函数,并将其作为Thread对象的target参数传递。然后我们调用start()方法来启动线程。当线程启动后,它将调用print_numbers函数来执行任务。

传递参数

有时候我们需要在线程中传递参数。可以通过在Thread对象的args参数中传递参数。例如:

import threading

def print_numbers(start, end):
    for i in range(start, end):
        print(i)

thread = threading.Thread(target=print_numbers, args=(1, 10))
thread.start()

在这个例子中,我们传递了start和end两个参数给print_numbers函数。将这些参数作为元组传递给args参数,即args=(1, 10)。在print_numbers函数中,我们使用这些参数来打印数字。

线程同步

在多线程编程中,线程之间可能会访问共享资源。如果没有适当的同步机制,可能会导致竞态条件和死锁等问题。Python提供了多种同步机制,例如锁(Lock)、信号量(Semaphore)和条件变量(Condition)等。这里以锁为例,介绍如何在Python中使用锁来实现线程同步。

import threading

x = 0
lock = threading.Lock()

def increment():
    global x
    for i in range(100000):
        lock.acquire()
        x += 1
        lock.release()

def decrement():
    global x
    for i in range(100000):
        lock.acquire()
        x -= 1
        lock.release()

thread1 = threading.Thread(target=increment)
thread2 = threading.Thread(target=decrement)
thread1.start()
thread2.start()
thread1.join()
thread2.join()
print(x)

在这个例子中,我们定义了两个函数increment和decrement,分别对全局变量x进行加一和减一操作。为了避免竞态条件,我们使用Lock对象来控制对x的访问。在increment和decrement函数中,我们调用acquire()方法来获取锁,然后进行相应的操作,最后调用release()方法来释放锁。这样,每个线程在访问x时都会先获得锁,从而避免了竞态条件。
在这个例子中,我们创建了两个线程thread1和thread2,分别执行increment和decrement函数。我们通过调用start()方法来启动线程,然后通过调用join()方法来等待线程执行完毕。最后,我们打印x的值,以检查线程同步是否正确。

线程池

在Python中,可以使用ThreadPoolExecutor类来创建线程池,以便同时执行多个任务。ThreadPoolExecutor可以自动管理线程的数量和生命周期,从而避免创建过多线程导致系统负载过高的问题。以下是一个简单的示例:

import concurrent.futures

def print_numbers(start, end):
    for i in range(start, end):
        print(i)

with concurrent.futures.ThreadPoolExecutor(max_workers=2) as executor:
    executor.submit(print_numbers, 1, 5)
    executor.submit(print_numbers, 6, 10)

在这个例子中,我们使用ThreadPoolExecutor创建了一个最大工作线程数为2的线程池。然后我们通过调用submit()方法来提交两个任务,分别打印1到5和6到10之间的数字。submit()方法返回一个Future对象,用于表示任务的执行状态和结果。在这个例子中,我们没有使用Future对象来获取任务的结果,而是直接打印数字。

Future对象的作用

Future对象是在Python标准库中的concurrent.futures模块中提供的一种异步编程工具,用于表示一个尚未完成的异步操作的状态和结果。

当一个任务被提交到线程池或者进程池中时,会立即返回一个Future对象。这个对象可以用于查询任务的状态和结果。Future对象有以下几种状态:

  • PENDING:任务尚未开始执行。
  • RUNNING:任务正在执行。
  • CANCELLED:任务已被取消。
  • FINISHED:任务已完成,可能成功也可能失败。

当任务完成后,Future对象会保存任务的结果,可以通过调用result()方法来获取。如果任务尚未完成,调用result()方法会阻塞当前线程,直到任务完成并返回结果或者抛出异常。

除了result()方法之外,Future对象还提供了一些其他的方法,例如cancel()方法可以用于取消任务,done()方法用于检查任务是否完成,add_done_callback()方法可以用于注册回调函数,当任务完成时自动调用。

综合演示例子

面是一个综合的例子,演示如何使用concurrent.futures模块中的ThreadPoolExecutor和Future对象来实现并发下载图片的功能。

import requests
import concurrent.futures

def download_image(url):
    response = requests.get(url)
    if response.status_code == 200:
        filename = url.split("/")[-1]
        with open(filename, "wb") as f:
            f.write(response.content)
        return filename

urls = [
    "https://picsum.photos/200/300",
    "https://picsum.photos/250/350",
    "https://picsum.photos/300/400",
    "https://picsum.photos/350/450",
    "https://picsum.photos/400/500",
]

with concurrent.futures.ThreadPoolExecutor() as executor:
    futures = [executor.submit(download_image, url) for url in urls]
    for future in concurrent.futures.as_completed(futures):
        filename = future.result()
        if filename:
            print(f"{filename} downloaded successfully!")
  • 在这个例子中,我们定义了一个download_image()函数,用于下载指定URL对应的图片,并将图片保存到本地文件系统中。然后我们定义了一个URL列表urls,包含了要下载的五张图片的URL地址。

  • 接下来,我们使用ThreadPoolExecutor创建一个线程池,并使用submit()方法提交五个下载任务。submit()方法返回一个Future对象,代表了提交的任务。我们将所有的Future对象保存在一个列表中。

  • 然后,我们使用as_completed()函数遍历所有的Future对象,并在每个Future对象完成后调用result()方法获取结果。如果下载成功,就打印出文件名。

通过使用ThreadPoolExecutor和Future对象,我们可以同时下载多个图片,从而提高下载速度。同时,使用Future对象可以让我们方便地处理每个任务的结果,从而实现更加灵活的异步编程。

总结

本文介绍了如何在Python中使用threading模块来创建和管理线程,包括传递参数、线程同步和线程池等方面。同时,我们也介绍了一些常见的多线程编程问题,例如竞态条件和死锁等,以及如何使用锁来避免这些问题。在实际编程中,需要根据具体情况选择适当的同步机制和线程池配置,以提高程序的性能和稳定性。

目录
相关文章
聊聊python多线程与多进程
为什么要使用多进程与多线程呢? 因为我们如果按照流程一步步执行任务实在是太慢了,假如一个任务就是10秒,两个任务就是20秒,那100个任务呢?况且cpu这么贵,时间长了就是浪费生命啊!一个任务比喻成一个人,别个做高铁,你做绿皮火车,可想而知!接下来我们先看个例子:
|
17天前
|
Python
|
4天前
|
分布式计算 安全 Java
Python 多线程
Python 多线程
12 0
|
5天前
|
存储 开发者 Python
Python函数的基本使用及其重要性
Python函数的基本使用及其重要性
|
5天前
|
数据采集 存储 C++
单线程 vs 多进程:Python网络爬虫效率对比
本文探讨了Python网络爬虫中的单线程与多进程应用。单线程爬虫实现简单,但处理速度慢,无法充分利用多核CPU。而多进程爬虫通过并行处理提高效率,更适合现代多核架构。代码示例展示了如何使用代理IP实现单线程和多进程爬虫,显示了多进程在效率上的优势。实际使用时还需考虑代理稳定性和反爬策略。
单线程 vs 多进程:Python网络爬虫效率对比
|
6天前
|
Python
深度解析Python中的多线程编程
深度解析Python中的多线程编程
29 1
|
10天前
|
并行计算 Python
Python并发编程与多线程
Python编程中,多线程和并发编程是优化复杂任务执行的关键。借助标准库中的`threading`模块,可实现多线程,如示例所示,创建线程并执行函数。然而,由于全局解释器锁(GIL),多线程在CPU密集型任务中并不高效。对于I/O密集型任务,多线程仍能提高效率。为充分利用多核,可采用多进程(如`multiprocessing`模块)或异步编程。选择技术时需依据任务类型和性能需求。
|
10天前
|
消息中间件 安全 调度
基于Python的性能优化(线程、协程、进程)
一、多线程 在CPU不密集、IO密集的任务下,多线程可以一定程度的提升运行效率。
|
12天前
|
监控 数据可视化 Java
Python中的线程池与进程池
【5月更文挑战第19天】本文探讨Python中提高程序性能的关键——线程池和进程池。线程池与进程池是并行编程工具,有效利用多核处理器,加速程序执行。线程是运算调度单位,进程是资源分配和调度基础。线程池与进程池管理线程和进程,减少创建销毁开销。
22 0
|
17天前
|
机器学习/深度学习 Java 数据挖掘
selenium的配置与基本使用(1),2024年最新网易Python面试必问
selenium的配置与基本使用(1),2024年最新网易Python面试必问