python基础篇:多线程的基本使用

本文涉及的产品
MSE Nacos/ZooKeeper 企业版试用,1600元额度,限量50份
服务治理 MSE Sentinel/OpenSergo,Agent数量 不受限
可观测监控 Prometheus 版,每月50GB免费额度
简介: python基础篇:多线程的基本使用

Python多线程是一种并发编程的方式,可以让程序同时执行多个任务。在Python中,多线程可以使用标准库中的threading模块来实现。本文将介绍如何使用threading模块来创建和管理线程。

创建线程

在Python中,创建线程可以通过创建Thread对象来实现。Thread对象有一个target参数,指定线程要执行的函数。例如:

import threading

def print_numbers():
    for i in range(10):
        print(i)

thread = threading.Thread(target=print_numbers)
thread.start()

在这个例子中,我们创建了一个名为print_numbers的函数,并将其作为Thread对象的target参数传递。然后我们调用start()方法来启动线程。当线程启动后,它将调用print_numbers函数来执行任务。

传递参数

有时候我们需要在线程中传递参数。可以通过在Thread对象的args参数中传递参数。例如:

import threading

def print_numbers(start, end):
    for i in range(start, end):
        print(i)

thread = threading.Thread(target=print_numbers, args=(1, 10))
thread.start()

在这个例子中,我们传递了start和end两个参数给print_numbers函数。将这些参数作为元组传递给args参数,即args=(1, 10)。在print_numbers函数中,我们使用这些参数来打印数字。

线程同步

在多线程编程中,线程之间可能会访问共享资源。如果没有适当的同步机制,可能会导致竞态条件和死锁等问题。Python提供了多种同步机制,例如锁(Lock)、信号量(Semaphore)和条件变量(Condition)等。这里以锁为例,介绍如何在Python中使用锁来实现线程同步。

import threading

x = 0
lock = threading.Lock()

def increment():
    global x
    for i in range(100000):
        lock.acquire()
        x += 1
        lock.release()

def decrement():
    global x
    for i in range(100000):
        lock.acquire()
        x -= 1
        lock.release()

thread1 = threading.Thread(target=increment)
thread2 = threading.Thread(target=decrement)
thread1.start()
thread2.start()
thread1.join()
thread2.join()
print(x)

在这个例子中,我们定义了两个函数increment和decrement,分别对全局变量x进行加一和减一操作。为了避免竞态条件,我们使用Lock对象来控制对x的访问。在increment和decrement函数中,我们调用acquire()方法来获取锁,然后进行相应的操作,最后调用release()方法来释放锁。这样,每个线程在访问x时都会先获得锁,从而避免了竞态条件。
在这个例子中,我们创建了两个线程thread1和thread2,分别执行increment和decrement函数。我们通过调用start()方法来启动线程,然后通过调用join()方法来等待线程执行完毕。最后,我们打印x的值,以检查线程同步是否正确。

线程池

在Python中,可以使用ThreadPoolExecutor类来创建线程池,以便同时执行多个任务。ThreadPoolExecutor可以自动管理线程的数量和生命周期,从而避免创建过多线程导致系统负载过高的问题。以下是一个简单的示例:

import concurrent.futures

def print_numbers(start, end):
    for i in range(start, end):
        print(i)

with concurrent.futures.ThreadPoolExecutor(max_workers=2) as executor:
    executor.submit(print_numbers, 1, 5)
    executor.submit(print_numbers, 6, 10)

在这个例子中,我们使用ThreadPoolExecutor创建了一个最大工作线程数为2的线程池。然后我们通过调用submit()方法来提交两个任务,分别打印1到5和6到10之间的数字。submit()方法返回一个Future对象,用于表示任务的执行状态和结果。在这个例子中,我们没有使用Future对象来获取任务的结果,而是直接打印数字。

Future对象的作用

Future对象是在Python标准库中的concurrent.futures模块中提供的一种异步编程工具,用于表示一个尚未完成的异步操作的状态和结果。

当一个任务被提交到线程池或者进程池中时,会立即返回一个Future对象。这个对象可以用于查询任务的状态和结果。Future对象有以下几种状态:

  • PENDING:任务尚未开始执行。
  • RUNNING:任务正在执行。
  • CANCELLED:任务已被取消。
  • FINISHED:任务已完成,可能成功也可能失败。

当任务完成后,Future对象会保存任务的结果,可以通过调用result()方法来获取。如果任务尚未完成,调用result()方法会阻塞当前线程,直到任务完成并返回结果或者抛出异常。

除了result()方法之外,Future对象还提供了一些其他的方法,例如cancel()方法可以用于取消任务,done()方法用于检查任务是否完成,add_done_callback()方法可以用于注册回调函数,当任务完成时自动调用。

综合演示例子

面是一个综合的例子,演示如何使用concurrent.futures模块中的ThreadPoolExecutor和Future对象来实现并发下载图片的功能。

import requests
import concurrent.futures

def download_image(url):
    response = requests.get(url)
    if response.status_code == 200:
        filename = url.split("/")[-1]
        with open(filename, "wb") as f:
            f.write(response.content)
        return filename

urls = [
    "https://picsum.photos/200/300",
    "https://picsum.photos/250/350",
    "https://picsum.photos/300/400",
    "https://picsum.photos/350/450",
    "https://picsum.photos/400/500",
]

with concurrent.futures.ThreadPoolExecutor() as executor:
    futures = [executor.submit(download_image, url) for url in urls]
    for future in concurrent.futures.as_completed(futures):
        filename = future.result()
        if filename:
            print(f"{filename} downloaded successfully!")
  • 在这个例子中,我们定义了一个download_image()函数,用于下载指定URL对应的图片,并将图片保存到本地文件系统中。然后我们定义了一个URL列表urls,包含了要下载的五张图片的URL地址。

  • 接下来,我们使用ThreadPoolExecutor创建一个线程池,并使用submit()方法提交五个下载任务。submit()方法返回一个Future对象,代表了提交的任务。我们将所有的Future对象保存在一个列表中。

  • 然后,我们使用as_completed()函数遍历所有的Future对象,并在每个Future对象完成后调用result()方法获取结果。如果下载成功,就打印出文件名。

通过使用ThreadPoolExecutor和Future对象,我们可以同时下载多个图片,从而提高下载速度。同时,使用Future对象可以让我们方便地处理每个任务的结果,从而实现更加灵活的异步编程。

总结

本文介绍了如何在Python中使用threading模块来创建和管理线程,包括传递参数、线程同步和线程池等方面。同时,我们也介绍了一些常见的多线程编程问题,例如竞态条件和死锁等,以及如何使用锁来避免这些问题。在实际编程中,需要根据具体情况选择适当的同步机制和线程池配置,以提高程序的性能和稳定性。

目录
相关文章
|
3月前
|
数据采集 存储 JSON
Python爬取知乎评论:多线程与异步爬虫的性能优化
Python爬取知乎评论:多线程与异步爬虫的性能优化
|
3月前
|
人工智能 安全 调度
Python并发编程之线程同步详解
并发编程在Python中至关重要,线程同步确保多线程程序正确运行。本文详解线程同步机制,包括互斥锁、信号量、事件、条件变量和队列,探讨全局解释器锁(GIL)的影响及解决线程同步问题的最佳实践,如避免全局变量、使用线程安全数据结构、精细化锁的使用等。通过示例代码帮助开发者理解并提升多线程程序的性能与可靠性。
120 0
|
3月前
|
数据采集 监控 调度
干货分享“用 多线程 爬取数据”:单线程 + 协程的效率反超 3 倍,这才是 Python 异步的正确打开方式
在 Python 爬虫中,多线程因 GIL 和切换开销效率低下,而协程通过用户态调度实现高并发,大幅提升爬取效率。本文详解协程原理、实战对比多线程性能,并提供最佳实践,助你掌握异步爬虫核心技术。
|
4月前
|
JSON 算法 Java
打造终端里的下载利器:Python实现可恢复式多线程下载器
在数字时代,大文件下载已成为日常需求。本文教你用Python打造专业级下载器,支持断点续传、多线程加速、速度限制等功能,显著提升终端下载体验。内容涵盖智能续传、多线程分块下载、限速控制及Rich库构建现代终端界面,助你从零构建高效下载工具。
250 1
|
3月前
|
数据采集 存储 Java
多线程Python爬虫:加速大规模学术文献采集
多线程Python爬虫:加速大规模学术文献采集
|
4月前
|
数据采集 网络协议 前端开发
Python多线程爬虫模板:从原理到实战的完整指南
多线程爬虫通过并发请求大幅提升数据采集效率,适用于大规模网页抓取。本文详解其原理与实现,涵盖任务队列、线程池、会话保持、异常处理、反爬对抗等核心技术,并提供可扩展的Python模板代码,助力高效稳定的数据采集实践。
194 0
|
9月前
|
并行计算 安全 Java
Python GIL(全局解释器锁)机制对多线程性能影响的深度分析
在Python开发中,GIL(全局解释器锁)一直备受关注。本文基于CPython解释器,探讨GIL的技术本质及其对程序性能的影响。GIL确保同一时刻只有一个线程执行代码,以保护内存管理的安全性,但也限制了多线程并行计算的效率。文章分析了GIL的必要性、局限性,并介绍了多进程、异步编程等替代方案。尽管Python 3.13计划移除GIL,但该特性至少要到2028年才会默认禁用,因此理解GIL仍至关重要。
574 16
Python GIL(全局解释器锁)机制对多线程性能影响的深度分析
|
8月前
|
Python
python3多线程中使用线程睡眠
本文详细介绍了Python3多线程编程中使用线程睡眠的基本方法和应用场景。通过 `time.sleep()`函数,可以使线程暂停执行一段指定的时间,从而控制线程的执行节奏。通过实际示例演示了如何在多线程中使用线程睡眠来实现计数器和下载器功能。希望本文能帮助您更好地理解和应用Python多线程编程,提高程序的并发能力和执行效率。
258 20
|
7月前
|
数据采集 存储 安全
Python爬虫实战:利用短效代理IP爬取京东母婴纸尿裤数据,多线程池并行处理方案详解
本文分享了一套结合青果网络短效代理IP和多线程池技术的电商数据爬取方案,针对京东母婴纸尿裤类目商品信息进行高效采集。通过动态代理IP规避访问限制,利用多线程提升抓取效率,同时确保数据采集的安全性和合法性。方案详细介绍了爬虫开发步骤、网页结构分析及代码实现,适用于大规模电商数据采集场景。