备案控制台

开发者社区开发与运维文章正文

源码解密协程队列和线程队列的实现原理（二）

2024-10-08 147

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 源码解密协程队列和线程队列的实现原理（二）

接上篇：https://developer.aliyun.com/article/1617453

线程队列

说完了协程队列，再来看看线程队列，它们的 API 是类似的，但实现细节则不同。因为操作系统感知不到协程，所以协程队列的阻塞等待是基于 Future 实现的，而线程队列的阻塞等待是基于条件变量（和互斥锁）实现的。

还是先来看看线程队列的一些 API，和协程队列是类似的。

from queue import Queue
# 可以指定一个 maxsize 参数，表示队列的容量
# 默认为 0，表示队列的容量无限
queue = Queue(maxsize=20)
# 查看容量
print(queue.maxsize)
"""
20
"""
# 查看队列的元素个数
print(queue.qsize())
"""
0
"""
# 判断队列是否已满
print(queue.full())
"""
False
"""
# 判断队列是否为空
print(queue.empty())
"""
True
"""
# 往队列中添加元素
# block 参数表示是否阻塞，默认为 True，当队列已满时，线程会阻塞
# timeout 表示超时时间，默认为 None，表示会无限等待
# 当然也可以给 timeout 传一个具体的值
# 如果在规定时间内，没有将元素放入队列，那么抛异常
queue.put(123, block=True, timeout=None)
# 也是往队列中添加元素，但是当队列已满时，会直接抛异常
# put_nowait(item) 本质上就是 put(item, block=False)
queue.put_nowait(456)
# 从队列中取出元素
# 同样可以传递 block 和 timeout 参数
# block 默认为 True，当队列为空时会陷入阻塞
# timeout 默认为 None，表示会无限等待
print(queue.get(block=True, timeout=None))
"""
123
"""
# 也是从队列中取出元素，但是当队列为空时，会直接抛异常
# get_nowait() 本质上就是 get(block=False)
print(queue.get_nowait())
"""
456
"""
# task_done()，将 unfinished_tasks 属性的值减 1
print(queue.unfinished_tasks)  
"""
2
"""
queue.task_done()
queue.task_done()
print(queue.unfinished_tasks)
"""
0
"""
# join()，当 unfinished_tasks 不为 0 时，陷入阻塞
queue.join()

API 和协程队列是相似的，我们罗列一下：

线程队列的具体使用我们已经知道了，下面来看看它的具体实现。

线程队列的内部依旧使用双端队列进行元素存储，并且还使用了一个互斥锁和三个条件变量。

为了保证数据的一致性和线程安全，当队列在多线程环境中被修改（比如添加或删除元素）时，需要使用互斥锁。任何需要修改队列的操作都必须在获取到互斥锁之后进行，以防止多个线程同时对队列进行修改，否则会导致数据不一致或其它错误。同时，一旦对队列的修改完成，必须立即释放互斥锁，以便其它线程可以访问队列。

然后是 not_empty 条件变量，当一个新元素被添加到队列时，应该向 not_empty发送一个信号。这个动作会通知那些想从队列中获取元素，但因队列为空而陷入阻塞的线程，现在队列中已经有了新的元素，它们可以继续执行获取元素的操作。

接下来是 not_full 条件变量，当从队列中取走一个元素时，应该向 not_full 发送一个信号。这个动作通知那些想往队列添加元素，但因队列已满而陷入阻塞的线程，现在队列中已经有了可用空间，它们可以继续执行添加元素的操作。

最后是 all_tasks_done 条件变量，当处理的任务全部完成，即计数器 unfinished_task 为 0 时，应该向 all_tasks_done 发送一个信号。这个动作会通知那些执行了 join() 方法而陷入阻塞的线程，它们可以继续往下执行了。

因为线程队列采用了双端队列存储元素，所以双端队列的长度就是线程队列的元素个数。如果元素个数为 0，那么队列就是空；如果容量大于 0，并且小于等于元素个数，那么队列就满了。

前面说了，put_nowait 和 get_nowait 本质上就是调用了 put 和 get，所以我们的重点是 put 和 get 两个方法。

以上就是 put 方法的底层实现，不难理解。说完了 put，再来看看 get。

最后是 task_done 和 join 方法，看看它们的内部逻辑。

调用 join 方法，当 unfinished_task 大于 0 时，会陷入阻塞。调用 task_done 方法，会将未完成任务数减 1，如果为 0，那么唤醒阻塞等待的线程。

需要注意的是，唤醒调用的方法不是 notify，而是 notify_all。对于添加元素和获取元素，每次显然只能唤醒一个线程，此时调用 notify。而 unfinished_task 为 0 时，应该要唤醒所有等待的线程，因此要调用 notify_all。

最后线程队列也有相应的 PriorityQueue 和 LifoQueue，它们的用法、实现和协程里面的这两个队列是一样的。

小结

以上便是协程队列和线程队列的具体用法和实现原理，它们本质上都是基于双端队列实现具体的元素存储，并且在队列已满和队列为空时，可以阻塞等待。

只不过协程队列是通过 Future 对象实现的，而线程队列是通过条件变量实现的。

当然，除了协程队列和线程队列，还有进程队列，但进程队列要复杂的多。因此关于进程队列的实现细节，我们以后专门花篇幅去介绍。

文章标签：

API

存储

安全

关键词：

源码线程

线程实现原理

队列线程

协程线程

协程队列实现原理

古明地盆

目录

相关文章

兵临天下19970108016

|

6月前

|

数据采集监控调度

干货分享“用多线程爬取数据”：单线程 + 协程的效率反超 3 倍，这才是 Python 异步的正确打开方式

在 Python 爬虫中，多线程因 GIL 和切换开销效率低下，而协程通过用户态调度实现高并发，大幅提升爬取效率。本文详解协程原理、实战对比多线程性能，并提供最佳实践，助你掌握异步爬虫核心技术。

兵临天下19970108016

519 0 0

东阳马生架构

|

8月前

|

安全 Java 调度

Netty源码—3.Reactor线程模型二

本文主要介绍了NioEventLoop的执行总体框架、Reactor线程执行一次事件轮询、Reactor线程处理产生IO事件的Channel、Reactor线程处理任务队列之添加任务、Reactor线程处理任务队列之执行任务、NioEventLoop总结。

东阳马生架构

157 2 2

东阳马生架构

|

8月前

|

安全 Java

Netty源码—2.Reactor线程模型一

本文主要介绍了关于NioEventLoop的问题整理、理解Reactor线程模型主要分三部分、NioEventLoop的创建和NioEventLoop的启动。

东阳马生架构

209 2 2

flzjkl

|

9月前

|

Java 中间件调度

【源码】【Java并发】从InheritableThreadLocal和TTL源码的角度来看父子线程传递

本文涉及InheritableThreadLocal和TTL，从源码的角度，分别分析它们是怎么实现父子线程传递的。建议先了解ThreadLocal。

flzjkl

328 4 9

【源码】【Java并发】从InheritableThreadLocal和TTL源码的角度来看父子线程传递

flzjkl

|

10月前

|

Java 调度

【源码】【Java并发】【线程池】邀请您从0-1阅读ThreadPoolExecutor源码

当我们创建一个`ThreadPoolExecutor`的时候，你是否会好奇🤔，它到底发生了什么？比如：我传的拒绝策略、线程工厂是啥时候被使用的？核心线程数是个啥？最大线程数和它又有什么关系？线程池，它是怎么调度，我们传入的线程？...不要着急，小手手点上关注、点赞、收藏。主播马上从源码的角度带你们探索神秘线程池的世界...

flzjkl

507 0 0

【源码】【Java并发】【线程池】邀请您从0-1阅读ThreadPoolExecutor源码

技术小达人

|

12月前

|

消息中间件调度

如何区分进程、线程和协程？看这篇就够了！

本课程主要探讨操作系统中的进程、线程和协程的区别。进程是资源分配的基本单位，具有独立性和隔离性；线程是CPU调度的基本单位，轻量且共享资源，适合并发执行；协程更轻量，由程序自身调度，适合I/O密集型任务。通过学习这些概念，可以更好地理解和应用它们，以实现最优的性能和资源利用。

技术小达人

389 11 11

威哥爱编程

|

12月前

|

存储监控 Java

JAVA线程池有哪些队列？以及它们的适用场景案例

不同的线程池队列有着各自的特点和适用场景，在实际使用线程池时，需要根据具体的业务需求、系统资源状况以及对任务执行顺序、响应时间等方面的要求，合理选择相应的队列来构建线程池，以实现高效的任务处理。

威哥爱编程

622 12 12

喜欢猪猪

|

缓存监控 Java

Java线程池提交任务流程底层源码与源码解析

【11月更文挑战第30天】嘿，各位技术爱好者们，今天咱们来聊聊Java线程池提交任务的底层源码与源码解析。作为一个资深的Java开发者，我相信你一定对线程池并不陌生。线程池作为并发编程中的一大利器，其重要性不言而喻。今天，我将以对话的方式，带你一步步深入线程池的奥秘，从概述到功能点，再到背景和业务点，最后到底层原理和示例，让你对线程池有一个全新的认识。

喜欢猪猪

270 12 12

潇洒洒

|

消息中间件存储安全

深入探索C++无锁队列：多线程编程的高效利器

【10月更文挑战第19天】

潇洒洒

1367 6 6

三三是该溜子

|

安全 Java 容器

【JaveEE】——多线程中使用顺序表，队列，哈希表

多线程环境下使用ArrayList（同步机制，写时拷贝），使用队列，哈希表（高频）ConcurrentHashMap（缩小锁粒度，CAS，扩容优化）

三三是该溜子

148 0 0

热门文章

最新文章

【转】【UNITY3D 游戏开发之六】UNITY 协程COROUTINE与INVOKE

ucontext-人人都可以实现的简单协程库

Java协程编程之Loom项目尝鲜

浅谈协程并发竞争资源问题

Swoole v4.6.0 版本发布，支持原生 curl 协程客户端

深入理解协程suspend工作原理(初学者也能看得懂)

发挥Go协程的威力：详解Go语言中协程的使用技巧与最佳实践

Python中的多线程与协程的比较与应用场景

Java19新特性协程

如何手动实现一个协程池？

Python threading模块：多线程编程的实战指南

什么是线程池？它的工作原理？

如何在Java中进行多线程编程

【JUC】（6）带你了解共享模型之享元和不可变模型并初步带你了解并发工具线程池Pool，文章内还有饥饿问题、设计模式之工作线程的解决于实现

【JUC】（3）常见的设计模式概念分析与多把锁使用场景！！理解线程状态转换条件！带你深入JUC！！文章全程笔记干货！！

【JUC】（1）带你重新认识进程与线程！！让你深层次了解线程运行的睡眠与打断！！

【Java】（10）进程与线程的关系、Tread类；讲解基本线程安全、网络编程内容；JSON序列化与反序列化

【Java基础】（1）进程与线程的关系、Tread类；讲解基本线程安全、网络编程内容；JSON序列化与反序列化

JUC系列之《CountDownLatch：同步多线程的精准发令枪》

NDM多线程下载器!实用的下载器,绿色版下载及安装教程

相关电子书

更多

fibjs 模块重构从回调到协程

多IO线程优化版

fibjs 模块重构从回调到协程--陈垒

下一篇

【DataEase】零代码数据可视化分析工具的安装部署保姆级教程