【C/C++ 关键字 存储类说明符 】 线程局部变量的魔法:C++ 中 thread_local的用法

简介: 【C/C++ 关键字 存储类说明符 】 线程局部变量的魔法:C++ 中 thread_local的用法

概述

thread_local指示对象拥有线程存储期。也就是对象的存储在线程开始时分配,而在线程结束时解分配。每个线程拥有其自身的对象实例。唯有声明为 thread_local 的对象拥有此存储期。 thread_local 能与 static 或 extern 结合一同出现,以调整链接(分别指定内部或外部链接),详细的可以查阅:存储类说明符 - cppreference.com

使用 thread_local 说明符声明的变量仅可在它在其上创建的线程上访问。 变量在创建线程时创建,并在销毁线程时销毁。 每个线程都有其自己的变量副本。
thread_local 说明符可以与 staticextern 合并。这将影响变量的链接属性。


表现形式

在 C++ 中,Thread Local Storage (TLS) 是通过使用 thread_local 关键字来实现的。它可以用于修饰全局变量、静态变量或类的静态成员变量,使其成为线程局部变量。对于一个使用 thread_local 修饰的变量,每个线程都拥有一个独立的副本。以下是使用 thread_local 的一些原型示例:

  • 全局变量
  • 每个线程都有自己单独的x副本,互不干预。
thread_local int globalVar; 

  • 局部变量(静态变量)
  • 线程存储期的变量都是和线程绑定的,所以只有第一次声明时被赋值。可以理解为线程专用的static变量。不过变量的作用域依然是在本身的作用域内。
void foo() {
   thread_local int staticVar;
}

  • 类对象(静态变量)
  • 与局部变量的情况相同,创建的实例相对于thread是static的,一般情况要求我们:thread_local对象声明时赋值.

类成员变量

  • thread_local作为类成员变量时必须是static的.
  • thread_local作为类成员时也是对于每个thread分别分配了一个,而static则是全局一个.
class MyClass {
public:
   static thread_local int staticMemberVar;
};

需要注意的是,使用 thread_local 关键字修饰的变量在每个线程中都有一个独立的副本,因此每个线程对其进行的操作都不会影响其他线程。在多线程环境下,这可以帮助避免数据竞争和同步开销。


作用和适用的场景

C++ 的 Thread Local Storage(TLS)特性在多线程环境中非常有用,它允许每个线程拥有一份单独的全局或静态变量副本。适用的场景包括:

  • 避免数据竞争:当多个线程需要访问全局或静态变量时,使用 TLS 可以为每个线程提供一个变量副本,从而避免数据竞争。每个线程只操作自己的变量副本,不会影响其他线程。
  • 减少同步开销:由于每个线程都有自己的变量副本,因此在某些情况下可以减少同步开销,例如减少互斥锁的使用。这可以提高多线程程序的性能。
  • 线程独立的资源分配:当某个资源需要在多个线程之间共享,但又希望每个线程独立使用该资源时,可以使用 TLS。例如,线程独立的内存分配器、线程独立的随机数生成器等。
  • 线程特有的状态跟踪:TLS 可用于跟踪每个线程的特定状态,如错误信息、递归调用计数、线程局部缓存等。这可以使每个线程在处理自己的数据时,能够访问和操作这些特定状态。
  • 模拟线程局部变量:在一些没有原生支持线程局部变量的环境中,可以使用 TLS 来模拟这个功能。例如,在 C++11 之前的版本中,可以通过自定义的实现来模拟线程局部变量。

需要注意的是,TLS 可能会增加内存消耗,因为每个线程都有自己的变量副本。此外,在某些情况下,TLS 可能会导致一定的性能损失,因为操作系统需要在线程切换时处理线程局部数据。因此,在使用 TLS 时,请确保权衡这些因素,并在适当的场景下使用。


实现逻辑

C++ 的 Thread Local Storage(TLS)特性在底层的实现和逻辑上有很多不同的方面。主要实现方法包括编译器支持、操作系统支持和库支持。在这里,我们将概述 TLS 的一般实现原理和底层逻辑:

  • 编译器支持:编译器在生成目标代码时,对于使用 thread_local 修饰的变量,会将其分配到特殊的存储区域。这个存储区域是每个线程独立的,因此在运行时,每个线程都可以访问自己独立的变量副本。
  • 操作系统支持:操作系统通常提供一种机制来管理线程局部存储。例如,Windows 使用 TlsAlloc、TlsGetValue 和 TlsSetValue 等函数管理线程局部存储,而 Linux 使用 pthread_key_create、pthread_getspecific 和 pthread_setspecific 等函数。当一个线程访问 thread_local 变量时,操作系统会将请求重定向到这个线程对应的局部存储区域。
  • 库支持:在 C++ 标准库中,线程局部存储的功能由 thread_local 关键字和相关的库函数提供。这些库函数在底层调用操作系统提供的 API 来实现线程局部存储的功能。
  • 线程创建时的初始化:当一个新线程被创建时,运行时系统会分配一个独立的 TLS 区域,并为该区域中的 thread_local 变量进行初始化。这些初始化操作可能包括调用默认构造函数、执行初始化表达式等。
  • 线程退出时的清理:当一个线程退出时,运行时系统会负责释放线程局部存储区域,并为该区域中的 thread_local 变量调用析构函数。这个过程通常由操作系统或 C++ 运行时库自动完成。
    需要注意的是,不同的编译器和操作系统可能有不同的实现细节。在实际使用中,开发者无需了解所有这些底层逻辑,只需使用 thread_local 关键字和相关的库函数就可以享受到线程局部存储带来的便利。

示例

示例1:使用 thread_local 计算每个线程的累积和

#include <iostream>
#include <thread>
#include <vector>
thread_local int sum = 0;
void accumulate(int n) {
  for (int i = 1; i <= n; ++i) {
    sum += i;
  }
  std::cout << "Thread id: " << std::this_thread::get_id() << ", Sum: " << sum << std::endl;
}
int main() {
  std::vector<std::thread> threads;
  for (int i = 1; i <= 5; ++i) {
threads.emplace_back(accumulate, i * 10);
}
for (auto& t : threads) {
t.join();
}
return 0;
}

示例2:模拟一个简单的线程安全计数器

#include <iostream>
#include <mutex>
#include <thread>
#include <vector>
std::mutex mtx;
unsigned int globalCounter = 0;
thread_local unsigned int localCounter = 0;
void incrementCounter(int n) {
  for (int i = 0; i < n; ++i) {
    ++localCounter;
    std::unique_lock<std::mutex> lock(mtx);
    ++globalCounter;
    lock.unlock();
  }
  std::cout << "Thread id: " << std::this_thread::get_id()
            << ", Local counter: " << localCounter
            << ", Global counter: " << globalCounter << std::endl;
}
int main() {
  std::vector<std::thread> threads;
  for (int i = 0; i < 5; ++i) {
    threads.emplace_back(incrementCounter, 100);
  }
  for (auto& t : threads) {
    t.join();
  }
  std::cout << "Final global counter: " << globalCounter << std::endl;
  return 0;
}

这两个示例展示了如何使用 thread_local 关键字创建线程局部变量。在第一个示例中,我们计算了每个线程的累积和。在第二个示例中,我们模拟了一个简单的线程安全计数器,它使用 thread_local 存储每个线程的局部计数,并使用互斥锁保护全局计数器。


需要注意的地方

thread_local 变量是线程局部存储的变量,它的生命周期与线程的生命周期相同。在多线程程序中,thread_local 变量可以用来保存线程相关的状态,从而避免了线程间的共享状态可能导致的同步问题。
然而,如果在使用 thread_local 变量时不小心,可能会导致内存泄漏问题。具体来说,如果一个线程结束时,它仍然持有一个指向 thread_local 变量的指针,那么这个 thread_local 变量就会一直存在,直到整个程序结束才会被释放。如果这个 thread_local 变量是一个大的对象,那么就会导致内存泄漏。
为了避免这个问题,需要确保在线程结束时及时清理 thread_local 变量。一种常见的做法是在 thread_local 变量的析构函数中清理相关的资源。例如,如果 thread_local 变量是一个指针类型,那么在析构函数中应该释放指针所指向的资源。同时,还可以使用一些 RAII 技巧,例如使用 std::unique_ptr 等智能指针,来帮助自动化资源清理的工作。


除了在 thread_local 变量的析构函数中及时清理资源外,还有一些其他的可能导致内存泄漏的情况,例如:
1.在使用 thread_local 变量时发生异常,导致析构函数没有被正确调用,从而导致资源泄漏。
2.在使用 thread_local 变量的线程中调用 std::exit 函数或者使用 std::quick_exit 函数退出程序,导致 thread_local 变量的析构函数没有被调用,从而导致资源泄漏。
3.在使用 thread_local 变量的线程中创建了一些子线程,并且这些子线程也使用了相同的 thread_local 变量,但是没有正确清理子线程中的 thread_local 变量,从而导致资源泄漏。


针对这些情况,我们需要采取相应的措施来避免内存泄漏,例如:
1.使用 RAII 技巧,例如使用 std::unique_ptr 等智能指针来管理资源,从而避免异常导致的资源泄漏。
2.在程序退出时,可以使用 std::atexit 函数来注册一个清理函数,该函数会在程序退出前被调用,从而确保 thread_local 变量的析构函数被正确调用。
3.在子线程中正确清理 thread_local 变量,可以使用类似于在主线程中清理 thread_local 变量的方式,即在 thread_local 变量的析构函数中清理相关资源。同时,还需要确保在子线程退出时,thread_local 变量的析构函数被正确调用。

总结

  • 本质上thread_local修饰后仍然是一个变量,我们依旧能够使用取地址操作者通过引用的方法传递给其他线程对其进行修改,
  • thread-local storage 和 static(或者说global) 存储很类似,每一个线程都将拥有一份这个数据的拷贝,thread_local对象的生命周期从线程开始时开始(对于全局变量),或者首先分配空间。当线程退出的时候对象析构;
  • 一般在声明时赋值,在本thread中只执行一次。当用于类成员变量时,必须是static的。
目录
相关文章
|
6月前
|
存储 安全 编译器
第二问:C++中const用法详解
`const` 是 C++ 中用于定义常量的关键字,主要作用是防止值被修改。它可以修饰变量、指针、函数参数、返回值、类成员等,确保数据的不可变性。`const` 的常见用法包括:
262 2
|
5月前
|
存储 算法 C++
【C++数据结构——图】图的邻接矩阵和邻接表的存储(头歌实践教学平台习题)【合集】
本任务要求编写程序实现图的邻接矩阵和邻接表的存储。需掌握带权有向图、图的邻接矩阵及邻接表的概念。邻接矩阵用于表示顶点间的连接关系,邻接表则通过链表结构存储图信息。测试输入为图的顶点数、边数及邻接矩阵,预期输出为Prim算法求解结果。通关代码提供了完整的C++实现,包括输入、构建和打印邻接矩阵与邻接表的功能。
218 10
|
7月前
|
存储 C++ 容器
【C++】map、set基本用法
本文介绍了C++ STL中的`map`和`set`两种关联容器。`map`用于存储键值对,每个键唯一;而`set`存储唯一元素,不包含值。两者均基于红黑树实现,支持高效的查找、插入和删除操作。文中详细列举了它们的构造方法、迭代器、容量检查、元素修改等常用接口,并简要对比了`map`与`set`的主要差异。此外,还介绍了允许重复元素的`multiset`和`multimap`。
157 3
【C++】map、set基本用法
|
6月前
|
C++
第十三问:C++中静态变量的用法有哪些?
本文介绍了 C++ 中静态变量和函数的用法及原理。静态变量包括函数内的静态局部变量和类中的静态成员变量,前者在函数调用间保持值,后者属于类而非对象。静态函数不能访问非静态成员,但可以通过类名直接调用。静态链接使变量或函数仅在定义文件内可见,避免命名冲突。
162 0
|
7月前
|
Java 开发者
在Java多线程编程的世界里,Lock接口正逐渐成为高手们的首选,取代了传统的synchronized关键字
在Java多线程编程的世界里,Lock接口正逐渐成为高手们的首选,取代了传统的synchronized关键字
90 4
|
8月前
|
Java 开发者
在 Java 多线程编程中,Lock 接口正逐渐取代传统的 `synchronized` 关键字,成为高手们的首选
【10月更文挑战第6天】在 Java 多线程编程中,Lock 接口正逐渐取代传统的 `synchronized` 关键字,成为高手们的首选。相比 `synchronized`,Lock 提供了更灵活强大的线程同步机制,包括可中断等待、超时等待、重入锁及读写锁等高级特性,极大提升了多线程应用的性能和可靠性。通过示例对比,可以看出 Lock 接口通过 `lock()` 和 `unlock()` 明确管理锁的获取和释放,避免死锁风险,并支持公平锁选择和条件变量,使其在高并发场景下更具优势。掌握 Lock 接口将助力开发者构建更高效、可靠的多线程应用。
66 2
|
8月前
|
缓存 Java 编译器
【多线程-从零开始-伍】volatile关键字和内存可见性问题
【多线程-从零开始-伍】volatile关键字和内存可见性问题
118 0
|
10月前
|
编译器 C++ 容器
【C++】String常见函数用法
【C++】String常见函数用法
|
9月前
|
JavaScript 安全 前端开发
ArkTS线程中通过napi创建的C++线程
需要注意的是,N-API和ArkTS的具体使用会随Node.js的版本不断更新和变化,所以在实际编写代码前,查看最新的官方文档是很重要的,以了解最新的最佳实践和使用模式。此外,C++线程的使用在Node.js插件中应当慎重,过多地使用它们可能会造成资源争用,并可能降低应用程序的性能。
200 0
|
1月前
|
机器学习/深度学习 消息中间件 存储
【高薪程序员必看】万字长文拆解Java并发编程!(9-2):并发工具-线程池
🌟 ​大家好,我是摘星!​ 🌟今天为大家带来的是并发编程中的强力并发工具-线程池,废话不多说让我们直接开始。
79 0