前言:
- 在本期,我将给大家介绍的是 C++11 中新引进的知识,即关于线程库的相关知识。
(一)线程库的介绍
1、线程库的由来
C++11引入线程库的主要原因是满足多核处理器和并行计算的需求。在现代计算机体系结构中,多核处理器已成为主流,而同时执行多个任务和利用多核处理器的能力对于实现高性能和并行计算至关重要。在C++11之前,涉及到多线程问题,都是和平台相关的,比如windows和linux下各有自己的接口,这使得代码的可移植性比较差。
C++11引入了线程库作为标准库的一部分,以提供一种标准化的、平台无关的方法来处理多线程和并发编程。它的目标是提供一组类和函数,为程序员提供创建、管理和同步线程的工具,并且以一种可移植和可靠的方式工作。
C++11线程库的引入使得多线程和并发编程在C++中成为一项原生支持的特性,为开发者提供了更好的工具和能力来利用多核处理器和实现高效的并行计算。
2、线程库的简单介绍
C++11引入了一个标准库,即C++标准线程库(C++ Standard Thread Library),它允许程序员在C++中轻松地创建和管理线程。这个线程库提供了一组类和函数,用于创建、管理和同步线程的操作。
以下是C++11提供的线程库的主要组件:
- std::thread:这个类代表一个执行线程。可以通过传递一个可调用对象(函数、函数指针、lambda表达式等)和它的参数来创建线程。线程会在构造函数中启动,并在可调用对象执行完毕时结束。还可以使用成员函数来获取和设置线程的属性,如标识符、状态等。
- std::mutex:这个类实现了互斥锁(mutex),用于线程间的互斥访问共享数据。通过使用互斥锁,可以确保在某个线程访问共享资源时,其他线程无法同时访问它,以避免数据竞争和不一致性。
- std::condition_variable:这个类提供了条件变量,用于在线程之间进行同步和通信。条件变量允许一个或多个线程等待某个条件满足,并在条件满足时被唤醒。通常与互斥锁一起使用,以实现线程间的顺序执行和通信。
- std::atomic:这个类提供了原子操作(atomic operations),用于在多线程环境中对共享数据进行原子访问。原子操作是不可中断的,可以确保操作的完整性和一致性,避免竞争条件和数据冲突。
要使用标准库中的线程,必须包含< thread >头文件:
以下是一些说明事项:
1、线程是操作系统中的一个概念,线程对象可以关联一个线程,用来控制线程以及获取线程的
状态。
// 线程函数,打印一条消息 void Print() { cout << "Hello from thread!" <<endl; } int main() { // 创建一个线程对象,并传递线程函数作为可调用对象 thread t1(Print); // 判断线程是否可执行 if (t1.joinable()) { cout << "Thread is joinable." << endl; } else { cout << "Thread is not joinable." << endl; } // 等待线程执行完毕 t1.join(); // 判断线程是否仍然可执行 if (t1.joinable()) { cout << "Thread is joinable." << endl; } else { cout << "Thread is not joinable." << endl; } return 0; }
输出展示:
【解释说明】
- 在这个示例中,我们定义了一个
printMessage()
函数作为线程函数,它会打印一条消息。在main()
函数中,我们创建了 t1,并传递了线程函数printMessage
作为可调用对象。 - 接下来,我们通过 joinable() 成员函数判断线程对象是否可执行。在创建线程后但尚未调用
join()
函数之前,线程是可执行的。在调用join()
函数后,线程会等待线程函数执行完毕以后才结束,并且线程对象不再可执行。 - 最后,我们再次使用 joinable() 成员函数来判断线程对象是否仍然可执行。在
join()
函数调用之后,线程对象不再可执行,可以安全地销毁线程对象。
2、当创建一个线程对象后,没有提供线程函数,该对象实际没有对应任何线程
int main() { // 创建一个空的线程对象 thread t2; // 判断线程是否可执行 if (t2.joinable()) { cout << "Thread is joinable." << endl; } else { cout << "Thread is not joinable." << endl; } // 销毁线程对象 return 0; }
【解释说明】
- 在这个示例中,我们创建了一个空的线程对象 t2 ,没有传递任何线程函数作为可调用对象。在创建后,t2 并没有关联到任何线程执行代码。
- 然后,我们使用 joinable()成员函数来判断线程对象是否可执行。由于没有提供线程函数,线程对象并没有对应的线程,因此它不可执行。
3、get_id()的返回值类型为id类型,id类型实际为std::thread命名空间下封装的一个类,该类中
包含了一个结构体:
// vs下查看 typedef struct { /* thread identifier for Win32 */ void *_Hnd; /* Win32 HANDLE */ unsigned int _Id; } _Thrd_imp_t;
接下来我们简单的看以下代码:
void threadFunction() { cout << "Thread ID: " << std::this_thread::get_id() << endl; } int main() { thread t1(threadFunction); thread t2(threadFunction); cout << "Main thread ID: " << std::this_thread::get_id() << endl; if (t1.get_id() == t2.get_id()) { cout << "t1 and t2 have the same thread ID." <<endl; } else { cout << "t1 and t2 have different thread IDs." << endl; } t1.join(); t2.join(); return 0; }
【解释说明】
- 创建了两个对象
t1
和t2
,它们分别关联到一个线程函数threadFunction
。在threadFunction
函数中,我们打印线程的唯一标识符。 - 紧接着在主函数中,我们首先打印主线程的唯一标识符。然后,我们通过
get_id()
函数分别获取t1
和t2
的线程ID,并使用比较操作符对它们进行比较。
输出展示:
通过比较线程ID,我们可以判断不同线程对象是否关联到同一个线程,这在多线程编程中非常有用,可以帮助我们进行线程间的协调和控制。
3、当创建一个线程对象后,并且给线程关联线程函数,该线程就被启动,与主线程一起运行。
线程函数一般情况下可按照以下三种方式提供:
- 函数指针
- lambda表达式
- 函数对象
💨 接下来,我们分别叙述各个方式:
- ①函数指针
#include <iostream> #include <thread> void ThreadFunc(int a) { cout << "Thread: " <<":"<< a << endl; } int main() { thread t1(ThreadFunc, 10); t1.join(); return 0; }
输出展示:
【解释说明】
- 上述代码使用函数指针方式提供了线程函数,并成功创建了一个线程对象,使其在后台执行了
ThreadFunc
函数; - 使用函数指针方式创建了一个线程对象
t1
,并将ThreadFunc
函数及参数10
传递给它
- ②lambda表达式
int main() { int threadArg = 10; // 创建线程对象,并传递lambda表达式作为线程函数 thread t2([threadArg]() { // 在lambda表达式中执行线程函数的逻辑 cout << "Thread Function: Value = " << threadArg << endl; }); // 做一些其他的操作... // 等待线程执行完毕 t2.join(); return 0; }
输出展示:
【解释说明】
- 在这个示例中,我们定义了一个整型变量 threadArg 作为线程函数的参数。
- 然后,我们创建了一个线程对象 t2 ,并通过lambda表达式来定义线程函数。lambda表达式接收 threadArg 作为捕获变量,并在其中输出线程函数的逻辑。
- 然后调用
join()
函数等待线程执行完毕。 - 这样,就通过lambda表达式方式提供了线程函数,并使用创建的线程对象执行了该线程函数。
- ③函数对象
class TF { public: void operator()() { cout << "Thread3" << endl; } }; int main() { // 线程函数为函数对象 TF tf; thread t3(tf); t3.join(); return 0; }
输出展示:
【解释说明】
- 上述代码定义了一个名为
TF
的类,重载了函数调用运算符operator()
作为线程函数的实现; - 代码创建了一个名为
tf
的TF
类的对象,并将其作为线程函数对象传递给了thread对象t3
的构造函数,然后使用t3.join()
等待线程执行完毕; - 整体来说,上述代码使用函数对象方式提供了线程函数,并成功创建了一个线程对象,使其在后台执行了函数对象
TF
的调用运算符重载函数。
4、thread类是防拷贝的,不允许拷贝构造以及赋值,但是可以移动构造和移动赋值,即将一个线程对象关联线程的状态转移给其他线程对象,转移期间不意向线程的执行。
下面是一个示例代码演示了如何使用移动语义操作来转移线程对象:
void threadFunction() { cout << "Thread Function" << endl; } int main() { thread t1(threadFunction); // 移动构造一个新的线程对象 thread t2 = move(t1); // 线程对象t1不再与任何线程关联 // t1 现在为空,不能再在其上执行join()或其他线程相关操作 // 等待线程执行完毕 t2.join(); return 0; }
【输出展示】
【解释说明】
- 上述代码中我们创建了一个线程对象
t1
,关联了线程函数threadFunction(),
然后,我们使用移动构造函数move()
将t1
的所有权转移到t2
上。此时,t1
变为空,不再与任何线程关联。 - 最后,我们调用
t2.join()
等待t2
关联的线程执行完毕。 - 通过移动语义操作,我们可以将线程对象的所有权传递给其他线程对象,而无需执行线程的实际执行。这种方式允许资源的有效转移,并提供了更灵活的线程管理和编程方式。
5、可以通过jionable()函数判断线程是否是有效的,如果是以下任意情况,则线程无效
- 采用无参构造函数构造的线程对象
- 线程对象的状态已经转移给其他线程对象
- 线程已经调用jion或者detach结束
(二)线程函数参数
接下来,我们直接通过代码来进行观察现象,最后在进行总结:
现有以下代码:
void ThreadFunc1(int x) { x += 10; } int main() { int a = 10; // 在线程函数中对a修改,不会影响外部实参, //因为:线程函数参数虽然是引用方式,但其实际引用的是线程栈中的拷贝 thread t1(ThreadFunc1, a); t1.join(); cout << a << endl; return 0; }
输出展示:
【解释说明】
- 线程函数 ThreadFunc1 的参数是以传值的方式传递的,但是在对
x
进行修改时,并不会影响到外部的实参a,
尽管 ThreadFunc1 中对x
进行了修改(x += 10
),但输出结果仍然会是10
,而不是20
。 - 这是因为在创建线程对象时,使用
a
的值初始化了 ThreadFunc1 的参数x
的副本。线程持有这个副本并在单独的执行线程中执行相应代码。修改副本x
不会影响到原始变量a
。
但是如果我就想要在线程函数中修改外部实参 a
的值,你可以将 std::ref() 作为参数传递给线程对象的构造函数,以便引用原始变量。
修改后的代码示例如下:
void ThreadFunc1(int& x) { x += 10; } int main() { int a = 10; // 如果想要通过形参改变外部实参时,必须借助std::ref()函数 thread t2(ThreadFunc1, ref(a)); t2.join(); cout << a << endl; return 0; }
输出展示:
这样,参数 x
就是对原始变量 a
的引用,对其进行的修改将反映在主线程中的原始变量 a
,输出结果将是 20.
其次,对于指针也有着一样的效果,具体如下:
void ThreadFunc2(int* x) { *x += 10; } int main() { int a = 10; // 地址的拷贝 thread t3(ThreadFunc2, &a); t3.join(); cout << a << endl; return 0; }
输出展示:
【解释说明】
- 在 ThreadFunc2 中可以通过解引用指针
x
并对其进行修改来改变原始变量a
的值。最终,输出a
的值将是原始值10
加上10
,即20。
【注意】
如果是类成员函数作为线程参数时,必须将this作为线程函数参数
- 这是因为成员函数需要访问类的成员变量和其他成员函数,并且需要通过对象的指针(
this
指针)来进行访问。
代码展示:
class Func { public: void threadFunc(int a) { cout << "Thread function: " << a << endl; } }; int main() { Func obj; int value = 10; thread t(&Func::threadFunc, &obj, value); t.join(); return 0; }
【解释说明】
- 创建 thread 对象时,我们传递了 &obj ,即对象的指针作为额外的参数。这样,线程函数在执行时将可访问到类的成员变量和其他成员函数。
- 通过这种方式,我们可以在类的成员函数中直接操作对象的状态,并且可以与其他线程安全地共享该对象。
【小结】
线程函数的参数是以值拷贝的方式拷贝到线程栈空间中的,因此:即使线程参数为引用类型,在线程中修改后也不能修改外部实参,因为其实际引用的是线程栈中的拷贝,而不是外部实参。
(三)原子性操作库
多线程最主要的问题是共享数据带来的问题(即线程安全)。如果共享数据都是只读的,那么没问题,因为只读操作不会影响到数据,更不会涉及对数据的修改,所以所有线程都会获得同样的数据。但是,当一个或多个线程要修改共享数据时,就会产生很多潜在的麻烦。比如:
int sum = 0; void fun(size_t num) { for (int i = 0; i < num; ++i) { ++sum; } } int main() { cout << "Before joining,sum = " << sum << endl; thread t1(fun, 1000000); thread t2(fun, 1000000); t1.join(); t2.join(); cout << "After joining,sum = " << sum << endl; return 0; }
【解释说明】
- 大家第一看能看出来上述代码有什么问题吗?我相信各位聪明的小伙伴都已经知道了。主要的问题在于多个线程同时访问和修改全局变量 sum,这可能导致数据竞争问题。
输出展示:
【解释说明】
- 我们通过连续几次的输出可以发现,每次输出的结果都不一致。因此,不难看出此处就引起了相应的线程安全问题。
接下来,我们通过尝试打印 sum和num 的地址查看是否相同:
【解释说明】
- 由于 sum 是一个全局变量,它在内存中具有唯一的地址;
- 但是, num 是在每次调用
fun
函数时创建的局部变量,每个线程都有自己的num变量。因此,输出&
num将显示每个线程的num变量的地址。 - 在多线程环境中,每个线程都拥有自己的栈空间,因此它们的局部变量是独立的。然而,全局变量是共享的,多个线程可以同时访问和修改它。
为了避免数据竞争问题,在C++98中传统的解决方式为:可以使用锁来保护对sum 的访问
下面是修改后的代码示例:
mutex mtx; int sum = 0; void fun(int n) { for (int i = 0; i < n; i++) { mtx.lock(); ++sum; mtx.unlock(); } } int main() { cout << "Before joining,sum = " << sum << endl; thread t1(fun, 10000); thread t2(fun, 10000); t1.join(); t2.join(); cout << "After joining,sum = " << sum << endl; return 0; }
输出展示:
上述代码的加锁方式属于并行加锁的方式,我们还可以进行串行加锁:
void fun(int n) { //串行 mtx.lock(); for (int i = 0; i < n; i++) { ++sum; } mtx.unlock(); }
我们分别对上述两种方式进行简单的测试,看最终的效率如何:
- 串行方式下:
- 并行方式下:
【小结】
- 串行方式没有线程同步的开销,因此在没有并发需求的情况下,串行方式可能会更快
虽然加锁可以解决,但是加锁有一个缺陷就是:只要一个线程在对sum++时,其他线程就会被阻塞,会影响程序运行的效率,而且锁如果控制不好,还容易造成死锁。
因此C++11中引入了原子操作。所谓原子操作:即不可被中断的一个或一系列操作,C++11引入的原子操作类型,使得线程间数据的同步变得非常高效。
- 特别需要注意的一点的要使用以上原子操作变量时,必须添加头文件<atomic>
atomic<int> sum={ 0 }; void fun(int num) { for (int i = 0; i < num; ++i) { ++sum; // 原子操作 } } int main() { cout << "Before joining, sum = " << sum << std::endl; thread t1(fun, 1000000); thread t2(fun, 1000000); t1.join(); t2.join(); cout << "After joining, sum = " << sum << std::endl; return 0; }
在C++11中,程序员不需要对原子类型变量进行加锁解锁操作,线程能够对原子类型变量互斥的访问。
更为普遍的,程序员可以使用atomic类模板,定义出需要的任意原子类型。
atmoic<T> t; // 声明一个类型为T的原子类型变量t
注意:原子类型通常属于"资源型"数据,多个线程只能访问单个原子类型的拷贝,因此在C++11中,原子类型只能从其模板参数中进行构造,不允许原子类型进行拷贝构造、移动构造以及operator=等,为了防止意外,标准库已经将atmoic模板类中的拷贝构造、移动构造、赋值运算符重载默认删除掉了。
int main() { atomic<int> a1(0); //atomic<int> a2(a1); // 编译失败 atomic<int> a2(0); //a2 = a1; // 编译失败 return 0; }
输出展示:
(四)lock_guard与unique_lock
在多线程环境下,如果想要保证某个变量的安全性,只要将其设置成对应的原子类型即可,即高效又不容易出现死锁问题。但是有些情况下,我们可能需要保证一段代码的安全性,那么就只能通过锁的方式来进行控制。
lock_guard 和 unique_lock 都是C++中的互斥锁封装类,用于在多线程环境中实现线程的同步和互斥访问。
- 比如:一个线程对变量number进行加一100次,另外一个减一100次,每次操作加一或者减一之后,输出number的结果,要求:number最后的值为1
int number = 0; mutex mtx; int ThreadProc1() { for (int i = 0; i < 100; i++) { mtx.lock(); ++number; cout << "thread 1 :" << number << endl; mtx.unlock(); } return 0; } int ThreadProc2() { for (int i = 0; i < 100; i++) { mtx.lock(); --number; cout << "thread 2 :" << number << endl; mtx.unlock(); } return 0; } int main() { thread t1(ThreadProc1); thread t2(ThreadProc2); t1.join(); t2.join(); cout << "number:" << number << endl; system("pause"); return 0; }
【解释说明】
- 上述代码的缺陷:锁控制不好时,可能会造成死锁,最常见的比如在锁中间代码返回,或者在锁的范围内抛异常;
- 因此:C++11采用RAII的方式对锁进行了封装,即lock_guard和unique_lock。
1、mutex的种类
在C++中,提供了几种不同类型的互斥锁,每种互斥锁都适用于不同的使用场景和需求。
下面是一些常见的互斥锁类型:
- std::mutex:
- std::mutex是C++标准库中最基本的互斥锁类型,该类的对象之间不能拷贝,也不能进行移动
- 它提供了最基本的上锁(lock)和解锁(unlock)操作,可以保护临界区的互斥访问。
- std::mutex是非递归的,同一个线程多次对同一个互斥锁上锁会导致死锁。
- std::recursive_mutex:
- std::recursive_mutex是一个可递归的互斥锁。
- 不同于std::mutex,std::recursive_mutex允许同一个线程多次对同一个互斥锁上锁。
- 使用递归锁可以防止同一线程在同一个临界区中出现死锁的情况。
- std::timed_mutex:
- std::timed_mutex是一个带有超时机制的互斥锁。
- 它提供了额外的功能,允许线程在尝试获得锁时等待一定的时间,超过时间后可以执行其他操作。
- std::timed_mutex可以通过成员函数try_lock_for()和try_lock_until()来实现尝试获得锁的定时操作。
try_lock_for()
- 接受一个时间范围,表示在这一段时间范围之内线程如果没有获得锁则被阻塞住(与std::mutex 的 try_lock() 不同,try_lock 如果被调用时没有获得锁则直接返回false),如果在此期间其他线程释放了锁,则该线程可以获得对互斥量的锁,如果超时(即在指定时间内还是没有获得锁),则返回 false。
try_lock_until()
- 接受一个时间点作为参数,在指定时间点未到来之前线程如果没有获得锁则被阻塞住,如果在此期间其他线程释放了锁,则该线程可以获得对互斥量的锁,如果超时(即在指定时间内还是没有获得锁),则返回 false。
- std::recursive_timed_mutex:
- std::recursive_timed_mutex是一个同时具有递归和超时功能的互斥锁。
- 它结合了std::recursive_mutex和std::timed_mutex的特性,可以递归地使用,并且支持超时等待。
2、lock_guard
lock_guard 是C++标准库中定义的一个模板类,用于简化互斥锁的使用和管理。它提供了一种基于作用域的方式来自动管理互斥锁的上锁和解锁操作,从而保证线程安全和避免死锁等问题。
- 特性:
- lock_guard 使用了RAII技术。它会在构造函数中对互斥锁进行上锁,而在析构函数中自动对互斥锁进行解锁,无需手动处理。
- lock_guard 是非拷贝构造和非移动构造的,确保同一互斥锁不会被多个 lock_guard 对象同时管理,避免了死锁的可能性。
- lock_guard 对象在创建时自动进行上锁,当其所在的作用域结束时,会自动调用析构函数进行解锁,无需手动编写解锁操作,从而简化了编程。
- 使用方法:
- 首先,需要包含头文件
<mutex>
来使用 lock_guard。 - 创建一个lock_guard 对象时,需要传入一个互斥锁对象作为参数。
- lock_guard 对象的作用域就是所谓的互斥区域,即需要保护的临界区。
- 在 lock_guard 对象的作用域内,可以直接访问共享资源,而无需手动上锁和解锁。
- 当 lock_guard 对象的作用域结束时,会自动调用析构函数,对互斥锁进行解锁。
下面是一个使用lock_guard的示例代码:
mutex mtx; // 互斥锁对象 void Func() { lock_guard<mutex> lock(mtx); // 创建std::lock_guard对象,关联互斥锁 // 在临界区内访问共享资源 cout << "Thread ID: " << this_thread::get_id() << endl; } int main() { thread t1(Func); thread t2(Func); t1.join(); t2.join(); return 0; }
输出展示:
【解释说明】
- 当
t1
和t2
两个线程执行到lock_guard对象的作用域时,会自动上锁互斥锁mtx;
- 在作用域内部,线程可以安全地访问共享资源。当线程执行完临界区的代码后,lock_guard 对象的析构函数会自动调用,从而自动解锁互斥锁。
3、unique_lock
lock_guard的缺陷:太单一,用户没有办法对该锁进行控制,因此C++11又提供了unique_lock
特性:
- 与lock_gard类似,unique_lock类模板也是采用RAII的方式对锁进行了封装。
- 并且也是以独占所有权的方式管理mutex对象的上锁和解锁操作,即其对象之间不能发生拷贝。在构造(或移动(move)赋值)时,unique_lock 对象需要传递一个 Mutex 对象作为它的参数,新创建的unique_lock 对象负责传入的 Mutex 对象的上锁和解锁操作。
- 使用以上类型互斥量实例化unique_lock的对象时,自动调用构造函数上锁,unique_lock对象销毁时自动调用析构函数解锁,可以很方便的防止死锁问题。
与lock_guard不同的是,unique_lock更加的灵活,提供了更多的成员函数:
- 上锁/解锁操作:lock、try_lock、try_lock_for、try_lock_until和unlock
- 修改操作:移动赋值、交换(swap:与另一个unique_lock对象互换所管理的互斥量所有权)、释放(release:返回它所管理的互斥量对象的指针,并释放所有权)
- 获取属性:owns_lock(返回当前对象是否上了锁)、operator bool()(与owns_lock()的功能相
- 同)、mutex(返回当前unique_lock所管理的互斥量的指针)。
下面是一个使用unique_lock的示例代码:
总之,unique_lock 是一个更灵活和强大的互斥锁管理类模板,它提供了比lock_guard更多的功能和选项,适用于复杂的线程同步需求,简化了互斥锁的使用和管理。
(五)condition_variable
condition_variable 是 C++ 标准库中的一个同步原语,用于线程间的条件变量通信。它是一种等待-通知机制,允许一个或多个线程等待某个共享数据的状态发生变化,并在满足特定条件时被唤醒。
condition_variable 的主要成员函数包括:
wait(lock)
: 等待条件变量的通知,同时释放互斥锁,并进入等待状态。当收到通知后,重新获取互斥锁,并继续执行。wait(lock, pred)
: 在满足特定条件(由谓词pred
指定)时等待条件变量的通知。notify_one()
: 唤醒等待队列中的一个线程。notify_all()
: 唤醒等待队列中的所有线程。
使用 condition_variable 需要配合一个 mutex 对象一起使用。通常的做法是,在对共享数据进行访问之前,先获得互斥锁,并在条件不满足的情况下调用 wait
等待条件变量的通知。
接下来我们通过condition_variable 结合上述学到的知识,设计支持出:支持两个线程交替打印,一个打印奇数,一个打印偶数 功能的代码:
void two_thread_print() { mutex mtx; condition_variable c; int n = 100; bool flag = true; thread t1([&]() { int i = 0; while (i < n) { unique_lock<mutex> lock(mtx); c.wait(lock, [&]()->bool {return flag; }); cout << i << endl; flag = false; i += 2; // 偶数 c.notify_one(); } }); thread t2([&]() { int j = 1; while (j < n) { unique_lock<mutex> lock(mtx); c.wait(lock, [&]()->bool {return !flag; }); cout << j << endl; j += 2; // 奇数 flag = true; c.notify_one(); } }); t1.join(); t2.join(); } int main() { two_thread_print(); return 0; }
总结
以上便是关于 C++11 线程库的全部知识介绍。感谢大家的观看与支持!!!