一、C++线程库
1. 认识thread类
在C++11之前没有多线程的概念,涉及到的与多线程的相关问题都是与操作系统有关的,例如Windows和Linux下都有各自的多线程接口,这使得代码的可移植性较差。因此C++11中最重要的特点就是有了对多线程的支持,使得C++在多线程编程时不需要以来第三方库。要使用标准库中的线程,需要包含<thread>头文件,C++11线程库文档介绍。
线程函数的简单介绍:
函数名 | 功能 |
thread() | 构造一个线程对象,没有关联任何线程函数,即没有启动任何线程 |
thread (fn,args1,args2, …) | 构造一个线程对象,并且关联线程函数fn,args1,args2,… 是线程函数的参数 |
get_id() | 获取线程的id |
joinable() | 判断线程是否在执行,joinable代表的是一个正在执行中的线程 |
join() | 函数调用后会阻塞住线程,当该线程结束后,主线程继续执行 |
detach() | 在创建线程对象后马上调用,用于把被创建线程与线程对象分离开,分离的线程变为后台线程,创建的线程的"死活"就与主线程无关 |
【注意】
- 线程是操作系统中的一个概念,线程对象可以关联一个线程,用来控制线程已经获取线程的状态。
- 当创建一个线程对象后,如果没有提供线程函数,则该对象实际没有对应任何线程。
例如:
int main() { std::thread t1; cout << t1.get_id() << endl; return 0; }
get_id()
的返回值类型为id
类型,id
类型实际为std::thread
命名空间下封装的一个类,该类中包含了一个结构体:
using _Thrd_id_t = unsigned int; struct _Thrd_t { // thread identifier for Win32 void* _Hnd; // Win32 HANDLE _Thrd_id_t _Id; };
- 当创建一个线程对象后,并且给线程关联线程函数,该线程就被启动,与主线程一起运行。线程函数一般情况下可按照以下三种方式提供:
- 函数指针
- lambda表达式
- 函数对象
例如:
void ThreadFunc(int a) { cout << "Thread 1: " << a << endl; } class TF { public: void operator()() { cout << "Thread 3" << endl; } }; int main() { // 线程函数为函数指针 thread t1(ThreadFunc, 10); // 线程函数为Lambda表达式 thread t2([]() { cout << "Thread 2" << endl; }); // 线程函数为函数对象 TF tf; thread t3(tf); t1.join(); t2.join(); t3.join(); return 0; }
- thread类是防拷贝的,不允许拷贝构造以及赋值,但是可以移动构造和移动赋值,即将一个线程对象关联线程的状态转移给其他线程对象,转移期间不意向线程的执行。
- 可以通过
joinable()
函数判断线程是否是有效的,如果是以下任意情况,则线程无效。
- 采用无参构造函数构造的线程对象
- 线程对象的状态已经转移给其他线程对象
- 线程已经调用
join
或者detach
结束
2. 线程函数的参数
线程函数的参数是以值拷贝的方式拷贝到线程栈空间中的,因此:即使线程参数为引用类型,在线程中修改后也不能修改外部实参,因为其实际引用的是线程栈中的拷贝,而不是外部实参。
void ThreadFunc1(int& x) { x += 10; } void ThreadFunc2(int* x) { *x += 10; } int main() { int a = 0; // 在线程函数中对a修改,不会影响外部实参,因为:线程函数参数虽然是引用方式,但其实际引用的是线程栈中的拷贝 thread t1(ThreadFunc1, a); t1.join(); cout << a << endl; // 结果:0 // 如果想要通过形参改变外部实参时,必须借助std::ref()函数 thread t2(ThreadFunc1, std::ref(a)); t2.join(); cout << a << endl; // 结果:10 // 地址的拷贝 thread t3(ThreadFunc2, &a); t3.join(); cout << a << endl; // 结果:20 return 0; }
注意:如果是类成员函数作为线程参数时,必须将this作为线程函数参数。
3. this_thread
在 C++11 中不仅添加了线程类,还添加了一个关于线程的命名空间 std::this_thread
,在这个命名空间中提供了四个公共的成员函数,通过这些成员函数就可以对当前线程进行相关的操作。this_thread 文档
函数名 | 功能 |
get_id() | 获取当前线程的线程 ID |
yield() | 当前线程主动让出自己的时间片 |
sleep_until() | 当前线程休眠到设定的时间点 |
sleep_for() | 当前线程休眠设定的时长 |
二、原子操作
多线程最主要的问题是共享数据带来的问题,即线程安全。如果共享数据都是只读的,那么没问题,因为只读操作不会影响到数据,更不会涉及对数据的修改,所以所有线程都会获得同样的数据。但是,当一个或多个线程要修改共享数据时,就会产生很多潜在的麻烦。比如:
#include <iostream> #include <thread> #include <mutex> using namespace std; unsigned long sum = 0L; void fun(size_t num) { for (size_t i = 0; i < num; ++i) { sum++; } } int main() { cout << "Before joining,sum = " << sum << std::endl; thread t1(fun, 10000000); thread t2(fun, 10000000); t1.join(); t2.join(); cout << "After joining,sum = " << sum << std::endl; return 0; }
理论上计算的结果应该是20000000,但是实际结果是:
sum
是多个线程的共享数据,但是sum++
操作不是原子操作,因此当多个线程对其进行操作时如果不加以保护就会引发线程安全问题。
C++98中传统的解决方式:可以对共享修改的数据可以加锁保护。
#include <iostream> #include <thread> #include <mutex> using namespace std; mutex mtx; unsigned long sum = 0L; void fun(size_t num) { for (size_t i = 0; i < num; ++i) { mtx.lock(); sum++; mtx.unlock(); } } int main() { cout << "Before joining,sum = " << sum << std::endl; thread t1(fun, 10000000); thread t2(fun, 10000000); t1.join(); t2.join(); cout << "After joining,sum = " << sum << std::endl; return 0; }
此时结果就是正确的了。
在C++11中,不需要对原子类型变量进行加锁解锁操作,线程也能够对原子类型变量互斥的访问。更为普遍的,我们可以使用atomic
类模板,定义出需要的任意原子类型。原子库文档
#include <iostream> #include <thread> #include <mutex> #include <atomic> using namespace std; atomic<unsigned long> sum = 0; void fun(size_t num) { for (size_t i = 0; i < num; ++i) { sum++; } } int main() { cout << "Before joining,sum = " << sum << std::endl; thread t1(fun, 10000000); thread t2(fun, 10000000); t1.join(); t2.join(); cout << "After joining,sum = " << sum << std::endl; return 0; }
【注意】
原子类型通常属于"资源型"数据,多个线程只能访问单个原子类型的拷贝,因此在C++11中,原子类型只能从其模板参数中进行构造,不允许原子类型进行拷贝构造、移动构造以及operator=等,为了防止意外,标准库已经将atmoic模板类中的拷贝构造、移动构造、赋值运算符重载默认删除掉了。
#include <atomic> int main() { atomic<int> a1(0); //atomic<int> a2(a1); // 编译失败 atomic<int> a2(0); //a2 = a1; // 编译失败 return 0; }
三、C++互斥锁
在多线程环境下,如果想要保证某个变量的安全性,只要将其设置成对应的原子类型即可,即高效又不容易出现死锁问题。但是有些情况下,我们可能需要保证一段代码的安全性,那么就只能通过锁的方式来进行控制。
比如:一个线程对变量number进行加一100次,另外一个减一100次,每次操作加一或者减一之后,输出number的结果,要求number最后的值不变。
#include <iostream> #include <thread> #include <mutex> int number = 0; mutex g_lock; int ThreadProc1() { for (int i = 0; i < 100; i++) { g_lock.lock(); ++number; cout << "thread 1 :" << number << endl; g_lock.unlock(); } return 0; } int ThreadProc2() { for (int i = 0; i < 100; i++) { g_lock.lock(); --number; cout << "thread 2 :" << number << endl; g_lock.unlock(); } return 0; } int main() { thread t1(ThreadProc1); thread t2(ThreadProc2); t1.join(); t2.join(); cout << "number:" << number << endl; system("pause"); return 0; }
上述代码的缺陷:锁控制不好时,可能会造成死锁,最常见的比如在锁中间代码返回,或者在锁的范围内抛异常。因此:C++11采用RAII的方式对锁进行了封装,即lock_guard
和unique_lock
。
1. mutex
在C++11中,Mutex总共包了四个互斥量的种类:
- std::mutex
C++11提供的最基本的互斥量,该类的对象之间不能拷贝,也不能进行移动。mutex最常用的三个函数:
函数名 | 功能 |
lock() | 上锁:锁住互斥量 |
unlock() | 解锁:释放对互斥量的所有权 |
try_lock() | 尝试锁住互斥量,如果互斥量被其他线程占有,则当前线程也不会被阻塞 |
注意,线程函数调用lock()时,可能会发生以下三种情况:
- 如果该互斥量当前没有被锁住,则调用线程将该互斥量锁住,直到调用 unlock 之前,该线程一直拥有该锁
- 如果当前互斥量被其他线程锁住,则当前的调用线程被阻塞住
- 如果当前互斥量被当前调用线程锁住,则会产生死锁(deadlock)
线程函数调用try_lock()时,可能会发生以下三种情况:
- 如果当前互斥量没有被其他线程占有,则该线程锁住互斥量,直到该线程调用
unlock
释放互斥量 - 如果当前互斥量被其他线程锁住,则当前调用线程返回
false
,而并不会被阻塞掉 - 如果当前互斥量被当前调用线程锁住,则会产生死锁(deadlock)
2.std::recursive_mutex
允许同一个线程对互斥量多次上锁(即递归上锁),来获得对互斥量对象的多层所有权,释放互斥量时需要调用与该锁层次深度相同次数的 unlock(),除此之外,std::recursive_mutex 的特性和 std::mutex 大致相同。
3.std::timed_mutex
比 std::mutex 多了两个成员函数:try_lock_for()和try_lock_until() :
- try_lock_for()
接受一个时间范围作为参数,表示在这一段时间范围之内线程如果没有获得锁则被阻塞住(与std::mutex 的try_lock() 不同,try_lock 如果被调用时没有获得锁则直接返回false),如果在此期间其他线程释放了锁,则该线程可以获得对互斥量的锁,如果超时(即在指定时间内还是没有获得锁),则返回 false。
- try_lock_until()
接受一个时间点作为参数,在指定时间点未到来之前线程如果没有获得锁则被阻塞住,如果在此期间其他线程释放了锁,则该线程可以获得对互斥量的锁,如果超时(即在指定时间内还是没有获得锁),则返回 false。
4.std::recursive_timed_mutex
std::recursive_timed_mutex 将 std::recursive_mutex 的特性和 std::timed_mutex 的特性组合到一个类中:它既支持通过单个线程获取多个锁级别,也支持定时 try-lock 请求。
2. lock_guard
std::lock_gurad
是 C++11 中定义的模板类。其定义如下:
template<class _Mutex> class lock_guard { public: // 在构造lock_gard时,_Mtx还没有被上锁 explicit lock_guard(_Mutex& _Mtx) : _MyMutex(_Mtx) { _MyMutex.lock(); } // 在构造lock_gard时,_Mtx已经被上锁,此处不需要再上锁 lock_guard(_Mutex& _Mtx, adopt_lock_t) : _MyMutex(_Mtx) {} ~lock_guard() _NOEXCEPT { _MyMutex.unlock(); } lock_guard(const lock_guard&) = delete; lock_guard& operator=(const lock_guard&) = delete; private: _Mutex& _MyMutex; };
通过上述代码可以看到,lock_guard类模板主要是通过RAII的方式,对其管理的互斥量进行了封装,在需要加锁的地方,只需要用上述介绍的任意互斥体实例化一个lock_guard,调用构造函数成功上锁,出作用域前,lock_guard对象要被销毁,调用析构函数自动解锁,可以有效避免死锁问题。
但是lock_guard缺点也很明显:功能太单一,用户没有办法对该锁进行控制,因此C++11又提供了unique_lock。
3. unique_lock
与lock_gard类似,unique_lock类模板也是采用RAII的方式对锁进行了封装,并且也是以独占所有权的方式管理mutex对象的上锁和解锁操作,即其对象之间不能发生拷贝。
在构造(或移动(move)赋值)时,unique_lock 对象需要传递一个 Mutex 对象作为它的参数,新创建的 unique_lock 对象负责传入的 Mutex 对象的上锁和解锁操作。使用以上类型互斥量实例化unique_lock的对象时,自动调用构造函数上锁,unique_lock 对象销毁时自动调用析构函数解锁,可以很方便的防止死锁问题。
与lock_guard不同的是,unique_lock更加的灵活,提供了更多的成员函数:
- 上锁/解锁操作:lock、try_lock、try_lock_for、try_lock_until和unlock
- 修改操作:移动赋值、交换(swap:与另一个unique_lock对象互换所管理的互斥量所有权)、释放(release:返回它所管理的互斥量对象的指针,并释放所有权)
- 获取属性:owns_lock(返回当前对象是否上了锁)、operator bool()(与owns_lock()的功能相同)、mutex(返回当前unique_lock所管理的互斥量的指针)。
四、C++条件变量
1. condition_variable
std::condition_variable
是C++标准库中的条件变量,利用它可以实现多个线程间的同步操作;当条件不满足时,相关线程被一直阻塞,直到某种条件出现,这些线程才会被唤醒。参考文档
主要成员函数如下:
条件变量是利用线程间共享的全局变量进行同步的一种机制,主要包括两种状态:
- 一个线程因等待"条件变量的条件成立"而挂起;
- 另外一个线程使"条件成立",给出信号,从而唤醒被等待的线程。
为了防止竞争,条件变量的使用总是和一个互斥锁结合在一起:通常情况下这个锁是std::mutex
,并且管理这个锁只能是 std::unique_lock<std::mutex>
RAII模板类。
2. 实现两个线程交替打印奇偶数
以下是使用C++的条件变量condition_variable
的一个例子:用两个线程交替打印 0 ~ 100 之间的数,其中一个线程打印奇数,另一个线程一个打印偶数。
#include <iostream> #include <thread> #include <mutex> using namespace std; int main() { int i = 0; int n = 100; mutex mtx; condition_variable cv; // 定义条件变量 bool ready = true; // t1打印奇数 thread t1([&]() { while (i < n) { unique_lock<mutex> lock(mtx); cv.wait(lock, [&ready](){return !ready; }); cout << "t1--" << this_thread::get_id() << ":" << i << endl; i += 1; ready = true; cv.notify_one(); } }); // t2打印偶数 thread t2([&]() { while (i < n) { unique_lock<mutex> lock(mtx); cv.wait(lock, [&ready](){return ready; }); cout <<"t2--"<<this_thread::get_id() << ":" << i << endl; i += 1; ready = false; cv.notify_one(); } }); this_thread::sleep_for(chrono::seconds(3)); cout << "t1:" << t1.get_id() << endl; cout << "t2:" << t2.get_id() << endl; t1.join(); t2.join(); return 0; }
由此,使用环境变量便可以控制两个线程交替执行。