原子访问:Interlocked 系列函数
原子访问
原子 加
原子访问就是,一个线程在访问某个资源的同时保证没有其他线程会在同一时刻访问同一资源。"原子性"就是在原子访问中途不能被打断。
windows提供Interlocked系列函数实现这一功能。
LONG InterlockedExchangeAdd( PLONG volatile *plAddend, //要计算的长整形变量的地址 LONG lIncrement //指定的长整形增量 );
这个函数对传入的变量(*plAddend)增加lIncrement的值,volatile要求对系统不进行优化,每次都从内存中读取,而不是寄存器。
volatile:
要求对系统不进行优化,每次都从内存中读取,而不是寄存器。
为什么需要线程同步?
为了避免在一线程对以数据操作过程中(一进行一部分操作但是尚未完成)CPU时间片耗尽当前线程挂起时,另一进程对修改不完全的数据进行操作。
原子 设值
LONG InterlockedExchange( PLONG volatile *plTarget, //要赋值的变量地址 LONG lValue //要赋的值 );
设置一个32位的变量设置为指定的值。
返回TRUE表示修改成功;FALSE表示失败。
原子 比较交换地址
PVOID InterlockedCompareExchangePointer( PVOID volatile *Destination, PVOID Exchange, PVOID Comperand );
如果Destination与Comparand相等,那么就把Destination置为Exchange,其他情况,Destination不变。反回的是原来Destation指向的值,这点一定要注意。
实现旋转锁
BOOL g_fResourceInUse = FALSE; void Func1(){ //Wait to Access the resource while(InterlockedExchange(&g_fResourceInUse,TRUE) == TRUE ) { Sleep(0); } //Access the Resource ... InterlockedExchange(&g_fResourceInUse,FALSE); }
使用旋转锁应该注意的地方:
(1)使用这种同步方式,我们需要保证需要同步的进程是运行在同一优先级的,如果两个线程优先级为6,另一个为4,那么优先级为4的线程不会得到等待资源的机会。
(2)应该避免资源标示和资源本身在同一告诉缓存行 (3)应避免在单处理器的系统上使用旋转锁
旋转锁假定被保护的资源始终只会占用一小段时间。与切换内核模式然后等待相比,在这种情况下以循环的方式进行等待的效率更高。 许多开发人员会循环指定的次数(比如4000),如果届时仍然无法访问资源,那么线程会切换到内核模式,并一直等待到资源可供使用为止(此时它不消耗CPU时间),这就是关键段(Critical Section)的实现方式。
在多处理器的机器上旋转锁比较有用,这是因为当一个线程在CPU上运行的时候,另一个线程可以在另一个CPU上循环等待,
高速缓存行
当一个C P U从内存读取一个字节时,它不只是取出一个字节,它要取出足够的字节来填入高速缓存行。高速缓存行的作用是为了提高C PU 运行的性能。通常情况下,应用程序只能对一组相邻的字节进行处理。如果这些字节在高速缓存中,那么CPU就不必访问内存总线,而访问内存总线需要多得多的时间。
但是在多处理器环境下,高速缓存线使得对内存的更新变得更加困难。
- CPU1读取一个字节,这使得该字节以及与它相邻的字节被读到CPU1的高速缓冲行中。
- CPU2读取同一个字节,这使得该字节被读到CPU2的高速缓存行中。
- CPU1对内存中的这个字节进行修改,这使得该字节被写入到CPU1的高速缓存行中,但这一信息还没有写回到内存。
- CPU2再次读取同一个字节,由于该字节已经在CPU2的高速缓存行中,因此CPU2不需要再访问内存。但CPU2将无法看到该字节在内存中新的值。
明确地说,当一个CPU修改了高速缓存行中的一个字节时,机器中的其他CPU会收到通知,并使自己的高速缓存行作废。当CPU1修改该字节的值时,CPU2的高速缓存就作废了,在第四步中,CPU1必须将它的高速缓存写回内存中,CPU2 必须重新访问内存来填满它的高速缓存行。
高速缓存行虽然能够提高性能,但在多处理器的机器上它们同样能够损伤性能。
结构体设计
读写混放的数据结构(只读与读写的数据放入同一个高速缓存,不好的做法):
struct CUSTINFO { DWORD dwCustomerID; //Mostly read-only int nBalanceDue; //Read-write char szName[100]; //Mostly read-only FILETIME ftLastOrderDate; //Read-write };
改版后:
// Determine the cache line size for the host CPU. // 为各种CPU定义告诉缓存行大小 #ifdef _X86_ #define CACHE_ALIGN 32 #endif #ifdef _ALPHA_ #define CACHE_ALIGN 64 #endif #ifdef _IA64_ #define CACHE_ALIGN ?? #endif #define CACHE_PAD(Name, BytesSoFar) \ BYTE Name[CACHE_ALIGN - ((BytesSoFar) % CACHE_ALIGN)] struct CUSTINFO { DWORD dwCustomerID; // Mostly read-only char szName[100]; // Mostly read-only //Force the following members to be in a different cache line. //这句很关键用一个算出来的Byte来填充空闲的告诉缓存行 //如果指定了告诉缓存行的大小可以简写成这样 //假设sizeof(DWORD) + 100 = 108;告诉缓存行大小为32 //BYTE[12]; //作用呢就是强制下面的数据内容与上面数据内容不在同一高速缓存行中。 CACHE_PAD(bPad1, sizeof(DWORD) + 100); int nBalanceDue; // Read-write FILETIME ftLastOrderDate; // Read-write //Force the following structure to be in a different cache line. CACHE_PAD(bPad2, sizeof(int) + sizeof(FILETIME)); } ;
高级线程同步
应该避免的一种同步方法:
volatile BOOL g_fFinishedCalculation = FALSE; int WINAPI WinMain() { CreateThread(, RecalcFunc, ); //Wait for the recalculation to complete. while(!g_fFinishedCalculation) ; } DWORD WINAPI RecalcFunc(PVOID pvParam) { //Perform the recalculation. g_fFinishedCalculation = TRUE; return(0); }
问题:
(1)主线程没有进入睡眠时间,CPU会一直调度时间轮片给他,从其他线程手中夺走了宝贵的CPU时间。
(2)主线程一直在占用CPU,其他比主线程优先级低的线程根本无法执行。主线程优先级必须和新建线程优先级相同,否则g_fFinishedCalculation永远不会被置True,主线程将无限循环
volatile关键字的作用,告诉编译器不要对变量进行任何的优化,始终在内存中获取fFinishedCalculation的值。
关键段
关键段是一小段代码,它在执行之前需要独占对一些共享资源的访问权。这种方式可以让多行代码以原子方式访问,在当前线程离开关键段之前,系统不会调度任何其他线程访问该关键段。
比如在一个链表管理的例子中,如果对链表的访问没有同步,那么一个线程可能会在另一个线程在链表中查询时向链表添加元素。如果两个线程同时向链表中添加元素情况会更糟。而使用关键段可以有效地防止以上各种情况。
要使用关键段首先需要定义CRITICAL_SECTION结构。然后把任何需要共享的代码放在EnterCriticalSection和LeaveCriticalSection之间。
DWORD WINAPI ThreadProc1(PVOID) { EnterCriticalSection(&g_a); for(int i=0;i<100;i++) g_a++; LeaveCriticalSection(&cs); return 0; }
关键段由于在内部使用了Interlock系列函数因此执行速度非常快。它的缺点是不能在多进程之间对线程进行同步。而信号量和事件则可以。
一般情况下CRITICAL_SECTION结构会作为全局变量来分配,这样进程内的所有线程都可以通过该变量来访问这些结构。实际使用中将此结构作为局部变量、从堆中分配或者是类的私有成员也都是可以的。
但有两个必要条件:
- 想要访问资源的线程必须知道用来访问资源的CRITICAL_SECTION结构的地址。
- 在任何线程访问被保护的资源之前,必须对CRITICAL_SECTION结构进行初始化。初始化调用:
VOID InitializeCriticalSection(PCRITICAL_SECTION pcs);
此函数会设置CRITICAL_SECTION结构的一些成员。如果这些成员没有经过初始化,结果将是不可预料的。
当线程不需要访问共享资源时,应该调用以下函数来清理CRITICAL_SECTION结构:
VOID DeleteCriticalSection(PCRITICAL_SECTION pcs);
为了防止当资源被其他线程占用时,主调线程被挂起,可以调用TryEnterCriticalSection函数,该函数将会检测此时主调线程是否可以访问共享资源。如果资源被占用该函数返回false。否则返回true。
如果检测到资源此时已被占用,主调线程这是可以做其他事情,而不是被挂起。由于TryEnterCriticalSection函数会更新CRITICAL_SECTION结构的某些成员,因此需要对应一个LeaveCriticalSection函数。
Slim 读/写锁
SRWLock 的目的和关键段相同:对一个资源进行保护,不让其他线程访问它。
但是SRWLock 它跟关键段有所不同,读写锁允许我们区分那些想要读取资源的线程和更改资源的线程。
让所有的读取资源的线程同时工作是可行的,因为读取不会破坏数据。只有当写入时才需要对写入线程进行同步。
写入线程必须独占资源,它工作时无论是读取还是写入线程都必须等待。
AcquireSRWLockExclusive(&g_lock);
请求占用读写锁
ReleaseSRWLockExclusive(&g_lock);
请求释放读写锁
条件变量
我们希望线程以原子的方式把锁释放并将自己阻塞,直到某一个条件成立为止。要实现这样的线程同步是比较复杂的。windows通过SleepConditionVariableCS(critical section)或者SleepConditionVariableSRW函数,提供了一种条件变量帮助我们完成这项工作。
当线程检测到相应的条件满足的时候(比如,由数据供读取者使用),他会调用WakeConditionVariable或WakeAllConditionVariable,
这样在Sleep*函数中的线程就会被唤醒。
SleepConditionVariableCS/SleepConditionVariableSRW
使用条件变量睡眠关键段或者读写锁
WakeConditionVariable/WakeAllConditionVariable
使用条件变量唤醒关键段或者读写锁