背景
进程中的所有线程终究是同在一个地址空间,所以其他线程终究可能使用一些底层技术来达到访问其他线程中的数据,线程私有数据也不例外。但是通过底层实现线程私有数据机制,然后用函数封装起来,屏蔽底层细节,能给上层应用层提供线程私有数据机制,给应用提供方便,提高线程间数据独立性。
提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档
前言
在多线程环境下,由于数据空间是共享的,因此全局变量也为所有线程所共有。但有时应用程序设计中有必要提供线程私有的全局变量,`仅在某个线程中有效,但却可以跨多个函数访问`.比如程序可能需要每个线程维护一个链表,而使用相同的函数操作,最简单的办法就是使用同名而不同变量地址的线程相关数据结构。这样的数据结构可以由Posix线程库维护,称为线程私有数据(Thread-specific Data,或TSD)。
一、线程私有数据
线程私有数据允许每一个线程保有一份变量的拷贝,每个线程有一串通过共有的“键”值索引的线程私有数据,键对于每个线程都是相同的,但是每个线程都能将它独立的键值与共享键联系,每个线程能在任意时间为键改变它的私有值,而不会影响键或任意外线程拥有的键值
系统(可能是线程函数库)为每个进程维护一个我们称之为Key结构的结构数组。在LinuxThreads的实现中,TSD(Thread-specific Data)池用一个结构数组表示:
tatic struct pthread_key_struct pthread_keys[PTHREAD_KEYS_MAX] = { { 0, NULL } };
每个系统支持有限数量的线程私有数据PTHREAD_KEYS_MAX.
在POSIX线程中,这里需要的键值即为创建一个类型为 pthread_key_t 类型的变量。 并定义下面的API来创建TSD:
int pthread_key_create(pthread_key_t *key, void (*destr_function) (void *)) ;
创建一个TSD就相当于将结构数组中的标志设置为"in_use",并将其索引返回给*key,然后设置destructor函数为destr_function。该函数从TSD池中分配一项,将其值赋给key供以后访问使用。如果destr_function不为空,在线程退出(pthread_exit())时将以key所关联的数据(pthread_setspecific函数的第二个参数,即对应pkey中的值)为参数调用destr_function(),以释放分配的缓冲区。不论哪个线程调用pthread_key_create(),所创建的key都是所有线程可访问的。
示例:pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。
二、函数接口
POSIX线程私有空间函数接口:
pthread_key_t key; int pthread_key_create(pthread_key_t *key, void (*destr_function) (void *)) ; int pthread_key_delete(pthread_key_t key); int pthread_setspecific(pthread_key_t key, const void *pointer) void * pthread_getspecific(pthread_key_t key)
1.创建一个TSD
创建一个TSD采用如下API:
int pthread_key_create(pthread_key_t *key, void (*destr_function) (void *)) ;
创建一个TSD就相当于将结构数组中的标志设置为"in_use",并将其索引返回给*key,然后设置destructor函数为destr_function。该函数从TSD池中分配一项,将其值赋给key供以后访问使用。如果destr_function不为空,在线程退出(pthread_exit())时将以key所关联的数据(pthread_setspecific函数的第二个参数,即对应pkey中的值)为参数调用destr_function(),以释放分配的缓冲区。不论哪个线程调用pthread_key_create(),所创建的key都是所有线程可访问的。
2.注销一个TSD
注销一个TSD采用如下API:
int pthread_key_delete(pthread_key_t key);
这个函数并不检查当前是否有线程正使用该TSD,也不会调用清理函数(destr_function),而只是将TSD释放以供下一次调用pthread_key_create()使用。在LinuxThreads中,它还会将与之相关的线程数据项设为NULL。
3.数据处理
TSD的读写都通过专门的Posix Thread函数进行,其API定义如下:
int pthread_setspecific(pthread_key_t key, const void *pointer) void * pthread_getspecific(pthread_key_t key)
写入(pthread_setspecific())时,将pointer的值(不是所指的内容)与key相关联,而相应的读出函数则将与key相关联的数据读出来。数据类型都设为void *,因此可以指向任何类型的数据。
原理:
传入的pointer会被拷贝到pkey数组中,而pointer可以指向任何的线程私有数据,比如pointer为malloc出来的地址,再为其编写个析构函数free掉pointer,并将这个函数在pthread_key_create时候,通过destructor参数注册进来。线程退出时,会自动调用。
相应的读出函数pthread_getspecific则将与key相关联的数据读出来,即pkey中存的值。
线程内的任何函数都可以调用pthread_getspecific获取到私有数据,而不同的线程调用相同的接口pthread_getspecific(key),得到的结果却不一样,像C++中的多态。
在LinuxThreads中,使用了一个位于线程描述结构(_pthread_descr_struct)中的二维void *指针数组来存放与key关联的数据,数组大小由以下几个宏来说明:
#define PTHREAD_KEY_2NDLEVEL_SIZE 32
#define PTHREAD_KEY_1STLEVEL_SIZE
((PTHREAD_KEYS_MAX + PTHREAD_KEY_2NDLEVEL_SIZE - 1)
/ PTHREAD_KEY_2NDLEVEL_SIZE)
其中在/usr/include/bits/local_lim.h中定义了PTHREAD_KEYS_MAX为1024, 因此一维数组大小为32。而具体存放的位置由key值经过以下计算得到:
idx1st = key / PTHREAD_KEY_2NDLEVEL_SIZE
idx2nd = key % PTHREAD_KEY_2NDLEVEL_SIZE
也就是说,数据存放与一个32×32的稀疏矩阵中。同样,访问的时候也由key值经过类似计算得到数据所在位置索引,再取出其中内容返回。
该处使用的url网络请求的数据。
例子
提示:这里对文章进行总结:
pthread_key_t key; typedef void *(*thread_cb)(void *); void print_thread1_key(void) { int *p = (int *)pthread_getspecific(key); printf("thread 1 : %d\n", *p); } void *thread1_proc(void *arg) { int i = 5; pthread_setspecific(key, &i); print_thread1_key(); } void print_thread2_key(void) { char *ptr = (char *)pthread_getspecific(key); printf("thread 2 : %s\n", ptr); } void *thread2_proc(void *arg) { char *ptr = "thread2_proc"; pthread_setspecific(key, ptr); print_thread2_key(); } struct pair { int x; int y; }; void print_thread3_key(void) { struct pair *p = (struct pair *)pthread_getspecific(key); printf("thread 3 x: %d, y: %d\n", p->x, p->y); } void *thread3_proc(void *arg) { struct pair p = {1, 2}; pthread_setspecific(key, &p); print_thread3_key(); } int main(){ pthread_key_create(&key, NULL); getchar(); return 0; }