前言Socket在实际系统程序开发当中,应用非常广泛,也非常重要。实际应用中服务器经常需要支持多个客户端连接,实现高并发服务器模型显得尤为重要。高并发服务器从简单的循环服务器模型处理少量网络并发请求,演进到解决C10K,C10M问题的高并发服务器模型。本文通过一个简单的多线程模型,带领大家学习如何自己实现一个简单的并发服务器。
C/S架构
服务器-客户机,即Client-Server(C/S)结构。C/S结构通常采取两层结构。服务器负责数据的管理,客户机负责完成与用户的交互任务。
在C/S结构中,应用程序分为两部分:服务器部分和客户机部分。服务器部分是多个用户共享的信息与功能,执行后台服务,如控制共享数据库的操作等;客户机部分为用户所专有,负责执行前台功能,在出错提示、在线帮助等方面都有强大的功能,并且可以在子程序间自由切换。
如上图所示:这是基于套接字实现客户端和服务器相连的函数调用关系,socket API资料比较多,本文不再过多叙述。
pthread线程库:(POSIX)
pthread线程库是Linux下比较常用的一个线程库,关于他的用法和特性大家可以自行搜索相关文章,下面只简单介绍他的用法和编译。
线程标识
线程有ID, 但不是系统唯一, 而是进程环境中唯一有效. 线程的句柄是pthread_t类型, 该类型不能作为整数处理, 而是一个结构. 下面介绍两个函数:
头文件: <pthread.h> 原型: int pthread_equal(pthread_t tid1, pthread_t tid2); 返回值: 相等返回非0, 不相等返回0. 说明: 比较两个线程ID是否相等. 头文件: <pthread.h> 原型: pthread_t pthread_self(); 返回值: 返回调用线程的线程ID.
线程创建
在执行中创建一个线程, 可以为该线程分配它需要做的工作(线程执行函数), 该线程共享进程的资源. 创建线程的函数pthread_create()
头文件: <pthread.h> 原型: int pthread_create(pthread_t *restrict tidp, const pthread_attr_t *restrict attr, void *(start_rtn)(void), void *restrict arg); 返回值: 成功则返回0, 否则返回错误编号. 参数: tidp: 指向新创建线程ID的变量, 作为函数的输出. attr: 用于定制各种不同的线程属性, NULL为默认属性(见下). start_rtn: 函数指针, 为线程开始执行的函数名.该函数可以返回一个void *类型的返回值, 而这个返回值也可以是其他类型,并由 pthread_join()获取 arg: 函数的唯一无类型(void)指针参数, 如要传多个参数, 可以用结构封装.
编译
因为pthread的库不是linux系统的库,所以在进行编译的时候要加上 -lpthread # gcc filename -lpthread //默认情况下gcc使用c库,要使用额外的库要这样选择使用的库
常见的网络服务器模型
本文结合自己的理解,主要以TCP为例,总结了几种常见的网络服务器模型的实现方式,并最终实现一个简单的命令行聊天室。
单进程循环
单线进程循环原理就是主进程没和客户端通信,客户端都要先连接服务器,服务器接受一个客户端连接后从客户端读取数据,然后处理并将处理的结果返还给客户端,然后再接受下一个客户端的连接请求。
优点单线程循环模型优点是简单、易于实现,没有同步、加锁这些麻烦事,也没有这些开销。
缺点
- 阻塞模型,网络请求串行处理;
- 没有利用多核cpu的优势,网络请求串行处理;
- 无法支持同时多个客户端连接;
- 程序串行操作,服务器无法实现同时收发数据。
单线程IO复用
linux高并发服务器中常用epoll作为IO复用机制。线程将需要处理的socket读写事件都注册到epoll中,当有网络IO发生时,epoll_wait返回,线程检查并处理到来socket上的请求。
优点
- 实现简单, 减少锁开销,减少线程切换开销。
缺点
- 只能使用单核cpu,handle时间过长会导致整个服务挂死;
- 当有客户端数量超过一定数量后,性能会显著下降;
- 只适用高IO、低计算,handle处理时间短的场景。
多线程/多进程
多线程、多进程模型主要特点是每个网络请求由一个进程/线程处理,线程内部使用阻塞式系统调用,在线程的职能划分上,可以由一个单独的线程处理accept连接,其余线程处理具体的网络请求(收包,处理,发包);还可以多个进程单独listen、accept网络连接。
优点:
1、实现相对简单;2、利用到CPU多核资源。
缺点:
1、线程内部还是阻塞的,举个极端的例子,如果一个线程在handle的业务逻辑中sleep了,这个线程也就挂住了。
多线程/多进程IO复用
多线程、多进程IO服用模型,每个子进程都监听服务,并且都使用epoll机制来处理进程的网络请求,子进程 accept() 后将创建已连接描述符,然后通过已连接描述符来与客户端通信。该机制适用于高并发的场景。
优点:
- 支撑较高并发。
缺点:
- 异步编程不直观、容易出错
多线程划分IO角色
多线程划分IO角色主要功能有:一个accept thread处理新连接建立;一个IO thread pool处理网络IO;一个handle thread pool处理业务逻辑。使用场景如:电销应用,thrift TThreadedSelectorServer。
优点:
- 按不同功能划分线程,各线程处理固定功能,效率更高
- 可以根据业务特点配置线程数量来性能调优
缺点:
- 线程间通信需要引入锁开销
- 逻辑较复杂,实现难度大
小结
上面介绍了常见的网络服务器模型,还有AIO、协程,甚至还有其他的变型,在这里不再讨论。重要的是理解每种场景中所面临的问题和每种模型的特点,设计出符合应用场景的方案才是好方案。
多线程并发服务器模型
下面我们主要讨论多线程并发服务器模型。
代码结构
并发服务器代码结构如下:
thread_func() { while(1) { recv(...); process(...); send(...); } close(...); } main( socket(...); bind(...); listen(...); while(1) { accept(...); pthread_create(); } }
由上可以看出,服务器分为两部分:主线程、子线程。
主线程
main函数即主线程,它的主要任务如下:
- socket()创建监听套字;
- bind()绑定端口号和地址;
- listen()开启监听;
- accept()等待客户端的连接,
- 当有客户端连接时,accept()会创建一个新的套接字new_fd;
- 主线程会创建子线程,并将new_fd传递给子线程。
子线程
- 子线程函数为thread_func(),他通过new_fd处理和客户端所有的通信任务。
客户端连接服务器详细步骤
下面我们分步骤来看客户端连接服务器的分步说明。
1. 客户端连接服务器
- 服务器建立起监听套接字listen_fd,并初始化;
- 客户端创建套接字fd1;
- 客户端client1通过套接字fd1连接服务器的listen_fd;
2. 主线程创建子线程thread1
- server收到client1的连接请求后,accpet函数会返回一个新的套接字newfd1;
- 后面server与client1的通信就依赖newfd1,监听套接字listen_fd会继续监听其他客户端的连接;
- 主线程通过pthead_create()创建一个子线程thread1,并把newfd1传递给thread1;
- server与client1的通信就分别依赖newfd1、fd1。
- client1为了能够实时收到server发送的信息,同时还要能够从键盘上读取数据,这两个操作都是阻塞的,没有数据的时候进程会休眠,所以必须创建子线程read_thread;
- client1的主线负责从键盘上读取数据并发送给,子线程read_thread负责从server接受信息。
3. client2连接服务器
- 客户端client2创建套接字fd2;
- 通过connect函数连接server的listen_fd;
4. 主线程创建子线程thread2
- server收到client2的连接请求后,accpet函数会返回一个新的套接字newfd2;
- 后面server与client2的通信就依赖newfd2,监听套接字listen_fd会继续监听其他客户端的连接;
- 主线程通过pthead_create()创建一个子线程thread2,并把newfd2传递给thread2;
- server与client1的通信就分别依赖newfd2、fd2。
- 同样client2为了能够实时收到server发送的信息,同时还要能够从键盘上读取数据必须创建子线程read_thread;
- client1的主线负责从键盘上读取数据并发送给,子线程read_thread负责从server接受信息。
由上图可见,每一个客户端连接server后,server都要创建一个专门的thread负责和该客户端的通信;每一个客户端和server都有一对固定的fd组合用于连接。
实例
好了,理论讲完了,根据一口君的惯例,也继承祖师爷的教诲:talk is cheap,show you my code.不上代码,只写理论的文章都是在耍流氓。
本例的主要功能描述如下:
- 实现多个客户端可以同时连接服务器;
- 客户端可以实现独立的收发数据;
- 客户端发送数据给服务器后,服务器会将数据原封不动返回给客户端。
服务器端
/********************************************* 服务器程序 TCPServer.c 公众号:一口Linux *********************************************/ #include <stdio.h> #include <sys/types.h> #include <sys/socket.h> #include <arpa/inet.h> #include <errno.h> #include <string.h> #include <pthread.h> #include <stdlib.h> #define RECVBUFSIZE 2048 void *rec_func(void *arg) { int sockfd,new_fd,nbytes; char buffer[RECVBUFSIZE]; int i; new_fd = *((int *) arg); free(arg); while(1) { if((nbytes=recv(new_fd,buffer, RECVBUFSIZE,0))==-1) { fprintf(stderr,"Read Error:%s\n",strerror(errno)); exit(1); } if(nbytes == -1) {//客户端出错了 返回值-1 close(new_fd); break; } if(nbytes == 0) {//客户端主动断开连接,返回值是0 close(new_fd); break; } buffer[nbytes]='\0'; printf("I have received:%s\n",buffer); if(send(new_fd,buffer,strlen(buffer),0)==-1) { fprintf(stderr,"Write Error:%s\n",strerror(errno)); exit(1); } } } int main(int argc, char *argv[]) { char buffer[RECVBUFSIZE]; int sockfd,new_fd,nbytes; struct sockaddr_in server_addr; struct sockaddr_in client_addr; int sin_size,portnumber; char hello[]="Hello! Socket communication world!\n"; pthread_t tid; int *pconnsocke = NULL; int ret,i; if(argc!=2) { fprintf(stderr,"Usage:%s portnumber\a\n",argv[0]); exit(1); } /*端口号不对,退出*/ if((portnumber=atoi(argv[1]))<0) { fprintf(stderr,"Usage:%s portnumber\a\n",argv[0]); exit(1); } /*服务器端开始建立socket描述符 sockfd用于监听*/ if((sockfd=socket(AF_INET,SOCK_STREAM,0))==-1) { fprintf(stderr,"Socket error:%s\n\a",strerror(errno)); exit(1); } /*服务器端填充 sockaddr结构*/ bzero(&server_addr,sizeof(struct sockaddr_in)); server_addr.sin_family =AF_INET; /*自动填充主机IP*/ server_addr.sin_addr.s_addr=htonl(INADDR_ANY);//自动获取网卡地址 server_addr.sin_port =htons(portnumber); /*捆绑sockfd描述符*/ if(bind(sockfd,(struct sockaddr *)(&server_addr),sizeof(struct sockaddr))==-1) { fprintf(stderr,"Bind error:%s\n\a",strerror(errno)); exit(1); } /*监听sockfd描述符*/ if(listen(sockfd, 10)==-1) { fprintf(stderr,"Listen error:%s\n\a",strerror(errno)); exit(1); } while(1) { /*服务器阻塞,直到客户程序建立连接*/ sin_size=sizeof(struct sockaddr_in); if((new_fd = accept(sockfd,(struct sockaddr *)&client_addr,&sin_size))==-1) { fprintf(stderr,"Accept error:%s\n\a",strerror(errno)); exit(1); } pconnsocke = (int *) malloc(sizeof(int)); *pconnsocke = new_fd; ret = pthread_create(&tid, NULL, rec_func, (void *) pconnsocke); if (ret < 0) { perror("pthread_create err"); return -1; } } //close(sockfd); exit(0); }
客户端
/********************************************* 服务器程序 TCPServer.c 公众号:一口Linux *********************************************/ #include <stdio.h> #include <sys/types.h> #include <sys/socket.h> #include <arpa/inet.h> #include <errno.h> #include <string.h> #include <pthread.h> #include <stdlib.h> #define RECVBUFSIZE 1024 void *func(void *arg) { int sockfd,new_fd,nbytes; char buffer[RECVBUFSIZE]; new_fd = *((int *) arg); free(arg); while(1) { if((nbytes=recv(new_fd,buffer, RECVBUFSIZE,0))==-1) { fprintf(stderr,"Read Error:%s\n",strerror(errno)); exit(1); } buffer[nbytes]='\0'; printf("I have received:%s\n",buffer); } } int main(int argc, char *argv[]) { int sockfd; char buffer[RECVBUFSIZE]; struct sockaddr_in server_addr; struct hostent *host; int portnumber,nbytes; pthread_t tid; int *pconnsocke = NULL; int ret; //检测参数个数 if(argc!=3) { fprintf(stderr,"Usage:%s hostname portnumber\a\n",argv[0]); exit(1); } //argv2 存放的是端口号 ,读取该端口,转换成整型变量 if((portnumber=atoi(argv[2]))<0) { fprintf(stderr,"Usage:%s hostname portnumber\a\n",argv[0]); exit(1); } //创建一个 套接子 if((sockfd=socket(AF_INET,SOCK_STREAM,0))==-1) { fprintf(stderr,"Socket Error:%s\a\n",strerror(errno)); exit(1); } //填充结构体,ip和port必须是服务器的 bzero(&server_addr,sizeof(server_addr)); server_addr.sin_family=AF_INET; server_addr.sin_port=htons(portnumber); server_addr.sin_addr.s_addr = inet_addr(argv[1]);//argv【1】 是server ip地址 /*¿Í»§³ÌÐò·¢ÆðÁ¬œÓÇëÇó*/ if(connect(sockfd,(struct sockaddr *)(&server_addr),sizeof(struct sockaddr))==-1) { fprintf(stderr,"Connect Error:%s\a\n",strerror(errno)); exit(1); } //创建线程 pconnsocke = (int *) malloc(sizeof(int)); *pconnsocke = sockfd; ret = pthread_create(&tid, NULL, func, (void *) pconnsocke); if (ret < 0) { perror("pthread_create err"); return -1; } while(1) { #if 1 printf("input msg:"); scanf("%s",buffer); if(send(sockfd,buffer,strlen(buffer),0)==-1) { fprintf(stderr,"Write Error:%s\n",strerror(errno)); exit(1); } #endif } close(sockfd); exit(0); }
编译编译线程,需要用到pthread库,编译命令如下:
- gcc s.c -o s -lpthread
- gcc cli.c -o c -lpthread 先本机测试
- 开启一个终端 ./s 8888
- 再开一个终端 ./cl 127.0.0.1 8888,输入一个字符串"qqqqqqq"
- 再开一个终端 ./cl 127.0.0.1 8888,输入一个字符串"yikoulinux"
有读者可能会注意到,server创建子线程的时候用的是以下代码:
pconnsocke = (int *) malloc(sizeof(int)); *pconnsocke = new_fd; ret = pthread_create(&tid, NULL, rec_func, (void *) pconnsocke); if (ret < 0) { perror("pthread_create err"); return -1; }
为什么必须要malloc一块内存专门存放这个新的套接字呢?
这个是一个很隐蔽,很多新手都容易犯的错误。下一章,我会专门给大家讲解。
本系列文章预计会更新4-5篇。最终目的是写出一个带登录注册公聊私聊等功能的聊天室。喜欢的话请收藏关注。