select基本介绍
1、前言
首先说一下观点:人人都应该懂:select、poll、epoll。
无论是做web开发的,还是做大数据开发,都应该懂这些。
这三个知识点,很重要,原因有三条:(1) 面试中经常被问到。尤其是面试高级工程师,架构师的时候。(2) 一切高并发框架的基础技术支撑。Nginx,Redis,kafka等框架都立足于这些基 础技术。(3)select、poll、epoll代表着一种数据结构,代表着一种算法思想,应该好好的去学 习,去体会。其实很多人对数据结构和算法不了解,投入力度不大,觉得工作中用不到, 其实,其实这个观点要纠正一下。
2、文件与监控
在linux里面,一切都是文件,键盘,显示器等等,一切都是文件。每个文件都有一个id 来标识,被称为文件描述符。每个文件都有可读,可写,异常三大事件。
类似: 在Java里面,除了基本类型,其他的一切都是对象,每个对象都有一个ID,也就是哈希 值。
那如何监控这些事件呢?很简单,就是把它放在系统内核里面,让系统去监控。
可是放进去之后,事件没有发生怎么办?可以一直等着,那就是堵塞;如果不等,马上返 回,那就是非堵塞了。
这些文件事件的监控的具体实现就是select函数调用。所以说select函数非常重要啊。
3、select介绍
select本质就是文件事件的监控机制,是linux最本质,最核心的东西。
整个监控的流程分为几个基本步骤:第一步:确定监控的文件是什么,定义其文件id 第二步:把文件放到一个集合里面,可以放多个文件,也就可以监控多个文件。具体怎么放置,类似于bitmap,一个bit位表示一个文件。第四步:将文件集合,复制三份,并分别监控可读,可写,发生错误三种事件。第五步:将文件集合,放到系统内核,并设置过期时间。到一定时间,如果没有发生事件 就返回。
int select(int maxfd, fd_set *readset, fd_set *writeset, fd_set *exceptset,struct timeval *timeout);
下面说一下对函数的解释:
返回结果是int类型的 maxfd就是要监控的文件的集合 第二个参数readset,是第一个参数的复制,对可读事件的监控 第三个参数writeset,是第一个参数的复制,对可写事件的监控 第四个参数exceptset,是第一个参数的复制,对异常事件的监控 timeout,表示准备监控多久
4、select源码例子
//客户端 #include <sys/types.h> #include <sys/socket.h> #include <stdio.h> #include <netinet/in.h> #include <arpa/inet.h> #include <unistd.h> #include <stdlib.h> #include <sys/time.h> int main() { //第一步:建立客户端socket int client_sockfd = socket(AF_INET, SOCK_STREAM, 0); //第二步:规划地址, struct sockaddr_in address; address.sin_family = AF_INET; address.sin_addr.s_addr = inet_addr("127.0.0.1"); address.sin_port = htons(9999); int len = sizeof(address); //第三步:建立连接 int result = connect(client_sockfd, (struct sockaddr *)&address, len); if(result == -1) { perror("oops: client2"); exit(1); } char buffer = '@'; write(client_sockfd, &buffer, 1); read(client_sockfd, &buffer, 1); printf("收到服务器的返回:%c\n", buffer); close(client_sockfd); printf("关闭链接\n"); return 0; }
#include <sys/types.h> #include <sys/socket.h> #include <stdio.h> #include <netinet/in.h> #include <sys/time.h> #include <sys/ioctl.h> #include <unistd.h> #include <stdlib.h> #define FALSE 0 #define TRUE 1 int main() { //第一步:建立一个socket int server_sockfd = socket(AF_INET, SOCK_STREAM, 0); //第二步:建立一个地址,好比是规划局,规划出一块儿地 struct sockaddr_in server_address ; server_address.sin_family = AF_INET; server_address.sin_addr.s_addr = htonl(INADDR_ANY); server_address.sin_port = htons(9999); int server_len = sizeof(server_address); //第三步:将socket绑定到地址 bind(server_sockfd, (struct sockaddr *)&server_address, server_len); //第四步:建立一个监听队列,监听队列最多容纳5个链接 listen(server_sockfd, 5); //第五步:建立两个文件集合,将服务器socket加入到集合中,类似于一个哈希表,元素是socket,然后socket带着一个队列,队列里面放在它监听的队列,长度是5 fd_set originalfds, forkfds; FD_ZERO(&originalfds); FD_SET(server_sockfd, &originalfds); //总结一下:上面的五步,其实就是一个哈希结构, while(TRUE) { forkfds = originalfds;//将需要监视的描述符集copy到select查询队列中,select会对其修改,所以一定要分开使用变量 printf("server开启等待模式\n"); /*无限期阻塞,一直等待事件的发生*/ int result = select(FD_SETSIZE, &forkfds, (fd_set *)0,(fd_set *)0, (struct timeval *) 0); //FD_SETSIZE:系统默认的最大文件描述符,为什么是所有呢?留作一个疑问题 if(result < 1) { perror("server is error"); exit(1); } int fd = 0; for(fd = 0; fd < FD_SETSIZE; fd++) { if(FD_ISSET(fd,&forkfds)) { if(fd == server_sockfd) {//判断是否为服务器套接字,否则表示为客户请求连接。虽然在整个linux系列里面同时存在了n个文件,但是在此进程里面,就两种类型的文件:服务器端的socket,客户端的socket struct sockaddr_in client_address; int client_len = sizeof(client_address); int client_sockfd = accept(server_sockfd, (struct sockaddr *)&client_address, &client_len); FD_SET(client_sockfd, &originalfds); printf("添加监控client端的socket fd: %d\n", client_sockfd); } else { int readcount; ioctl(fd, FIONREAD, &readcount); if(readcount == 0) { //客户数据请求完毕,关闭套接字,从集合中清除相应描述符 close(fd); FD_CLR(fd, &originalfds); printf("移除监控client端的socket fd: %d\n", fd); } else { //处理客户数据请求 char buffer; read(fd, &buffer, 1); printf("处理client端的socket fd: %d\n", fd); printf("收到客户端发送的数据:%c\n", buffer); write(fd, &buffer, 1); } } } } } return 0; }