【Linux IO多路复用 】 Linux下select函数全解析:驾驭I-O复用的高效之道

本文涉及的产品
全局流量管理 GTM,标准版 1个月
云解析 DNS,旗舰版 1个月
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
简介: 【Linux IO多路复用 】 Linux下select函数全解析:驾驭I-O复用的高效之道

引言

在计算机编程中,掌握不同的技术和方法能让我们更高效地解决问题。本文将介绍select,一个用于I/O复用的技术。我们将首先探讨为什么要了解select,然后简要介绍I/O复用技术。

1.1. 为什么要了解select

了解select的原因主要有以下几点:

  1. 提高性能:select能够帮助程序在处理多个输入/输出源时更加高效。通过使用select,可以使得程序在等待一个I/O操作完成时继续执行其他任务,从而提高整体性能。
  2. 可扩展性:select使得程序可以处理更多的并发连接。这对于开发服务器应用程序尤为重要,因为它们需要同时处理多个客户端连接。
  3. 跨平台兼容性:select是一个通用的I/O复用技术,它在不同的操作系统和平台上都有实现。这意味着使用select编写的代码具有较好的可移植性。
  4. 建立基础知识:掌握select这类基本的I/O复用技术,有助于理解更高级和更复杂的技术,例如pollepoll等。

1.2. I/O复用技术的简介

I/O复用是一种让单个进程能够同时处理多个I/O操作的技术。在传统的同步I/O模型中,进程在等待I/O操作完成时会阻塞,这会导致程序的执行效率降低。而I/O复用技术通过将多个I/O操作复用到一个单独的同步对象上,使得程序能够在等待一个I/O操作时处理其他操作。

select是I/O复用技术中最基本和最广泛使用的一种方法。它通过使用一个集合来跟踪多个文件描述符(例如套接字)的状态。程序可以使用select函数来查询这些文件描述符的状态,然后根据状态执行相应的操作。这使得程序能够有效地处理多个I/O操作,而不会因为阻塞在某个操作上而降低整体性能。

在接下来的章节中,我们将更深入地了解select的原理和使用方法,并通过实例来展示如何利用select编写高效的程序。

select函数概述

select函数是一种用于实现I/O复用的方法,它可以让程序在多个文件描述符(例如套接字)之间进行选择,以便在其中任何一个或多个可用时执行I/O操作。这种机制使得程序能够更高效地处理多个I/O操作。下面将对select的原理和工作机制进行详细介绍,并分析select函数的优势和局限。

2.1. select的原理和工作机制

select函数的原理和工作机制可以概括为以下几个步骤:

  1. 初始化文件描述符集合:程序需要为select函数准备三个文件描述符集合,分别表示要监控的读、写和异常条件。这些集合通常由FD_SET、FD_CLR、FD_ISSET和FD_ZERO这四个宏来操作。
  2. 调用select函数:程序调用select函数,并传入监控的文件描述符集合。此外,还需要设置一个超时时间,以便在没有任何I/O事件发生时,select函数能够在超时后返回。
  3. 等待I/O事件:select函数会阻塞,直到至少有一个文件描述符准备好进行I/O操作,或者超时时间到达。
  4. 检查文件描述符状态:select函数返回后,程序需要检查文件描述符集合的状态,以确定哪些文件描述符准备好进行I/O操作。然后,程序可以根据文件描述符的状态来执行相应的读、写或异常处理操作。
  5. 重复以上过程:在执行完当前的I/O操作后,程序可以再次调用select函数,以继续监控文件描述符的状态。

文件描述符集合 fd_set 在底层实现上通常是一个位数组(bit array),而不是一个传统的元素数组。每个位对应一个文件描述符,如果某个位被设置为1,那么对应的文件描述符就在这个集合中。

为什么使用位数组?

使用位数组而不是元素数组的一个原因是效率。位数组允许操作系统更快地检查和修改文件描述符的状态,尤其是当有大量的文件描述符需要监控时。位数组的每个元素通常是一个无符号整数(如 unsigned long),每个整数可以表示多个文件描述符的状态。

如何操作 fd_set

虽然 fd_set 在底层是一个位数组,但你通常不需要直接操作这个数组。而是应该使用提供的宏来操作 fd_set

  • FD_ZERO(fd_set *set): 清除文件描述符集合。
  • FD_SET(int fd, fd_set *set): 将一个文件描述符添加到集合中。
  • FD_CLR(int fd, fd_set *set): 从集合中移除一个文件描述符。
  • FD_ISSET(int fd, fd_set *set): 检查一个文件描述符是否在集合中。

这些宏抽象了底层的位操作,提供了一个更简单和更安全的方法来操作文件描述符集合。

文件描述符的限制

因为 fd_set 是一个位数组,所以它有一个固定的大小,这意味着它能表示的文件描述符数量是有限的。这个限制通常是由 FD_SETSIZE 常量定义的,它指定了 fd_set 能够跟踪的最大文件描述符数量。如果你需要监控的文件描述符数量超过了这个限制,你可能需要使用其他I/O多路复用机制,如 pollepoll,它们不受这个限制。

select 函数的文件描述符限制通常为1024,这个限制主要是由于其历史设计和实现方式决定的。

历史设计
  1. fd_set 的大小: fd_set 是一个位数组,其大小由 FD_SETSIZE 定义。在许多系统上,FD_SETSIZE 被设置为1024,意味着 fd_set 可以表示的文件描述符从0到1023。
  2. 位操作: select 函数使用位操作来检查文件描述符的状态。如果文件描述符的数量超过了 FD_SETSIZE 的值,那么 fd_set 就无法表示所有的文件描述符,从而导致 select 无法正常工作。
限制的影响

这个1024的限制意味着如果一个程序需要处理超过1024个并发连接或文件,select 就不再适用。这在现代高性能网络服务器中是一个明显的瓶颈。

解决方案
  1. 增加 FD_SETSIZE 的值: 一些系统允许你在编译前修改 FD_SETSIZE 的值,但这通常需要重新编译系统的C库,并可能导致不兼容的问题。
  2. 使用 pollepoll: 这些是更现代的I/O多路复用机制,它们没有这样的文件描述符数量限制,并且在处理大量文件描述符时性能更好。
  • poll: 提供了与 select 类似的功能,但没有文件描述符数量的限制。
  • epoll: 是Linux特有的,提供了更高效的事件通知机制。

在需要处理大量并发连接的应用程序中,epoll 通常是更好的选择,因为它提供了更好的扩展性和性能。

2.2. select函数的优势和局限

优势:

  1. 跨平台兼容性:select是一个通用的I/O复用技术,它在不同的操作系统和平台上都有实现,因此使用select编写的代码具有较好的可移植性。
  2. 提高程序性能:select允许程序在等待一个I/O操作完成时继续执行其他任务,从而提高了程序的整体性能。这在处理多个客户端连接时,可以更有效地分配计算资源。
  3. 简单易用:select接口相对简单,易于理解和使用。这使得开发人员可以在不了解复杂I/O复用技术的情况下快速实现多任务处理。
  4. 适用于多种I/O场景:select函数可以用于处理多种类型的文件描述符,包括套接字、文件、管道等,因此在实际应用中具有较高的灵活性。

局限:

  1. 可扩展性问题:select使用固定大小的文件描述符集合,这意味着它在处理大量并发连接时可能会受到限制。此外,select需要遍历整个文件描述符集合,因此在处理大量文件描述符时,性能可能会降低。
  2. 高负载下效率较低:当系统中有大量文件描述符时,select需要遍历所有描述符,以确定哪些描述符准备好进行I/O操作。这会导致较低的效率,尤其是在高负载情况下。
  3. 频繁的复制操作:由于select在返回后会修改传入的文件描述符集合,因此每次调用select之前,程序需要重新设置文件描述符集合。这可能导致频繁的复制操作,从而降低程序性能。
  4. 返回的不是准确的就绪描述符数:当select函数返回时,它并不会告诉我们哪些文件描述符准备好进行I/O操作,而只是告诉我们有多少个文件描述符准备好。程序需要遍历所有文件描述符,以确定具体哪些描述符准备好,这会增加程序的复杂性。
  5. 没有实时通知机制:select只能通过轮询的方式查询文件描述符的状态,而无法实时地响应I/O事件。这在某些情况下可能导致较高的延迟。

总之,select函数在一些场景下具有优势,但也存在一些局限性。对于需要处理大量并发连接的高性能服务器应用程序,可以考虑使用其他高级I/O复用技术,如pollepoll等。

select函数详解

为了更好地理解select函数,本节将详细介绍其函数原型、参数解析以及返回值分析。

3.1. 函数原型

在C语言中,select函数的原型如下:

int select(int nfds, fd_set *readfds, fd_set *writefds, fd_set *exceptfds, struct timeval *timeout);

3.2. 参数解析

接下来,我们将逐个解析select函数的参数。

3.2.1. nfds

nfds表示需要监控的文件描述符的最大值加1。这个值通常设为所有文件描述符中的最大值加1,以确保select能够正确地监控所有需要的文件描述符。

3.2.2. readfds, writefds, exceptfds

readfdswritefdsexceptfds分别表示要监控的读、写和异常条件的文件描述符集合。它们是由fd_set类型表示的位图结构。可以使用以下四个宏来操作这些集合:

  • FD_SET(fd, &set): 将文件描述符fd添加到set集合中。
  • FD_CLR(fd, &set): 从set集合中删除文件描述符fd
  • FD_ISSET(fd, &set): 检查fd是否在set集合中。
  • FD_ZERO(&set): 清空set集合。

3.2.3. timeout

timeout参数是一个timeval结构指针,用于设置select函数的超时时间。当timeout为NULL时,select将无限期地等待,直到有文件描述符准备好。当timeout设置为0时,select将立即返回。当timeout设置为非零值时,select将等待指定的时间,直到有文件描述符准备好或超时。

timeval结构如下:

struct timeval {
    long tv_sec;   // seconds
    long tv_usec;  // microseconds
};

3.3. 返回值分析

select函数的返回值表示以下三种情况:

  1. 返回值大于0:表示有准备好的文件描述符,即已经发生的I/O事件数量。
  2. 返回值等于0:表示超时,即在指定的时间内没有任何I/O事件发生。
  3. 返回值小于0:表示发生错误。在这种情况下,可以使用perrorstrerror函数来获取错误信息。

在调用select函数后,可以通过检查readfdswritefdsexceptfds集合的状态,以确定哪些文件描述符准备好进行I/O操作。然后,程序可以根据文件描述符的状态来执行相应的读、写或异常处理操作。

select函数实战

4.1. 基本用法示例

本节将通过示例介绍如何使用select函数监控多个文件描述符和处理超时。

4.1.1. 监控多个文件描述符

以下是一个简单的C语言示例,展示了如何使用select函数监控多个文件描述符的读操作。

#include <stdio.h>
#include <stdlib.h>
#include <sys/time.h>
#include <sys/types.h>
#include <unistd.h>
#include <sys/select.h>
int main(void) {
    fd_set readfds;
    struct timeval timeout;
    int ret, fd_max;
    // 创建两个管道
    int pipefds1[2];
    int pipefds2[2];
    pipe(pipefds1);
    pipe(pipefds2);
    // 向管道写入数据
    write(pipefds1[1], "Hello", 5);
    write(pipefds2[1], "World", 5);
    while (1) {
        FD_ZERO(&readfds);
        FD_SET(pipefds1[0], &readfds);
        FD_SET(pipefds2[0], &readfds);
        // 设置最大文件描述符
        fd_max = (pipefds1[0] > pipefds2[0]) ? pipefds1[0] : pipefds2[0];
        // 设置超时时间
        timeout.tv_sec = 5;
        timeout.tv_usec = 0;
        ret = select(fd_max + 1, &readfds, NULL, NULL, &timeout);
        if (ret == -1) {
            perror("select");
            exit(EXIT_FAILURE);
        } else if (ret == 0) {
            printf("Timeout!\n");
            break;
        } else {
            if (FD_ISSET(pipefds1[0], &readfds)) {
                char buf[6];
                read(pipefds1[0], buf, 5);
                buf[5] = '\0';
                printf("Data from pipe1: %s\n", buf);
            }
            if (FD_ISSET(pipefds2[0], &readfds)) {
                char buf[6];
                read(pipefds2[0], buf, 5);
                buf[5] = '\0';
                printf("Data from pipe2: %s\n", buf);
            }
            break;
        }
    }
    close(pipefds1[0]);
    close(pipefds1[1]);
    close(pipefds2[0]);
    close(pipefds2[1]);
    return 0;
}

这个示例中,我们创建了两个管道并向它们写入数据。然后我们使用select函数来监控这两个管道的读文件描述符。当有数据可读时,程序将读取并输出数据。

4.1.2. 超时处理

在上面的示例中,我们设置了一个超时时间。当select函数在超时时间内没有检测到任何I/O事件时,它将返回0。在这种情况下,我们可以编写代码来处理超时事件。在上面的示例中,我们简单地输出了一个"Timeout!"的信息,并退出了循环。

4.2. 高级用法示例

在本节中,我们将介绍select函数的高级用法示例,包括结合非阻塞I/O和优化FD_SETFD_ISSET操作。

4.2.1. 结合非阻塞I/O

在一些应用场景中,使用非阻塞I/O模式可以进一步提高程序性能。以下示例展示了如何将select函数与非阻塞I/O结合使用。

#include <stdio.h>
#include <stdlib.h>
#include <sys/socket.h>
#include <netinet/in.h>
#include <arpa/inet.h>
#include <unistd.h>
#include <fcntl.h>
#include <sys/select.h>
void set_non_blocking(int sockfd) {
    int flags = fcntl(sockfd, F_GETFL, 0);
    fcntl(sockfd, F_SETFL, flags | O_NONBLOCK);
}
int main(void) {
    int listen_sock, conn_sock;
    struct sockaddr_in server_addr, client_addr;
    socklen_t addr_len = sizeof(client_addr);
    fd_set readfds;
    struct timeval timeout;
    int ret, fd_max;
    listen_sock = socket(AF_INET, SOCK_STREAM, 0);
    set_non_blocking(listen_sock);
    server_addr.sin_family = AF_INET;
    server_addr.sin_port = htons(8888);
    server_addr.sin_addr.s_addr = htonl(INADDR_ANY);
    bind(listen_sock, (struct sockaddr *)&server_addr, sizeof(server_addr));
    listen(listen_sock, 5);
    while (1) {
        FD_ZERO(&readfds);
        FD_SET(listen_sock, &readfds);
        fd_max = listen_sock;
        // 设置超时时间
        timeout.tv_sec = 5;
        timeout.tv_usec = 0;
        ret = select(fd_max + 1, &readfds, NULL, NULL, &timeout);
        if (ret == -1) {
            perror("select");
            exit(EXIT_FAILURE);
        } else if (ret == 0) {
            printf("Timeout!\n");
            continue;
        } else {
            if (FD_ISSET(listen_sock, &readfds)) {
                conn_sock = accept(listen_sock, (struct sockaddr *)&client_addr, &addr_len);
                if (conn_sock != -1) {
                    printf("Accepted a connection from %s:%d\n", inet_ntoa(client_addr.sin_addr), ntohs(client_addr.sin_port));
                    close(conn_sock);
                }
            }
        }
    }
    close(listen_sock);
    return 0;
}

在这个示例中,我们创建了一个非阻塞的监听套接字,并使用select函数来检测新的连接。当有新连接时,我们接受这个连接并立即关闭它。这里的非阻塞模式主要用于优化服务器的性能。

4.2.2. 优化FD_SET和FD_ISSET操作

当处理大量文件描述符时,FD_SETFD_ISSET操作可能会降低程序性能。为了优化这些操作,可以考虑使用数据结构(如链表或动态数组)来存储已准备好的文件描述符。

以下示例展示了如何使用链表来存储已准备好的文件描述符,从而减少FD_SET和`FD_ISSET操作的性能开销。

#include <stdio.h>
#include <stdlib.h>
#include <sys/socket.h>
#include <netinet/in.h>
#include <arpa/inet.h>
#include <unistd.h>
#include <fcntl.h>
#include <sys/select.h>
typedef struct ready_fd_node {
    int fd;
    struct ready_fd_node *next;
} ready_fd_node;
void set_non_blocking(int sockfd) {
    int flags = fcntl(sockfd, F_GETFL, 0);
    fcntl(sockfd, F_SETFL, flags | O_NONBLOCK);
}
int main(void) {
    int listen_sock, conn_sock;
    struct sockaddr_in server_addr, client_addr;
    socklen_t addr_len = sizeof(client_addr);
    fd_set readfds;
    struct timeval timeout;
    int ret, fd_max;
    ready_fd_node *ready_fds_head = NULL, *current_node = NULL;
    listen_sock = socket(AF_INET, SOCK_STREAM, 0);
    set_non_blocking(listen_sock);
    server_addr.sin_family = AF_INET;
    server_addr.sin_port = htons(8888);
    server_addr.sin_addr.s_addr = htonl(INADDR_ANY);
    bind(listen_sock, (struct sockaddr *)&server_addr, sizeof(server_addr));
    listen(listen_sock, 5);
    while (1) {
        FD_ZERO(&readfds);
        FD_SET(listen_sock, &readfds);
        fd_max = listen_sock;
        // 设置超时时间
        timeout.tv_sec = 5;
        timeout.tv_usec = 0;
        ret = select(fd_max + 1, &readfds, NULL, NULL, &timeout);
        if (ret == -1) {
            perror("select");
            exit(EXIT_FAILURE);
        } else if (ret == 0) {
            printf("Timeout!\n");
            continue;
        } else {
            if (FD_ISSET(listen_sock, &readfds)) {
                conn_sock = accept(listen_sock, (struct sockaddr *)&client_addr, &addr_len);
                if (conn_sock != -1) {
                    printf("Accepted a connection from %s:%d\n", inet_ntoa(client_addr.sin_addr), ntohs(client_addr.sin_port));
                    // 将新连接的文件描述符加入到链表中
                    ready_fd_node *new_node = (ready_fd_node *)malloc(sizeof(ready_fd_node));
                    new_node->fd = conn_sock;
                    new_node->next = NULL;
                    if (ready_fds_head == NULL) {
                        ready_fds_head = new_node;
                    } else {
                        current_node = ready_fds_head;
                        while (current_node->next != NULL) {
                            current_node = current_node->next;
                        }
                        current_node->next = new_node;
                    }
                }
            }
            // 处理链表中的文件描述符
            current_node = ready_fds_head;
            while (current_node != NULL) {
                // 这里可以处理每个已准备好的文件描述符,例如读取数据或者关闭连接
                // ...
                current_node = current_node->next;
            }
        }
    }
    // 释放链表资源
    current_node = ready_fds_head;
    while (current_node != NULL) {
        ready_fd_node *temp = current_node;
        current_node = current_node->next;
        free(temp);
    }
    close(listen_sock);
    return 0;
}

FD_ISSET`操作。这样,在处理大量文件描述符时,可以显著提高程序性能。注意,示例中只展示了如何将新连接的文件描述符添加到链表中。实际应用中,你需要根据实际需求处理链表中的文件描述符,例如读取数据或关闭连接等。

当然,使用链表或其他数据结构来优化文件描述符的处理需要开发者对代码进行更多的维护。同时,如果要在多线程环境下处理文件描述符,还需要考虑线程同步和锁的问题。

通过使用非阻塞I/O以及优化文件描述符的处理方式,你可以充分发挥select函数的优势,以提高程序的性能和效率。

select与其他I/O复用技术的对比

除了select之外,还有其他I/O复用技术,例如poll和epoll。下面我们将分别介绍它们的原理及优缺点,并对这三种技术进行比较。

5.1. poll函数

poll函数和select类似,也是一种I/O复用技术。不同于select使用文件描述符集合,poll使用pollfd结构体数组来表示多个文件描述符。poll的函数原型如下:

int poll(struct pollfd *fds, nfds_t nfds, int timeout);

其中,fds指向一个包含多个文件描述符的pollfd结构体数组,nfds表示数组中的元素个数,timeout表示超时时间(以毫秒为单位)。

poll的优势:

  1. 不受文件描述符数量限制:poll使用动态数组存储文件描述符,可以处理更多的并发连接。
  2. 不需要计算最大文件描述符:poll在内部自动处理数组中的文件描述符。
  3. 效率相对较高:与select相比,poll不需要重复设置文件描述符集合。

poll的局限:

  1. 效率仍受到遍历文件描述符的影响:当并发连接数较多时,遍历整个文件描述符数组可能会导致性能下降。

5.2. epoll函数

epoll是Linux特有的I/O复用技术,它通过使用事件驱动的方式提高了性能。epoll有以下几个主要函数:

  • int epoll_create(int size);
  • int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);
  • int epoll_wait(int epfd, struct epoll_event *events, int maxevents, int timeout);

epoll使用一个内核维护的事件表,可以实现对文件描述符状态的实时更新。这意味着在大量并发连接的情况下,epoll的性能会更高。

epoll的优势:

  1. 可扩展性高:epoll适用于处理大量并发连接。
  2. 高效:epoll只关注活跃的文件描述符,避免了遍历整个文件描述符数组。

epoll的局限:

  1. 只适用于Linux系统:epoll是Linux特有的技术,不具有跨平台性。

5.3. 三者的优缺点比较及使用场景

  • select:具有良好的跨平台兼容性,适用于需要处理少量并发连接的场景。但在处理大量并发连接时性能可能较低。
  • poll:与select类似,但具有更好的扩展性。适用于需要处理中等数量并发连接的场景。仍受遍历文件描述符影响,处理大量并发连接时性能可能受限。
  • epoll:在Linux系统上表现最佳,适用于处理大量并发连接的场景。具有高效的事件驱动模式,能显著提高程序性能。但仅限于Linux系统,不具有跨平台性。

在选择I/O复用技术时,需要根据实际需求和场景来判断:

  1. 如果需要兼容多种操作系统和平台,select是一个不错的选择。但需要注意其在处理大量并发连接时可能出现的性能瓶颈。
  2. 如果需要处理的并发连接数较多,且主要运行在Linux系统上,可以优先考虑使用epoll。epoll在处理大量并发连接时性能更优。
  3. 如果需要在多种Unix系统上处理中等数量的并发连接,poll是一个比较好的选择。虽然它在处理大量并发连接时仍可能受到性能限制,但相比select,它具有更好的扩展性。

总之,在选择I/O复用技术时,需要根据实际应用场景、需求和平台来进行权衡。在理解各种技术的优缺点后,选择最适合当前项目的I/O复用方法。

精通select:I/O复用技术的实现与优化

6.1. 掌握select函数的重要性

在编写高并发服务器或应用程序时,掌握select函数具有显著意义。select作为一种通用的I/O复用技术,对于程序的性能和可扩展性有着重要影响。通过了解select函数的原理、工作机制和具体用法,你可以在不同平台和操作系统上实现高效的多任务处理,提高程序的整体性能。

6.2. 熟练使用select优化程序性能

为了充分发挥select函数的优势,你需要熟练掌握一些优化技巧。以下是一些建议:

  1. 结合非阻塞I/O:通过将文件描述符设置为非阻塞模式,你可以确保在等待I/O操作时程序继续执行其他任务,从而提高程序的响应性。
  2. 优化FD_SET和FD_ISSET操作:在处理大量文件描述符时,使用链表或其他数据结构存储已准备好的文件描述符,可以避免频繁进行FD_SET和FD_ISSET操作,提高程序性能。
  3. 选择合适的I/O复用技术:根据实际应用场景、需求和平台,选择最适合当前项目的I/O复用方法(select、poll或epoll)。了解各种技术的优缺点,进行权衡。
  4. 持续关注和学习新的I/O复用技术:随着技术的发展,可能会出现更加先进的I/O复用技术。保持关注新技术的发展,及时掌握新的技术,有助于进一步提高程序性能。

6.3. select函数的实现原理

select函数的实现原理主要依赖于操作系统内核对文件描述符(File Descriptors,简称FD)的管理。当调用select函数时,程序会在内核中检查所指定的一组文件描述符,判断它们是否处于准备好执行读、写或异常处理操作的状态。select通过使用描述符集合(例如:读集合、写集合和异常集合),能够在一个单独的系统调用中同时监视多个文件描述符。一旦某个文件描述符准备就绪,select会返回相应的结果。

6.4. select函数的局限性与改进

尽管select函数在多任务处理方面具有一定的优势,但它仍然存在一些局限性:

  1. 文件描述符数量限制:select函数所能处理的文件描述符数量受限于FD_SETSIZE,这可能导致无法处理大量连接的问题。
  2. 效率问题:当文件描述符数量增加时,select函数的效率会降低,因为它需要遍历所有文件描述符以检查状态。

为了克服这些局限性,可以采用以下方法:

  1. 使用更高效的I/O复用技术,如poll和epoll。poll可以支持更多的文件描述符,而epoll则具有更高的效率,特别是在处理大量连接时。
  2. 针对特定平台或操作系统,使用专有的I/O复用技术,例如Windows平台上的IOCP(Input/Output Completion Ports)。

6.5. 应用场景和实例

select函数可广泛应用于以下场景:

  1. 网络编程:在客户端/服务器模型中,使用select可以监控多个套接字的状态,实现多连接处理。
  2. 跨平台程序开发:由于select广泛存在于各种操作系统中,使用select可以增加程序的可移植性。
  3. 资源管理:通过监控文件描述符,select可以实现对系统资源(如文件、套接字等)的有效管理。

总之,精通select函数对于编写高并发、高性能的程序至关重要。通过熟练掌握select的实现原理、优化方法和应用场景,可以为你的项目带来显著的性能提升。

C++ Linux select 服务器类设计

SelectServer头文件

#ifndef SELECT_SERVER_H
#define SELECT_SERVER_H
#include <string>
#include <functional>
#include <vector>
#include <memory>
#include <thread>
#include <map>
#include <mutex>
class Client {
public:
    int sockfd;
    // 其他客户端属性
    Client(int sockfd) : sockfd(sockfd) {}
    ~Client() {}
};
class SelectServer {
public:
    // Constructor
    SelectServer();
    // Destructor
    ~SelectServer();
    // 设置服务器监听端口
    void setPort(unsigned short port);
    // 设置服务器监听地址
    void setAddress(const std::string& address);
    // 设置客户端连接最大数量
    void setMaxClients(unsigned int maxClients);
    // 启动服务器
    void start();
    // 停止服务器
    void stop();
    // 注册读取数据回调函数
    void setOnDataReceivedCallback(std::function<void(int, const std::vector<char>&)> callback);
    // 注册新连接建立回调函数
    void setOnClientConnectedCallback(std::function<void(int)> callback);
    // 注册连接断开回调函数
    void setOnClientDisconnectedCallback(std::function<void(int)> callback);
    // 向指定客户端发送数据
    void sendData(int clientId, const std::vector<char>& data);
    // 关闭指定客户端连接
    void closeClient(int clientId);
    // 获取客户端数量
    unsigned int getClientCount() const;
    // ... 其他函数和成员变量 ...
    std::map<int, std::shared_ptr<Client>> clients;
    std::mutex clientsMutex;    
private:
    // 初始化服务器
    void initServer();
    // 处理客户端连接
    void handleClientConnections();
    // 处理客户端数据
    void handleClientData(int clientId);
    // 处理客户端断开连接
    void handleClientDisconnection(int clientId);
    // 捕获并处理异常
    void handleException(const std::exception& e);
};
#endif // SELECT_SERVER_H

SelectServer 源文件

#include "SelectServer.h"
#include "Client.h"
#include <thread>
#include <stdexcept>
#include <iostream>
#include <sys/socket.h>
#include <arpa/inet.h>
#include <unistd.h>
#include <fcntl.h>
// Constructor
SelectServer::SelectServer()
    : serverAddress("0.0.0.0"), serverPort(0), maxClients(10), serverSocket(-1) {}
// Destructor
SelectServer::~SelectServer() {
    if (serverSocket != -1) {
        close(serverSocket);
    }
}
// 设置服务器监听端口
// 参数: port - 服务器监听的端口号(范围:0-65535)
// 无返回值
void SelectServer::setPort(unsigned short port) {
    serverPort = port;
}
// 设置服务器监听地址
// 参数: address - 服务器监听的IP地址
// 无返回值
void SelectServer::setAddress(const std::string& address) {
    serverAddress = address;
}
// 设置客户端连接最大数量
// 参数: maxClients - 允许的最大客户端连接数
// 无返回值
void SelectServer::setMaxClients(unsigned int maxClients) {
    this->maxClients = maxClients;
}
// 启动服务器
// 无参数
// 无返回值
void SelectServer::start() {
    initServer();
    handleClientConnections();
}
// 停止服务器
// 无参数
// 无返回值
void SelectServer::stop() {
    if (serverSocket != -1) {
        close(serverSocket);
        serverSocket = -1;
    }
}
// 注册读取数据回调函数
// 参数: callback - 用于处理客户端数据的回调函数,接受两个参数:客户端ID和接收到的数据
// 无返回值
void SelectServer::setOnDataReceivedCallback(std::function<void(int, const std::vector<char>&)> callback) {
    onDataReceivedCallback = callback;
}
// 注册新连接建立回调函数
// 参数: callback - 当有新的客户端连接时,用于处理客户端连接的回调函数,接受一个参数:客户端ID
// 无返回值
void SelectServer::setOnClientConnectedCallback(std::function<void(int)> callback) {
    onClientConnectedCallback = callback;
}
// 注册连接断开回调函数
// 参数: callback - 当客户端断开连接时,用于处理客户端断开连接的回调函数,接受一个参数:客户端ID
// 无返回值
void SelectServer::setOnClientDisconnectedCallback(std::function<void(int)> callback) {
    onClientDisconnectedCallback = callback;
}
// 初始化服务器
// 无参数
// 无返回值
void SelectServer::initServer() {
    // 创建TCP套接字
    serverSocket = socket(AF_INET, SOCK_STREAM, 0);
    if (serverSocket == -1) {
        throw std::runtime_error("Failed to create socket");
    }
   // 设置套接字选项,允许地址和端口复用
    int opt = 1;
    if (setsockopt(serverSocket, SOL_SOCKET, SO_REUSEADDR, &opt, sizeof(opt)) == -1) {
        throw std::runtime_error("Failed to set socket options");
    }
    // 绑定地址和端口
    struct sockaddr_in addr;
    addr.sin_family = AF_INET;// IPv4地址
    addr.sin_addr.s_addr = inet_addr(serverAddress.c_str()); // 转换服务器IP地址为网络字节序
    addr.sin_port = htons(serverPort); // 转换服务器端口号为网络字节序
    if (bind(serverSocket, (struct sockaddr*)&addr, sizeof(addr)) == -1) {
        throw std::runtime_error("Failed to bind socket");
    }
    // 监听端口,等待客户端连接
    if (listen(serverSocket, 10) == -1) {
        throw std::runtime_error("Failed to listen on socket");
    }
}
// 处理客户端连接
// 无参数
// 无返回值
void SelectServer::handleClientConnections() {
    while (true) {
        struct sockaddr_in clientAddr;
        socklen_t clientAddrLen = sizeof(clientAddr);
        int clientSocket = accept(serverSocket, (struct sockaddr*)&clientAddr, &clientAddrLen);
        if (clientSocket == -1) {
            // 处理异常情况
            continue;
        }
        // 将客户端套接字设置为非阻塞模式
        int flags = fcntl(clientSocket, F_GETFL, 0);
        fcntl(clientSocket, F_SETFL, flags | O_NONBLOCK);
        // 将新客户端添加到客户端列表
        auto client = std::make_shared<Client>(clientSocket);
        {
            std::unique_lock<std::mutex> lock(clientsMutex);
            clients[clientSocket] = client;
        }
        // 创建子线程处理客户端连端连接
        std::thread clientThread(&SelectServer::handleClient, this, clientSocket);
        clientThread.detach();
    }
}
// 处理客户端的子线程函数
// 参数: clientSocket - 客户端的文件描述符
// 无返回值
void SelectServer::handleClient(int clientSocket) {
    // 在这里处理客户端的各种请求,例如读写数据等
    try {
        // 以下为示例,您可以根据实际需求编写逻辑
        char buffer[1024];
        ssize_t bytesRead;
        while ((bytesRead = recv(clientSocket, buffer, sizeof(buffer), 0)) > 0) {
            std::vector<char> data(buffer, buffer + bytesRead);
            // 调用注册的回调函数处理数据
            if (onDataReceivedCallback) {
                onDataReceivedCallback(clientSocket, data);
            }
        }
        // 客户端断开连接
        closeClient(clientSocket);
        {
            std::unique_lock<std::mutex> lock(clientsMutex);
            clients.erase(clientSocket);
        }
        // 调用客户端断开连接的回调函数
        if (onClientDisconnectedCallback) {
            onClientDisconnectedCallback(clientSocket);
        }
    } catch (const std::exception& e) {
        // 捕获并处理异常
        handleException(e);
    }
}
// 处理客户端数据
// 参数: clientId - 要处理数据的客户端ID
// 无返回值
void SelectServer::handleClientData(int clientId) {
    // 查找客户端对象
    std::shared_ptr<Client> client;
    {
        std::unique_lock<std::mutex> lock(clientsMutex);
        auto it = clients.find(clientId);
        if (it == clients.end()) {
            // 客户端不存在,返回
            return;
        }
        client = it->second;
    }
    // 读取客户端数据
    char buffer[1024];
    ssize_t bytesRead = recv(client->sockfd, buffer, sizeof(buffer), 0);
    if (bytesRead > 0) {
        // 将数据封装为 vector 对象
        std::vector<char> data(buffer, buffer + bytesRead);
        // 调用数据接收回调函数处理数据
        if (onDataReceivedCallback) {
            onDataReceivedCallback(clientId, data);
        }
    } else if (bytesRead == 0) {
        // 客户端断开连接
        handleClientDisconnection(clientId);
    } else {
        // 处理异常情况
    }
}
// 处理客户端断开连接
// 参数: clientId - 要处理断开连接的客户端ID
// 无返回值
void SelectServer::handleClientDisconnection(int clientId) {
    // 关闭客户端连接
    closeClient(clientId);
    // 移除客户端
    {
        std::unique_lock<std::mutex> lock(clientsMutex);
        clients.erase(clientId);
    }
    // 调用客户端断开连接回调函数
    if (onClientDisconnectedCallback) {
        onClientDisconnectedCallback(clientId);
    }
}
// 向指定客户端发送数据
// 参数: clientId - 要发送数据的客户端ID;data - 要发送的数据
// 无返回值
void SelectServer::sendData(int clientId, const std::vector<char>& data) {
    std::shared_ptr<Client> client;
    {
        std::unique_lock<std::mutex> lock(clientsMutex);
        auto it = clients.find(clientId);
        if (it == clients.end()) {
            // 客户端不存在,返回
            return;
        }
        client = it->second;
    }
    try {
        // 发送数据
        if (send(client->sockfd, data.data(), data.size(), 0) == -1) {
            // 发送失败,处理异常情况
            throw std::runtime_error("Send data failed.");
        }
    } catch (const std::exception& e) {
        // 捕获并处理异常
        handleException(e);
    }
}
// 关闭指定客户端连接
// 参数: clientId - 要关闭的客户端ID
// 无返回值
void SelectServer::closeClient(int clientId) {
    std::shared_ptr<Client> client;
    {
        std::unique_lock<std::mutex> lock(clientsMutex);
        auto it = clients.find(clientId);
        if (it == clients.end()) {
            // 客户端不存在,返回
            return;
        }
        client = it->second;
    }
    try {
        // 关闭客户端连接
        if (close(client->sockfd) == -1) {
            // 关闭失败,处理异常情况
            throw std::runtime_error("Close client failed.");
        }
    } catch (const std::exception& e) {
        // 捕获并处理异常
        handleException(e);
    }
}
// 获取客户端数量
// 无参数
// 返回值: 当前已连接的客户端数量
unsigned int SelectServer::getClientCount() const {
    std::unique_lock<std::mutex> lock(clientsMutex);
    return clients.size();
}
// 捕获并处理异常
// 参数: e - 异常引用
// 无返回值
void SelectServer::handleException(const std::exception& e) {
    // 输出异常信息
    std::cerr << "Exception caught: " << e.what() << std::endl;
    // 在这里实现其他异常处理逻辑,例如采取恢复措施或通知其他组件
    // ...
}

结语

在本篇博客中,我们深入讨论了select函数及其在I/O复用技术中的地位。我们从心理学的角度分析了select的优势,以及为什么人们可能会觉得select在某些方面具有优越性。以下是我们从心理学角度对select进行的总结:

  1. 熟悉程度:对于许多开发者来说,select可能是他们最早接触的I/O复用技术。心理学研究表明,人们更倾向于信任和使用熟悉的事物。因此,这种熟悉感可能使得select在开发者心中具有一定的优势。
  2. 简单性:select的API相对简单,容易理解和使用。根据心理学原理,人们在面对复杂任务时,更喜欢选择简单易懂的方法。在这种情况下,select的简单性成为了它的一大优势。
  3. 可控性:select的行为和结果是可预测的,这使得开发者可以对其进行精细的控制。心理学研究发现,人们在面对可控的情境时会感到更安心。因此,select的可控性在一定程度上满足了人们的心理需求。
  4. 兼容性:select在各种操作系统和平台上都具有良好的兼容性。心理学研究显示,人们在面对不确定性时会感到焦虑。而select的广泛兼容性有助于降低开发者在跨平台开发过程中的不确定性,从而减轻焦虑感。
  5. 惯性思维:根据心理学原理,人们在面对选择时容易受到惯性思维的影响。长期以来,select一直是I/O复用技术的代表之一。因此,在一定程度上,人们可能会因为习惯而倾向于选择select作为I/O复用的解决方案。

综上所述,从心理学的角度来看,select在某些方面确实具有一定的优势。然而,这并不意味着select在所有场景下都是最佳选择。在实际开发过程中,我们需要根据项目需求和性能目标来选择合适的I/O复用技术。同时,了解不同技术的优缺点及适用场景有助于我们更好地评估并发挥select等I/O复用技术的潜力。

目录
相关文章
|
26天前
|
网络协议 安全 Linux
Linux C/C++之IO多路复用(select)
这篇文章主要介绍了TCP的三次握手和四次挥手过程,TCP与UDP的区别,以及如何使用select函数实现IO多路复用,包括服务器监听多个客户端连接和简单聊天室场景的应用示例。
86 0
|
26天前
|
存储 Linux C语言
Linux C/C++之IO多路复用(aio)
这篇文章介绍了Linux中IO多路复用技术epoll和异步IO技术aio的区别、执行过程、编程模型以及具体的编程实现方式。
66 1
Linux C/C++之IO多路复用(aio)
|
2天前
|
缓存 负载均衡 算法
Linux内核中的进程调度算法解析####
本文深入探讨了Linux操作系统核心组件之一——进程调度器,着重分析了其采用的CFS(完全公平调度器)算法。不同于传统摘要对研究背景、方法、结果和结论的概述,本文摘要将直接揭示CFS算法的核心优势及其在现代多核处理器环境下如何实现高效、公平的资源分配,同时简要提及该算法如何优化系统响应时间和吞吐量,为读者快速构建对Linux进程调度机制的认知框架。 ####
|
11天前
|
人工智能 Cloud Native Java
云原生技术深度解析:从IO优化到AI处理
【10月更文挑战第24天】在当今数字化时代,云计算已经成为企业IT架构的核心。云原生作为云计算的最新演进形态,旨在通过一系列先进的技术和实践,帮助企业构建高效、弹性、可观测的应用系统。本文将从IO优化、key问题解决、多线程意义以及AI处理等多个维度,深入探讨云原生技术的内涵与外延,并结合Java和AI技术给出相应的示例。
53 1
|
28天前
|
弹性计算 网络协议 Ubuntu
如何在阿里云国际版Linux云服务器中自定义配置DNS
如何在阿里云国际版Linux云服务器中自定义配置DNS
|
26天前
|
Linux C++
Linux C/C++之IO多路复用(poll,epoll)
这篇文章详细介绍了Linux下C/C++编程中IO多路复用的两种机制:poll和epoll,包括它们的比较、编程模型、函数原型以及如何使用这些机制实现服务器端和客户端之间的多个连接。
20 0
Linux C/C++之IO多路复用(poll,epoll)
|
1月前
|
自然语言处理 Java 数据处理
Java IO流全解析:字节流和字符流的区别与联系!
Java IO流全解析:字节流和字符流的区别与联系!
62 1
|
11天前
|
运维 Cloud Native 持续交付
云原生技术解析:从IO出发,以阿里云原生为例
【10月更文挑战第24天】随着互联网技术的不断发展,传统的单体应用架构逐渐暴露出扩展性差、迭代速度慢等问题。为了应对这些挑战,云原生技术应运而生。云原生是一种利用云计算的优势,以更灵活、可扩展和可靠的方式构建和部署应用程序的方法。它强调以容器、微服务、自动化和持续交付为核心,旨在提高开发效率、增强系统的灵活性和可维护性。阿里云作为国内领先的云服务商,在云原生领域有着深厚的积累和实践。
38 0
|
23天前
|
缓存 Java 程序员
Map - LinkedHashSet&Map源码解析
Map - LinkedHashSet&Map源码解析
58 0
|
23天前
|
算法 Java 容器
Map - HashSet & HashMap 源码解析
Map - HashSet & HashMap 源码解析
48 0