前言
对于Linux网络编程,有很多坑需要我们去踩。在这个时候,我们才会知道理论知识的重要性。无论是哪种语言,网络编程都可以写成厚厚的一本书。举个例子,比如“当网络断掉,我们调用write去往socket中写入数据,为什么返回正常写入呢?”。所以有空多看看《TCP/IP详解》,《UNIX网络编程》等经典书籍来补充网络知识。
深入理解write
首先,我们来解决上面的问题。为什么网络断了,还能write还是返回成功呢?我们先看write的定义:
#include <unistd.h>
ssize_t write(int fd, const void *buf, size_t count);
对于write的返回值,它表示写入的字节数。而这个写入,是写到哪呢?是成功发送的意思吗? 其实并不是,write成功返回,只是buf中的数据被复制到了kernel中的TCP发送缓冲区。至于数据什么时候被发往网络,系统调用层面不会给予任何保证和通知。
所以,我们并不能直接根据write的返回值来判定发送成功,这也就是为什么网络断掉了,write的返回值和我们希望写入的值是一样的。
阻塞和非阻塞
读写操作肯定会涉及阻塞和非阻塞的问题。那write和read在什么情况下会阻塞呢?当kernel中该socket的发送缓冲区已满时write会阻塞。而read调用阻塞,通常是发送端的数据没有到达。
对于每个socket,拥有自己的发送缓冲区和接收缓冲区。两个缓冲区大小都由系统来自动调节,但一般在default和max之间浮动。
默认socket是阻塞的,将一个socket 设置成非阻塞模式,可以使用fcntl方法:
int flags;
if ((flags = fcntl(fd, F_GETFL, NULL)) < 0) {
return -1;
}
if (fcntl(fd, F_SETFL, flags | O_NONBLOCK) == -1) {
return -1;
}
阻塞(默认)和非阻塞模式下read/write行为的区别:
- read总是在接收缓冲区有数据时立即返回,而不是等到给定的read buffer填满时返回。只有当接收缓冲区为空时,阻塞模式才会等待,而非阻塞模式下会立即返回-1。
- 阻塞的write只有在缓冲区足以放下整个buffer时才返回。非阻塞write则是返回能够放下的字节数,之后调用则返回-1。
对于阻塞的write有个特殊情况:
当write阻塞等待时,对端关闭了socket,则write则会立即将剩余缓冲区填满并返回所写的字节数,再次调用write则会失败。