1. 什么是socket套接字
套接字就像一个插座,插座需要一个插头来连接双方才能通电,而socket通信也需要两个端,一个服务端一个客户端。一般来说,服务端是被动的,客户端是主动的,也就是说服务端应该先启动,启动之后就被动的去准备被(客户端)连接以提供服务,而客户端需要服务的时候就主动去连接服务器端。
实际上,socket编程就是网络IO编程,同样也是读写操作,只不过是对网络进行读写,通过read/write和文件描述符来完成读写。我们在创建套接字的时候,会得到文件描述符,然后就可以通过这个文件描述符来完成读写操作。
实际上,我们在进程间通信时用的管道也是在内核中分配一块缓冲区,这个缓冲区是用一个环形队列来维护的,本质是内存中的一块存储空间,在管道的读写两端分别对应一个文件描述符,操作读端的文件描述符fd就相当于操作内核缓冲区。
套接字创建成功后,也会得到一个文件描述符fd,通过fd来操作一块内核缓冲区。在服务器端创建一个套接字,就会得到一个内核缓冲区和文件描述符,这个缓冲区分为读写两部分。在客户端发数据使用的是write操作,当我们执行write(fd)的时候,数据并不是直接写到网上的,而是先写到文件描述符对应的内核缓冲区中的写缓冲区部分,写缓冲区中只要有数据就会自动发送到服务器端的读缓冲区中,服务器端通过read就可以把数据读出。我们所做的只有read和write操作,其他操作都是由操作系统完成的。需要注意的一点是,读缓冲区中的数据读走了之后就没有了,和管道一样。
套接字对应的文件描述符默认也是阻塞的,实际上阻塞是文件描述符对应的文件所拥有的性质,而不是read/write的属性,这两个函数只负责读取或者写数据,即阻塞性质是对文件描述符所对应的文件类型而言的。
2. socket编程
- socket是一套网络通信的函数接口
- socket内封装了传输层协议
- TCP
- UDP
socket编程就是使用别人提供的一套网络通信接口进行编程。比如说我们使用浏览器搜索内容,浏览器使用的是HTTP协议,而HTTP协议再往下封装的就是TCP协议。
在套接字编程时需要IP和Port:
- IP地址:在网络环境中,需要IP来定位一台主机
- 端口号Port:在一台主机上,需要Port来定位一个进程
- IP:Port
3. 网络字节序
- 大端:网络字节序,数据的高位字节存储在内存的低地址。
- 小端:主机字节序,数据的高位字节存储在内存的高位地址。常见的主机数据都是小端存储。
函数介绍:
#include <arpa/inet.h>
(1) 主机字节序转网络字节序
uint16_t htons(uint16_t hostshort); //端口 uint32_t htonl(uint32_t hostlong); //IP
(2) 网络字节序转主机字节序
uint16_t ntohs(uint16_t netshort); //端口 uint32_t ntohl(uint32_t netlong); //IP
假如说我们要将小端字节序转换为大端字节序,如果主机是小端字节序,这些函数将参数做相应的大小端转换后返回,如果主机是大端字节序,这些函数将不做任何变换,将参数原封不动的返回。
常见的文件字节序:
- Adobe PS — Big Endian
- BMP — Little Endian
- GIF — Little Endian
- JPEG — Big Endian
- MacPaint — Big Endian
- RTF — Little Endian
注:在Java以及所有的网络通讯协议都是使用Big-Endian编码。
4. IP地址转换函数
指定IP转换为点分十进制字符串
- 本地IP转网络字节序:字符串 —> int(大端方式存储)
int inet_pton(int af, const char* src, void* dst);
- af:地址簇协议
- src:点分十进制IP
- dest:传出参数,转换后的int整形的存放地址
- 网络字节序转本地IP:int —> 字符串
const char *inet_ntop(int af, const void* src, char* dst, socklen_t size);
5. sockaddr数据结构
- sockaddr
- sockaddrin
- sockaddrun
struct sockaddr { /* address family, AF_xxx */ sa_family_t sa_family; /* 14 bytes of protocol address */ char sa_data[14]; }; struct sockaddr_in { __kernel_sa_family_t sin_family; // 地址族协议 __be16 sin_port; // 端口 struct in_addr sin_addr; // IP地址 unsigned char __pad[__SOCK_SIZE__ - sizeof(short int) - sizeof(unsigned short int) - sizeof(struct in_addr)]; }; struct in_addr { __be32 s_addr; };
IPv4地址用socketaddr_in结构体表示,包括16位端口号和32位IP地址,IPv6地址用socketaddr_in6结构体表示,包括16位端口号、128位IP地址和一些控制字段。
6. 网络套接字函数
(1) 创建套接字
int socket(int domain, int type, int protocol);
- 创建一个套接字
- domin
- AF_INET:这是大多数用来产生socket的协议,使用TCP或UDP来传输,使用IPv4的地址;
- AF_INET6:使用IPv6的地址;
- AF_UNIX:本地协议,使用在Unix和Linux系统上,一般都是当客户端和服务器端都在同一台机器上的时候使用;
- type
- SOCK_STREAM:流式协议,这个协议是按照顺序的、可靠的、数据类型完整的、基于字节流的连接。这是一个使用最多的socket类型,这个socket是使用TCP来进行传输的;
- SOCK_DGRAM:报式协议,这个协议式无连接的、固定长度的传输调用,该协议是不可靠的,使用UDP进行传输;
- SOCK_SEQPACKET:该协议是双线路的、可靠的连接,发送固定长度的数据包进行传输,必须把这个包完整的接收才能进行读取;
- SOCK_RAW:socket类型提供单一的网络访问,这个socket类型使用ICMP公共协议,ping以及traceroute都使用该协议;
- SOCK_RDM:这个类型使用较少,在大部分操作系统上没有实现,它提供给数据链路层使用,不保证数据包的顺序;
- protocol:设置0表示使用默认协议; 协议,常见的协议有IPPROTO_TCP、IPPTOTO_UDP、 IPPROTO_SCTP、IPPROTO_TIPC他们分别对应这TCP传输协议、UDP传输协议、STCP传输协议、TIPC传输协议。当protocol为0时,会自动选择type类型对应的默认协议;
- 返回值为文件描述符(套接字),即创建好的socket套接字的文件描述符。On success, a file descriptor for the new socket is returned. On error, -1 is returned, and errno is set appropriately.
(2) 绑定
int bind(int sockfd, const struct sockaddr* addr, socklen_t addrlen);
- 将本地的IP和端口号与创建出来的套接字绑定,将参数sockfd和addr绑定在一起,使sockfd这个用于网络通讯的文件描述符监听addr所描述的地址和端口号。
- sockfd:创建出的文件描述符
- addr:端口和IP
- addrlen:addr结构体的长度,sizeof(addr)
(3) 监听
int listen(int sockfd, int backlog);
- 设置同时连接到服务器的客户端的个数,listen()声明sockfd处于监听状态,并且最多允许有backlog个客户端处于连接等待状态,如果接收到更多的连接请求就忽略。
- sockfd:socket函数创建出来的文件描述符;
- backlog:同时能连接的最大数量,最大值为128;
(4) 接受连接
int accept(int sockfd, struct sockaddr* addr, socklen_t* addrlen);
- 阻塞等待客户端连接请求,并接受连接。
- sockfd:文件描述符,使用socket创建出来的文件描述符;
- 监听的文件描述符;
- addr:存储客户端的端口和IP,是一个传出参数;
- addrlen:传入传出参数(值 - 结果),传入sizeof(addr)的大小,函数返回时返回真正接收到地址结构体的大小;
- 函数返回值是一个套接字,对应客户端,服务器端与客户端进程通信使用accept的返回值对应的套接字。
(5) 连接
int connect(int sockfd, const struct sockaddr* addr, socklen_t addrlen);
- 客户端需要调用connect()函数连接服务器,connect和bind的参数形式一致,区别在于bind的参数是自己的地址,而connect的参数是对方的地址。
- sockfd:套接字;
- addr:传入参数,指定服务器端地址信息,服务器端的IP和端口;
- addrlen:第二个参数addr的长度;
7. TCP通信流程图