网络编程socket基本API详解

本文涉及的产品
数据传输服务 DTS,数据迁移 small 3个月
推荐场景:
MySQL数据库上云
简介:

socket

  socket是在应用层和传输层之间的一个抽象层,它把TCP/IP层复杂的操作抽象为几个简单的接口供应用层调用已实现进程在网络中通信。

  socket起源于UNIX,在Unix一切皆文件哲学的思想下,socket是一种"打开—读/写—关闭"模式的实现,服务器和客户端各自维护一个"文件",在建立连接打开后,可以向自己文件写入内容供对方读取或者读取对方内容,通讯结束时关闭文件。

socket 类型

    常见的socket有3种类型如下。 
    (1)流式socket(SOCK_STREAM ) 
    流式套接字提供可靠的、面向连接的通信流;它使用TCP 协议,从而保证了数据传输的正确性和顺序性。 
    (2)数据报socket(SOCK_DGRAM ) 
    数据报套接字定义了一种无连接的服 ,数据通过相互独立的报文进行传输,是无序的,并且不保证是可靠、无差错的。它使用数据报协议UDP。 
    (3)原始socket(SOCK_RAW)
    原始套接字允许对底层协议如IP或ICMP进行直接访问,功能强大但使用较为不便,主要用于一些协议的开发。

socket创建和连接

    计算机数据存储有两种字节优先顺序:高位字节优先和低位字节优先。Internet上数据以高位字节优先顺序在网络上传输,所以对于在内部是以低位字节优先方式存储数据的机器,在Internet上传输数据时就需要进行转换。

    几个字节顺序转换函数: 
    htons()--"Host to Network Short" ; htonl()--"Host to Network Long" 
    ntohs()--"Network to Host Short" ; ntohl()--"Network to Host Long" 
    在这里, h表示"host" ,n表示"network",s 表示"short",l表示 "long"。

    int socket(int family, int type, int protocol); 
    family指定协议族;type参数指定socket的类型:SOCK_STREAM、SOCK_DGRAM、SOCK_RAW;protocol通常赋值"0"。

    socket()调用返回一个整型socket描述符,你可以在后面的调用使用它。 
    一旦通过socket调用返回一个socket描述符,你应该将该socket与你本机上的一个端口相关联(往往当你在设计服务器端程序时需要调用该函数。随后你就可以在该端口监听服务请求;而客户端一般无须调用该函数)。

    int bind(int sockfd, struct sockaddr *my_addr, int addrlen); 
    sockfd是一个socket描述符,my_addr是一个指向包含有本机IP地址及端口号等信息的sockaddr类型的针; addrlen常被设置为sizeof(struct sockaddr)。 最后,对于bind 函数要说明的一点是,你可以用下面的赋值实现自动获得本机IP地址和随机获取一个没有被占用的端口号: 
    my_addr.sin_port = 0;    /* 系统随机选择一个未被使用的端口号 */ 
    my_addr.sin_addr.s_addr = INADDR_ANY;   /* 填入本机IP地址 */ 
    通过将my_addr.sin_port置为0,函数会自动为你选择一个未占用的端口来使用。同样,通过将my_addr.sin_addr.s_addr置为INADDR_ANY,系统会自动填入本机IP地址。bind()函数在成功被调用时返回0;遇到错误时返回"-1"并将errno置为相应的错误号。另外要注意的是,当调用函数时,一般不要将端口号置为小于1024的值,因为1~1024是保留端口号,你可以使用大于1024中任何一个没有被占用的端口号。

    当对TCP/IP协议族的套接字进行绑定时,我们通常使用另一个地址结构:
        struct sockaddr_in 
        {
            short    sin_family;
            u_short  sin_port;
            struct   in_addr sin_addr;
            char     sin_zero[8];
        };
    其中sin_family置AF_INET;sin_port指明端口号;sin_addr结构体中只有一个唯一的字段s_addr,表示IP地址,该字段是一个整数,一般用函数inet_addr()把字符串形式的IP地址转换成unsigned long型的整数值后再置给s_addr。有的服务器是多宿主机,至少有两个网卡,那么运行在这样的服务器上的服务程序在为其socket绑定IP地址时可以把htonl(INADDR_ANY)置给s_addr,这样做的好处是不论哪个网段上的客户程序都能与该服务程序通信;如果只给运行在多宿主机上的服务程序的socket绑定一个固定的IP地址,那么就只有与该IP地址处于同一个网段上的客户程序才能与该服务程序通信。我们用0来填充sin_zero数组,目的是让sockaddr_in结构的大小与sockaddr结构的大小一致。下面是一个bind函数调用的例子:
    struct sockaddr_in saddr;
    memset((void *)&saddr,0,sizeof(saddr));
    saddr.sin_family = AF_INET;
    saddr.sin_port = htons(8888);
    saddr.sin_addr.s_addr = htonl(INADDR_ANY); 
    //saddr.sin_addr.s_addr = inet_addr("192.168.22.5"); 绑定固定IP
    bind(ListenSocket,(struct sockaddr *)&saddr,sizeof(saddr));
 
    int listen(int sockfd, int backlog); 
    sockfd是socket系统调用返回的服务器端socket描述符;backlog指定在请求队列中允许的最大请求数,进入的连接请求将在队列中等待accept()它们(参考下文)。backlog对队列中等待服务的请求的数目进行了限制,大多数系统缺省值为20。当listen遇到错误时返回-1,errno被置为相应的错误码。   

    int accept(int sockfd, struct sockaddr *addr, int *addrlen); 
    sockfd是被监听的服务器socket描述符,addr通常是一个指向sockaddr_in变量的指针,该变量用来存放提出连接请求的客户端地址;addrten通常为一个指向值为sizeof(struct sockaddr_in)的整型指针变量。错误发生时返回一个-1并且设置相应的errno值。accept()函数将返回一个新的socket描述符,来供这个新连接来使用,在新的socket描述符上进行数据send()和recv()操作。

    故服务器端程序通常按下列顺序进行函数调用: 
    socket(); bind(); listen(); /* accept() goes here */

    connect()函数用来与远端服务器建立一个TCP连接其函数原型为: 
    int connect(int sockfd, struct sockaddr *serv_addr, int addrlen); 
    sockfd是目的服务器的sockt描述符;serv_addr是服务器端的IP地址和端口号的地址。遇到错误时返回-1,并且errno中包含相应的错误码。进行客户端程序设计无须调用bind(),因为这种情况下只需知道目的机器的IP地址,而客户通过哪个端口与服务器建立连接并不需要关心,内核会自动选择一个未被占用的端口供客户端来使用。

    UDP的“connect”:
    1、程序可以使用connect实现UDP连接套接字,作用是在UDP套接字中记住目的地址和目的端口。
    2、UDP套接字使用connect后,如果数据报不是connect中指定的地址和端口,将被丢弃。没有调用connect的UDP套接字,将接收所有到达这个端口的UDP数据报,而不区分源端口和地址。

    关于“bind”:
    1、client端的socket不需要bind,内核会自动选择一个未被占用的port供client来使用,如果有多个可用的连接(多个IP),内核会根据优先级选择一个IP作为源IP使用。
    2、如果socket使用bind绑定到特定的IP和port,则无论是TCP还是UDP,都会从指定的IP和port发送数据。

socket发送与接收数据

    send()和recv()——数据传输,用于面向连接的socket(SOCK_STREAM)上进行数据传输

    int send(int sockfd, const void *msg, int len, int flags); 
    sockfd是你想用来传输数据的socket描述符,msg是一个指向要发送数据的指针。 
    len是以字节为单位的数据的长度。flags一般情况下置为0(关于该参数的用法可参照man手册)。 
    send()函数返回实际上发送出的字节数,可能会少于你希望发送的数据。所以需要对send()的返回值进行测量。当send()返回值与len不匹配时,应该对这种情况进行处理。

    int recv(int sockfd,void *buf,int len,unsigned int flags); 
    sockfd是接受数据的socket描述符;buf 是存放接收数据的缓冲区;len是缓冲的长度。flags也被置为0。recv()返回实际上接收的字节数,或当出现错误时,返回-1并置相应的errno值。

    带外数据:在数据流信道之外的信道上传输的数据,常用于对远端进程的同步和控制。在TCP中一次只能发送1字节的带外数据。
    发送:send(sock_fd,'f',1,MSG_OOB);
    接收:recv(sock_fd,&out_data,1,MSG_OOB); 带外数据存储在out_data中。

    sendto()和recvfrom()——数据传输,用于面向非连接的socket(SOCK_DGRAM/SOCK_RAW)上进行数据传输

    在无连接的数据报socket方式下,由于本地socket并没有与远端机器建立连接,所以在发送数据时应指明目的地址,sendto()函数原型为: 
    int sendto(int sockfd, const void *msg,int len,unsigned int flags,const struct sockaddr *to,int tolen); 
    该函数比send()函数多了两个参数,to表示目地机的IP地址和端口号信息,而tolen常常被赋值为sizeof (struct sockaddr)。sendto 函数也返回实际发送的数据字节长度或在出现发送错误时返回-1。

    int recvfrom(int sockfd,void *buf,int len,unsigned int flags,struct sockaddr *from,int *fromlen); 
    from是一个struct sockaddr类型的变量,该变量保存源机的IP地址及端口号。fromlen常置为sizeof(struct sockaddr)。当recvfrom()返回时,fromlen包含实际存入from中的数据字节数。Recvfrom()函数返回接收到的字节数或当出现错误时返回-1,并置相应的errno。 
    应注意的一点是,当你对于数据报socket调用了connect()函数时,你也可以利用 send()和recv()进行数据传输,但该socket仍然是数据报socket,并且利用传输层的UDP服务。但在发送或接收数据报时,内核会自动为之加上目地和源地址信息。

关闭socket

    close()和shutdown()——结束数据传输 
    当所有的数据操作结束以后,你可以调用close()函数来释放该socket,从而停止在该socket上的任何数据操作:

    close(sockfd); close()是对套接字的操作,关闭后进程不能在访问这个套接字。
    你也可以调用shutdown()函数来关闭该socket。该函数允许你只停止在某个方向上的数据传输,而一个方向上的数据传输继续进行。如你可以关闭某socket的写操作而允许继续在该socket上接受数据,直至读入所有数据。shutdown是对TCP连接的操作。

    int shutdown(int sockfd,int how); 
    sockfd的含义是显而易见的,而参数 how可以设为下列值: 
·0-------不允许继续接收数据 
·1-------不允许继续发送数据 
·2-------不允许继续发送和接收数据,均为允许则调用close() 
    shutdown在操作成功时返回0,在出现错误时返回-1(并置相应errno)。

IP DNS 等相关函数

    in_addr_t inet_addr(const char * strptr);
    将字符串IP地址转换为IPv4地址结构in_addr值

    char * inet_ntoa(struct in_addr * addrptr);
    将IPv4地址结构in_addr值转换为字符串IP

    域名和IP地址的转换: 
    struct hostent *gethostbyname(const char *name); 
    函数返回一种名为hostent的结构类型,它的定义如下: 
    struct hostent 
    { 
         char *h_name;        /* 主机的官方域名 */ 
         char **h_aliases;    /* 一个以NULL结尾的主机别名数组 */ 
         int    h_addrtype;   /* 返回的地址类型,在Internet环境下为AF-INET */ 
         int h_length;        /*地址的字节长度 */ 
         char **h_addr_list;  /* 一个以0结尾的数组,包含该主机的所有地址*/ 
}; 
    #define h_addr h_addr_list[0] /*在h-addr-list中的第一个地址*/

    注意:以上三个函数都是不可重入的,如果你写下如下代码: 
    if(strcmp( inet_ntoa(ip1), inet_ntoa(ip2) ) == 0 ) //判断2个IP地址是否相同
    {
        .... ....
    }
    上面if条件判断永远为真!在使用上面三个函数时,函数返回后,要马上取出结果保存返回值,否则会被下次调用覆盖。因为struct in_addr 和 struct hostent 在保存时使用了static类型。

 

参考:http://www.ibm.com/developerworks/cn/education/linux/l-sock/index.html

 

作者: 阿凡卢
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。
http://www.cnblogs.com/luxiaoxun/archive/2012/10/16/2725760.html
相关实践学习
RocketMQ一站式入门使用
从源码编译、部署broker、部署namesrv,使用java客户端首发消息等一站式入门RocketMQ。
Sqoop 企业级大数据迁移方案实战
Sqoop是一个用于在Hadoop和关系数据库服务器之间传输数据的工具。它用于从关系数据库(如MySQL,Oracle)导入数据到Hadoop HDFS,并从Hadoop文件系统导出到关系数据库。 本课程主要讲解了Sqoop的设计思想及原理、部署安装及配置、详细具体的使用方法技巧与实操案例、企业级任务管理等。结合日常工作实践,培养解决实际问题的能力。本课程由黑马程序员提供。
相关文章
|
4月前
|
API C++
socket编程之常用api介绍与socket、select、poll、epoll高并发服务器模型代码实现(1)
前言   本文旨在学习socket网络编程这一块的内容,epoll是重中之重,后续文章写reactor模型是建立在epoll之上的。
37 0
|
3天前
|
网络协议 Dubbo Java
【网络编程】理解客户端和服务器并使用Java提供的api实现回显服务器
【网络编程】理解客户端和服务器并使用Java提供的api实现回显服务器
9 0
|
4月前
|
监控 安全 Linux
socket编程之常用api介绍与socket、select、poll、epoll高并发服务器模型代码实现(3)
高并发服务器模型-poll poll介绍   poll跟select类似, 监控多路IO, 但poll不能跨平台。其实poll就是把select三个文件描述符集合变成一个集合了。
38 0
|
4月前
|
缓存 JSON API
IOS网络编程:什么是 RESTful API?如何使用 RESTful 风格设计 API?
IOS网络编程:什么是 RESTful API?如何使用 RESTful 风格设计 API?
53 3
|
4月前
|
存储 网络协议 Unix
Linux C socket API 介绍
Socket英文愿意是“插孔”或“插座”,作为BSD UNIX的进程通信机制后,取后一种意思,通常也被称为套接字。使用TCP/IP协议的应用程序通常采用的应用编程是使用UNIX BSD的套接字Socket,来实现网络进程之间的通信。
37 0
|
4月前
|
网络协议 API
socket常用api记录
(2) close 终止读和写两个方向的数据传送。既然TCP连接是全双工的,有时候我们需要告知对端我们已经完成了数据发送,即使对端仍有数据要发送给我们。这就是我们在前一节中遇到的str_cli 函数在批量输入时的情况。图6-12展示了这样的情况下典型的函数调用。(1) close 把描述符的引用计数减1,仅在该计数变为0时才关闭套接字。我们已在4.8节讨论过这一点。使用shutdown 可以不管引用计数就激发TCP的正常连接终止序列(图2-5中由FIN开始的4个分节)。(建立与tcp服务器的连接)
11 0
|
4月前
|
API
socket名称与地址转换api
注意gethostbyname & gethostbyaddr函数已被引入 getaddrinfo 函数弃用。敦促应用程序的开发人员使用 getaddrinfo 函数而不是 gethostbyname。
18 0
|
4月前
|
XML JSON API
Python 的网络编程:解释什么是 RESTful API?
Python 的网络编程:解释什么是 RESTful API?
|
6月前
|
存储 网络协议 API
网络编程必备:深入理解TCP/IP协议栈(含posix API实现)(下)
网络编程必备:深入理解TCP/IP协议栈(含posix API实现)