目录
一、什么是协议
为了使数据在网络上传输(从源头到达目的),网络通信的参与方必须遵循相同的规则,如:怎么样建立连接、怎么样传输、怎么样互相解析信息等。只有遵守这个约定,计算机之间才能相互通信交流。这样的规则就被称之为协议(protocol),它最终体现为在网络上传输的数据包的格式。
协议约定了层级和层级之间的调用关系,上层协议调用下层协议,下层协议给上层协议提供支持,不能跨层调用。
详细内容查看:程序猿眼中的协议:TCP / IP 五层网络模型_保护小周ღ的博客-CSDN博客
真实的网络协议使用的是 TCP / IP 五层网络模型,也是当下最广泛使用的网络的模型。
编辑
本次讲述的 UDP 协议是传输层上比较常用的协议。
另外一个更厉害的协议 TCP 敬请期待下一篇博客~
二、认识UDP 协议
UDP(User Datagram Protocol)是一种无连接的传输层协议,它不保证数据传输的可靠性,但是具有传输速度快、开销小等特点。UDP协议主要用于需要快速传输数据且对数据的可靠性要求不高的场景,如在线游戏,分布式系统信息的传输(短距离的传输 UDP 的传输的效率是很高的)。
2.1 UDP协议的特点:
- 无连接:UDP协议在传输数据之前不需要建立连接,也不需要维护连接状态,可以看作是一股脑地传输,因此传输速度快。
- 不可靠:UDP协议不保证数据传输的可靠性,因为它不提供重传机制、异常处理等功能,如果数据在传输过程中出现丢失或错误,UDP协议也不会进行任何处理。
- 面向数据报:数据报是通过网络传输的数据的基本单元,包含一个报头(header)和数据本身,其中报头描述了数据的目的地以及和 “荷载” 数据之间的关系。UDP协议的头部只有8个字节,相比TCP协议的头部要小得多,开销也相对小。该知识点下文详细介绍。
- 全双工通信:通信允许数据在两个方向上同时传输,比如打电话,通话双方可以同时讲话。
- 支持广播和多播:UDP协议支持广播和多播,可以将数据同时发送给多个主机。
敲黑板面试题:TCP 与 UDP有什么区别?
TCP 是面向有连接,采用字节流传输,数据传输可靠的全双工通信协议。
UDP 是面向无连接,采用数据报传输,数据传输不可靠的全双工通信协议。
2.2 UDP 协议的报文格式
学习协议其中一个重要的环节就是认识协议报文格式,一个协议具体是怎么组织数据的。
编辑 编辑
UDP报文主体分为两个部分: UDP报头(占8个字节的数据) + UDP数据 / UDP载荷
- 荷载:比较容易理解,里面存储的是应用层的数据报。
- UDP报头:源端口,目的端口,报文长度,校验和,组成,每个部分占两个字节,可以描述的数据范围是 [0, 65535] 。
解析报文:
- 源端口:表示数据从哪里来,端口号可认为是一个进程的标识(那个软件发送的信息),传输层毕竟给应用层提供服务。
- 目的端口:表示数据到哪里去,数据报到达指定主机后,将数据报给那个软件解析(进程,通信双方约定了统一的协议格式就可以互相解析数据)。
- 传输层的数据报进入网络层后会添加网络层报头,网络层报头中会描述 源 IP 和 目的IP ,这层协议可以用来在庞大的网络环境中找到目标主机。
- 报文长度:描述了一条 UDP 数据报所占字节大小,因为长度只占 2个字节,所以他能描述的数据范围是 [0, 65535], 所以一条 UDP 数据报最大长度是 65536 个字节 = 64KB;
- 校验和:网络传输并非完全稳定,信息的传输方式有多种多样,难免会出现意外,例如说:恶劣天气,强磁场干扰,传输介质,信号衰减等原因,所以校验和存在的目的就是用来判断一下,当前传输的数据是否出错,如果校验和不对,传输的数据一定不对,即使校验和是对的,数据也有一定的概率是错误的,校验和的校验方式通常会以数据内容(正文荷载中的数据)作为参数进行算法计算,当接收方拿到 UDP 数据报后, 把荷载中的数据拿出来代入校验和算法,再把结果与校验和比较是否相同,即可判断数据传输是否准确。(前提是输入的内容一样,按照统一算法得到的校验和结果也是一样的)。只能由接收端判断数据是否可靠,UDP 协议不提供重发机制,错了就错了,只管传输。
- UDP 数据报正文\荷载:里面包含的是应用层数据报的信息,UDP 报文长度(最大值) - UDP 报头即可得荷载大小,报文长度最大是可以描述 64字节,UDP整个报头占 8 个字节,所以荷载最大存储空间(一条UDP 数据报最大能携带的应用层信息)是 64 - 8 = 56字节。
端口号详解:
所谓的端口,可以看作应用程序的门牌号一样,客户端可以通过ip地址找到对应的目的端,但是目的端是有很多应用程序端口的,每个应用程序对应一个端口号;
比如说我电脑qq 给 你发了一条消息,这个条消息通过网络发送到你的电脑,进入你的电脑后,这条消息怎么能知道要给那个应用程序呢(进程)?微信也是腾讯的,也没见着能接收qq 发的消息啊,关键的就是应用程序在启动时会绑定了一个端口号(端口号在一定范围内可以随机使用),一台主机中的端口号不可重复,所以消息在进入主机后就会根据端口号将信息发送到指定应用程序,应用程序就根据应用层的数据报协议(这个可以是通信双方约定的协议,qq自己的协议)解析信息。
端口号只占两个字节,可以描述的数据范围是 [0, 65535] ,也就是我们可以使用的端口号只有这么多,对于小于 1024 的端口号被称之为“知名端口号”,是提供给一些名气比较大的服务器使用,例如:http 服务器的端口号位 80, ssh 的端口号为:22, ftp 服务器的端口号是 21。所以我们要在程序设计中尽量避免使用这部分端口。
2.3 使用UDP 协议传输大文件时的策略
上文介绍 一条 UDP 数据报最大可以传输 64 个字节,去掉报头之后有效的报文荷载只有56字节,也就是说一条 UDP 数据最多传输 56个字节的内容,对于高速发展的科技,太小了,一首歌就有几兆呢(M)。
在面对大型文件传输的时候,UDP 将一个大的数据报拆分成多个部分,使用多个 udp 数据报来传输,作为接收方(应用层)来讲,就需要与发送方(应用层)约定好数据报的解析协议。
例如:我qq给女朋友发送了一大段小作文(应用层的数据报),刷刷的好几百KB, 使用 UDP 协议传输,一条UDP 数据报肯定是不够的,就可以分割成好几条数据报传输,作为接收方(女朋友)的qq, 就需要将发送过来的 UDP 数据报解析\分用成应用层数据报,这个时候根据某种相互约定好的协议才能解析。
编辑 编辑
作为接收方来讲以上数据如何由多条UDP 数据报,组合成一条应用层的数据报呢 ?
所谓封装 UDP 数据报,分割应用层数据报什么的实质上就是字符串的拼接,也就是说数据报的本质就是字符串,协议就是描述了如何 封装\分用\解析 这些字符串。
UDP协议并没有对分割后的数据报作出重新组合的规定,这是由应用层协议负责实现(因为是应用层选择使用 UDP 协议),那么就需要根据UDP协议长度这一特性来设计应用层数据报,一般来说,应用层协议会在发送端进行相关处理,将原始数据分割成多个UDP数据报发送出去,在接收端进行接收之后再进行重新组合,实现方法可以有多种,比如可以在UDP首部附加序列号等信息,接收端通过这些信息来拼接数据报,包括使用一些特殊的分隔符区分一条应用层数据报等等,这方面都是可以通过应用层的手段来控制的。
使用一些特殊的分隔符区举个例子:
编辑
这只是一种应用层协议约定的策略,是可以自定义的,前提是通信双方都采用该协议。
当需要我们使用UDP 协议传输大文件时,还有一种方式是建议直接使用 TCP 协议传输,哈哈,即使没有 UDP 传输的快,但是数据传输的真实性高,还没有 UDP 这么麻烦,TCP 是面向字节流传输的嘛,同时也需要通信双方约定好应用层协议,方便解析信息。
2.4 UDP协议的工作流程
- 应用程序将应用层数据报传输给UDP协议。
- UDP协议将数据封装成UDP数据报(直接在应用层数据报的基础上加上UDP 报文),包括源端口号、目的端口号、数据长度等信息。
- UDP协议将UDP数据报传输给IP协议。
- IP协议将UDP数据报封装成IP数据报,包括源IP地址、目的IP地址等信息。
- IP数据报通过网络传输到目的主机。
- 目的主机的IP协议将IP数据报解封装成UDP数据报。
- UDP协议将UDP数据报传输给应用程序
总结:UDP协议是一种简单、快速的传输协议,适用于实时应用程序和需要快速传输数据的应用场景。但是由于它不保证数据传输的可靠性,因此在传输重要数据时需要使用其他协议,如TCP协议。
不用勉强自己去做不喜欢的事