TCP是面向连接的,UDP是面向无连接的。
什么叫面向连接,什么叫无连接呢?
互通前,面向连接的协议会先建立连接。TCP会三次握手,UDP不会。
为什么要建立连接?
你TCP三次握手,我UDP也可以发三个包玩玩,有啥区别?
所谓建立连接,是为了在客户端和服务端维护连接,而建立特定数据结构维护双方交互的状态,保证所谓的面向连接特性。
例如,TCP提供可靠交付。
通过TCP连接传输的数据:
- 无差错
- 不丢失
- 不重复
- 按序到达
IP包无可靠性保证,但TCP能做到那个连接维护的程序做的事情。而UDP继承了IP包的特性,不保证:
- 不丢失
- 按序到达
TCP面向字节流。
发送时真的是一个流,没头没尾。IP包不是一个流,而是一个个IP包。之所以变成流,这是TCP自己的状态维护做的事情。
而UDP继承了IP特性,基于数据报,一个个发,一个个收。
TCP可以拥塞控制。
它意识到包丢弃或网络环境不好了,就会根据情况调整自身行为,看看是不是发快了,要不要发慢点。
UDP就不会,应用让我发,我就发。
所以TCP是个有状态服务,它精确地记着发送了没有,接收到没有,发送到哪个了,应该接收哪个了,错一点儿都不行。
而 UDP则是无状态服务。 通俗地说是没脑子的,天真无邪的,发出去就发出去了。
若:
- MAC层定义了本地局域网的传输行为
- IP层定义了整个网络端到端的传输行为
这两层的定义说明:网络传输以包为单位,二层叫帧,网络层叫包,传输层叫段。笼统称为包。包单独传输,自行选路,在不同的设备封装解封装,不保证到达。基于这个基因,亲生子UDP完全继承了这些特性。
UDP包头
当我发送的UDP包到达目标机器后,发现MAC地址匹配,于是取下,将剩下的包传给处理IP层的代码。
把IP头取下来,发现目标IP匹配,接下来这里面的数据包给谁呢?
发送时,我知道我发的是一个UDP包,收到的那台机器咋知道的?
所以在IP头里面有个8位协议,存放数据里面到底是TCP or UDP,当然这里是UDP。
于是如果知道UDP头的格式,就能从数据里将它解析。
解析出来后的数据给谁处理呢?
处理完传输层,内核工作就结束了,里面的数据应该交给应用程序处理。
一台机器上那么多应用程序,给谁呢?
无论应用程序写的使用TCP还是UDP传数据,都要监听一个端口。
端口用来区分应用程序。两个应用监听一个端口,到时候包给谁?
所以无论是TCP、UDP包头里,应该有端口号,根据端口号,将数据交给相应应用程序。
UDP包头有端口号,有源端口号和目标端口号,因为是两端通信嘛。
UDP除了端口号,也没有其他的了。
UDP的特点
沟通简单,不需要大量数据结构、处理逻辑、包头字段。
前提是它相信网络世界是美好的,秉承性善论,相信网络通路默认就是很容易送达的,不易被丢弃。
轻信他人。
它不会建立连接,虽然有端口号,但是监听在这个地方,谁都可以传给他数据,他也可以传给任何人数据,甚至可以同时传给多个人数据。
愣头青。不知何时该坚持,何时该退让。
不会根据网络情况进行发包的拥塞控制,无论网络丢包丢成啥样,它该怎么发还怎么发。
UDP使用场景
需要资源少,在网络情况比较好的内网,或对于丢包不敏感的应用。即对于失败不那么敏感的场景。
DHCP就是基于UDP。一般获取IP地址都是内网请求,而且一次获取不到IP又没事,过一会儿还有机会。
PXE可以在启动时自动安装os,os镜像的下载使用的TFTP,也是基于UDP。在还没有os时,客户端拥有的资源很少,不适合维护一个复杂状态机,而是因为是内网,一般也没啥问题。
无需一对一沟通,建立连接,而是可以广播的应用。
UDP的不面向连接特性,可承载广播或多播协议。DHCP就是一种广播,基于UDP。
对于多播,IP地址的D类地址,即组播地址,使用这个地址,可以将包组播给一批机器。当一台机器上的某个进程想监听某个组播地址时,需发送IGMP包,所在网络的路由器就能收到这个包,知道有个机器上有个进程在监听这个组播地址。当路由器收到这个组播地址时,会将包转发给这台机器,这就实现了跨路由器的组播。
需要处理速度快,时延低,可以容忍少数丢包,但要求即便网络拥塞,也毫不退缩,一往无前。
UDP简单、处理速度快,不像TCP操心各种重传,顺序,前面的不收到,后面的没法处理。不然等这些事情做完了,时延早就上去了。而TCP在网络不好出现丢包时,拥塞控制策略会主动退缩,降低发送速度,这就相当于本来环境就差,还自断臂膀,用户本来就卡,这下更卡。
当前很多应用都是要求低时延的,它们可不想用TCP如此复杂的机制,而是想根据自己的场景,实现自己的可靠和连接保证。例如,如果应用自己觉得,有的包丢了就丢了,没必要重传了,就可以算了,有的比较重要,则应用自己重传,而不依赖于TCP。有的前面的包没到,后面的包到了,那就先给客户展示后面的嘛,干嘛非得等到齐了呢?如果网络不好,丢了包,那不能退缩啊,要尽快传啊,速度不能降下来啊,要挤占带宽,抢在客户失去耐心之前到达。
如果你实现的应用需要有自己的连接策略,可靠保证,时延要求,使用UDP,然后再应用层实现再好不过。