ECN 是通过在 IP 和 TCP 头中携带拥塞信息,通知发送方网络拥塞状态,从而采取相应拥塞控制措施。原文: What is ECN(Explicit Congestion Notification)?
ECN 是 Explicit Congestion Notification 的缩写,意思是显式拥塞通知算法,和慢启动重启或者 AIMD 那样的拥塞控制算法不一样,ECN 只做一件事情,即将路由器的拥塞状态通知给发送方。因此,ECN 是一种拥塞通知或拥塞信令算法,通知发送方有关拥塞的情况,以便采取相应措施避免拥塞。
ECN 是 RFC 3168 中定义的拥塞信令机制,首次发表于 1999 年,并在 2001 年左右定稿。ECN 利用 TCP 报头中的两位和 IP 报头中的两位标记数据包(标记的意思是在头域中翻转一位)。
=>假设 X 让人给 Z 转交一封信。
=>X 将信传递给中间人 Y。
=>Y 先看看自己忙不忙。
=>如果 Y 比较忙,就在信封的一角用钢笔做个十字记号,然后把信传给下一个人。
=>当 Z 收到信时,看到信封一角有十字标记,就知道其中一个中间人现在比较忙。
=>Z 沿原路径给发送方 X 发送 ACK, ACK 信封上带有相同的标记。看到这个标记,X 就知道发生了拥塞。
ECN 可以与 AQM 算法一起使用。AQM 算法在链路拥塞时会主动丢弃数据包,但如果不是丢包,而是可以标记,那就太好了。由于 ECN 不会丢弃数据包,从而避免了重传,这就是为什么 ECN 算法今天非常流行。目的只是让发送方知道路由器发生了拥塞,所以如果可以通过 ECN 告诉发送方,为什么要丢包呢?此外,丢包没法让发送方立马知道发生了拥塞,而这对于时间敏感型数据包非常重要,因为这种类型的流量不高。
为了使用 ECN 机制,发送方、接收方和中间的路由器必须全部支持 ECN 功能。目前,ECN 可以在所有操作系统中实现,比如手机、服务器、笔记本电脑,包括路由器等中间设备。但默认情况下是禁用的,原因不是 ECN 有什么问题,而是因为 ECN 与 AQM 算法一起部署,而由于参数配置的原因,AQM 并不太受欢迎。
TCP 报头中的 ECN 位:
ECN 在 TCP 头中占用 2 位,分别是 CWR 和 ECE,注意两者的顺序。
- CWR: Congestion Window Reduced,拥塞窗口减少标志
- ECE: Echo of Congestion Encountered,拥塞响应
这 2 位有 4 种可能组合,每种组合被称为码点(codepoint)。
ECN TCP 报头中的码点:
- [0 0]为非 ECN 设置码点,收发双方都可以发送。X 发送给 Y 这个代码点的意思是 X 告诉 Y 它不支持 ECN。
- [0 1]为 ECN Echo 码点,由接收方发送给发送方。如果发送方告诉接收方他支持 ECN,接收方会告诉发送方自己是否支持 ECN。如果接收方支持 ECN,那就用这个码点回复。此外,接收方告诉发送方拥塞时也使用此码点。因此这个码点有两种用法。
- [1 0]为 CWR 码点,由发送方发送给接收方。此码点用作从发送方发送到接收方的确认,用于告诉接收方,它知道发生了拥塞,已经减小了拥塞窗口大小。
- [1 1]为 ECN 设置码点,由发送方发送给接收方,告知发送方支持 ECN。
ECN 协商:
- 第一步: 发送方发送带有 ECN 设置码点(CWR=1, ECE=1)的 SYN 包,告诉接收方它支持 ECN。在通过三次握手建立 TCP 连接时,这些信息总是以 SYN 包的形式传递,而接收方也必须回复 ECN 的状态。
- 第二步: 如果接收方支持 ECN,就发送 ECN Echo 码点(CWR=0, ECE=1),表示接收方也启用了 ECN。假设接收方不支持 ECN,那么回复非 ECN 设置码点(CWR=0, ECE=0),表示没有启用 ECN。
- 第三步: 现在,发送方和接收方已经交换了 ECN 信息,可以像正常一样发送数据。
如果发送方和接收方都支持 ECN,并且都标记而不是丢弃数据包。但由于路由器不能读取 TCP 报头,只能读取 IP 报头,因此在 IP 报头中也用 2 位来通知路由器有关 ECN 的信息。
IP 报头中的 ECN 位:
路由器需要运行 AQM 并标记数据包,因此必须知道发送方和接收方是否启用了 ECN。由于路由器不能访问 TCP 报头,所以在 IP 报头中增加了 2 位作为 ECN 码点。
第一位被称为 ECT(ECN Capable Transport),第二位被称为 CE(Congestion Encountered)。同样会有四个码点,但和之前介绍的不太一样。
IP 报头中的 ECN 码点:
- [0 0]表示非 ECT,意思是数据包不支持 ECN,因此没有必要标记该数据包。如果有拥塞,那么这个数据包必须被丢弃。
- [0 1]是 ECT(0)码点,表示数据包支持 ECT。
- [1 0]为 ECT(1)码点,也表示数据包支持 ECT。如果数据包是 ECT(0)或(1),那么这个数据包将不会被路由器丢弃,而只是会被标记。
- [1 1]为 CE 码点。当路由器拥塞并且数据包支持 ECT 时,路由器将该数据包标记为 CE。路由器将翻转 ECT 码点的 0 位,使其成为 CE。路由器不丢包,而只是标记并将其传输给接收者。
你好,我是俞凡,在 Motorola 做过研发,现在在 Mavenir 做技术工作,对通信、网络、后端架构、云原生、DevOps、CICD、区块链、AI 等技术始终保持着浓厚的兴趣,平时喜欢阅读、思考,相信持续学习、终身成长,欢迎一起交流学习。微信公众号:DeepNoMind