5 分钟搞懂 ECN

简介: 5 分钟搞懂 ECN

ECN 是通过在 IP 和 TCP 头中携带拥塞信息,通知发送方网络拥塞状态,从而采取相应拥塞控制措施。原文: What is ECN(Explicit Congestion Notification)?


ECN 是 Explicit Congestion Notification 的缩写,意思是显式拥塞通知算法,和慢启动重启或者 AIMD 那样的拥塞控制算法不一样,ECN 只做一件事情,即将路由器的拥塞状态通知给发送方。因此,ECN 是一种拥塞通知或拥塞信令算法,通知发送方有关拥塞的情况,以便采取相应措施避免拥塞。


ECN 是 RFC 3168 中定义的拥塞信令机制,首次发表于 1999 年,并在 2001 年左右定稿。ECN 利用 TCP 报头中的两位和 IP 报头中的两位标记数据包(标记的意思是在头域中翻转一位)。


=>假设 X 让人给 Z 转交一封信。

=>X 将信传递给中间人 Y。

=>Y 先看看自己忙不忙。

=>如果 Y 比较忙,就在信封的一角用钢笔做个十字记号,然后把信传给下一个人。

=>当 Z 收到信时,看到信封一角有十字标记,就知道其中一个中间人现在比较忙。

=>Z 沿原路径给发送方 X 发送 ACK, ACK 信封上带有相同的标记。看到这个标记,X 就知道发生了拥塞。


ECN 可以与 AQM 算法一起使用。AQM 算法在链路拥塞时会主动丢弃数据包,但如果不是丢包,而是可以标记,那就太好了。由于 ECN 不会丢弃数据包,从而避免了重传,这就是为什么 ECN 算法今天非常流行。目的只是让发送方知道路由器发生了拥塞,所以如果可以通过 ECN 告诉发送方,为什么要丢包呢?此外,丢包没法让发送方立马知道发生了拥塞,而这对于时间敏感型数据包非常重要,因为这种类型的流量不高。


为了使用 ECN 机制,发送方、接收方和中间的路由器必须全部支持 ECN 功能。目前,ECN 可以在所有操作系统中实现,比如手机、服务器、笔记本电脑,包括路由器等中间设备。但默认情况下是禁用的,原因不是 ECN 有什么问题,而是因为 ECN 与 AQM 算法一起部署,而由于参数配置的原因,AQM 并不太受欢迎。


TCP 报头中的 ECN 位:




ECN 在 TCP 头中占用 2 位,分别是 CWR 和 ECE,注意两者的顺序。


  • CWR: Congestion Window Reduced,拥塞窗口减少标志
  • ECE: Echo of Congestion Encountered,拥塞响应


这 2 位有 4 种可能组合,每种组合被称为码点(codepoint)。


ECN TCP 报头中的码点:



  • [0 0]为非 ECN 设置码点,收发双方都可以发送。X 发送给 Y 这个代码点的意思是 X 告诉 Y 它不支持 ECN。
  • [0 1]为 ECN Echo 码点,由接收方发送给发送方。如果发送方告诉接收方他支持 ECN,接收方会告诉发送方自己是否支持 ECN。如果接收方支持 ECN,那就用这个码点回复。此外,接收方告诉发送方拥塞时也使用此码点。因此这个码点有两种用法。
  • [1 0]为 CWR 码点,由发送方发送给接收方。此码点用作从发送方发送到接收方的确认,用于告诉接收方,它知道发生了拥塞,已经减小了拥塞窗口大小。
  • [1 1]为 ECN 设置码点,由发送方发送给接收方,告知发送方支持 ECN。


ECN 协商:



  • 第一步: 发送方发送带有 ECN 设置码点(CWR=1, ECE=1)的 SYN 包,告诉接收方它支持 ECN。在通过三次握手建立 TCP 连接时,这些信息总是以 SYN 包的形式传递,而接收方也必须回复 ECN 的状态。
  • 第二步: 如果接收方支持 ECN,就发送 ECN Echo 码点(CWR=0, ECE=1),表示接收方也启用了 ECN。假设接收方不支持 ECN,那么回复非 ECN 设置码点(CWR=0, ECE=0),表示没有启用 ECN。
  • 第三步: 现在,发送方和接收方已经交换了 ECN 信息,可以像正常一样发送数据。


如果发送方和接收方都支持 ECN,并且都标记而不是丢弃数据包。但由于路由器不能读取 TCP 报头,只能读取 IP 报头,因此在 IP 报头中也用 2 位来通知路由器有关 ECN 的信息。


IP 报头中的 ECN 位:




路由器需要运行 AQM 并标记数据包,因此必须知道发送方和接收方是否启用了 ECN。由于路由器不能访问 TCP 报头,所以在 IP 报头中增加了 2 位作为 ECN 码点。


第一位被称为 ECT(ECN Capable Transport),第二位被称为 CE(Congestion Encountered)。同样会有四个码点,但和之前介绍的不太一样。


IP 报头中的 ECN 码点:



  • [0 0]表示非 ECT,意思是数据包不支持 ECN,因此没有必要标记该数据包。如果有拥塞,那么这个数据包必须被丢弃。
  • [0 1]是 ECT(0)码点,表示数据包支持 ECT。
  • [1 0]为 ECT(1)码点,也表示数据包支持 ECT。如果数据包是 ECT(0)或(1),那么这个数据包将不会被路由器丢弃,而只是会被标记。
  • [1 1]为 CE 码点。当路由器拥塞并且数据包支持 ECT 时,路由器将该数据包标记为 CE。路由器将翻转 ECT 码点的 0 位,使其成为 CE。路由器不丢包,而只是标记并将其传输给接收者。




你好,我是俞凡,在 Motorola 做过研发,现在在 Mavenir 做技术工作,对通信、网络、后端架构、云原生、DevOps、CICD、区块链、AI 等技术始终保持着浓厚的兴趣,平时喜欢阅读、思考,相信持续学习、终身成长,欢迎一起交流学习。微信公众号:DeepNoMind

目录
相关文章
|
4月前
|
JavaScript 前端开发
【面试题】这道 JS 经典面试题不要背!今天帮你彻底搞懂它
【面试题】这道 JS 经典面试题不要背!今天帮你彻底搞懂它
|
6月前
|
机器学习/深度学习 人工智能 运维
10 分钟搞懂 LLMOps
10 分钟搞懂 LLMOps
409 0
|
4月前
|
JavaScript 前端开发
【面试题】这道 JS 经典面试题不要背,今天帮你彻底搞懂它!
【面试题】这道 JS 经典面试题不要背,今天帮你彻底搞懂它!
|
3天前
|
C#
彻底搞懂 for、while、do...while
彻底搞懂 for、while、do...while
8 0
|
4月前
|
SQL 关系型数据库 MySQL
搞懂connectTimeout和socketTimeout的区别
搞懂connectTimeout和socketTimeout的区别
76 0
|
6月前
|
人工智能 安全 Cloud Native
5 分钟搞懂 NESAS
5 分钟搞懂 NESAS
59 0
|
10月前
|
Kubernetes 并行计算 负载均衡
一文搞懂 K3D
Hello folks,作为一款由 Google 开发的开源平台,Kubernetes 主要用于自动部署、资源扩展、管理以及编排容器化应用程序。其不仅是提供了一个简单的系统,用于管理跨多个服务器的容器,同时,具备出色的负载平衡和资源分配能力,以确保每个应用程序能够以最佳性能运行。
491 0
|
存储 文字识别 安全
一文搞懂SDIO
SDIO(Secure Digital Input and Output),即安全数字输入输出接口。它是在SD卡接口的基础上发展而来,它可以兼容之前的SD卡,并可以连接SDIO接口设备,比如:蓝牙、WIFI、GPS等。
leetcode14(弄懂了一个知识点)
这个题有一点细节,所以就记录一下(可能不一定准确)
57 0
|
JavaScript Java API
都2022年了你不会还没搞懂this吧
在JS中`this`的绑定规则有`默认绑定`、`隐式绑定`、`显示绑定`、`new绑定`四种。绑定的优先级依次是 `new 绑定 > 显式绑定 > 隐式绑定 > 默认绑定`,下面我们来一一探讨。
58 0