TCP Segment Offload(TSO)的实现原理浅析

简介:
早上太燥热,突然想起三周前有人跟我交流了TSO的问题,我也描述了其原理,这个原理说来也是特别简单,无非就是靠网卡硬件来分段,计算 checksum,从而解放CPU周期。其实只要说一个就够了,既然靠硬件来分段,那么只能由硬件来计算checksum了,因为你根本就不知道硬件的分 段细节,所以你也没法在分段前计算好每一个段的checksum....
       TSO的原理几乎每个人都知道,事实上它是怎么实现的这个问题也不难,难的是细节。在做完了正事之后,我想把这个原理展现出来,当然可能和实际的实现有超级大的出入,不管怎样,它是一个原理框图,仔细观察,应该也能自己实现一个比我这个更好的TSO了。
       这个设计是一个数字逻辑,时序电路的范畴,而这个领域十分地高大上,并不是普通的软件程序员能hold住的,像我这样的半瓶子也一样。所以我依然是按照老 样子,试图直接给出一个结果,而不是要求听书的人事先做一些准备,往往在人们做这些准备工作的时候,就已经厌倦放弃了。
       基础知识不难,就是一些门电路,与门,非门,比较器,译码器,触发器之类的,这些东西随便找一本计算机组成原理,都很齐全。关键是怎么组合它们,这是另一 个领域的编程。此时,我想起了15年前我的高中物理老湿刘丹青在讲电路的时候说过的一句话:让电流流一下。这句话在科班人看来完全不符合电路设计的基本原 则,他们可能更倾向于首先建模,然后分析,然后使用描述语言VHDL写出代码,最后再给出电路,我觉得这适合于设计本身,但是不适合于对一个门外汉讲述其 精彩。对于一个门外汉来讲,他唯一所知道的就是,让电流流一下,然后冲过这个门,冲过那个管,好了,高电平变成低电平了....在我看来,就是这么回事。
       在一张白纸上,画出一堆的门电路,然后随性随意组合它们,慢慢的,我突然发现,这个电路就是TSO的框架了。我记得上周帮人固化了路由转发表,然而那种固 化行为可能会因为成本过高而被pass掉,毕竟如今的软实现已经够用了吧。所以只有核心传输网才需要这种固化的转发表,然而TSO却是服务器领域的首推, 服务器太多了,远比核心转发设备多,它们的CPU需要减负,确实,CPU去计算一些固定模式的东西,有点浪费,它应该花更多的精力去处理一些不可控的东 西。所以TCP分段这种事情自然而然就由网卡代劳了。你,我,他,我们都遇到过TSO,但是我们只会开启,关闭它,如果你想知道它到底是怎么 Offload的,请看下图,让电流流一流:

wKiom1WzK0exrDQsAAZR4khvYXY659.jpg
TCP分段和IP分片的区别很大,这个事你一定要明白。然后才可以看懂上面的图。
       以上的解析只是一个特例,事实上,所有的硬件加速机制无非都是一样的机制。当我在看Intel千兆/万兆网卡的手册时,我想到在芯片的内部,这种电路的元 件几乎是海量的,实现了RSS,硬件hash分类等。这就是我所谓的江河泛滥,沿着沟壑瞬间吞噬大地,我们该如何挖沟填壑,这不是本文的目的,本文只是描 述了这种可能性。这也是这种专用电路和通用CPU之间的本质区别。CPU存在着一个指令集,这意味着它是关注于外部如何调用的,而专用电路的关注点在于内 部的执行逻辑,它几乎不对外提供任何接口,唯一的就是设置几个寄存器的值,比如MTU,数据包长度,数据包头长度等,其它的执行逻辑,外部无权过问。这是 串行编程和并行执行的本质区别。
       对于指令系统,也有一些要说的。在内部控制逻辑上,有一个统一的指令分发系统,实际上就是发射出一系列的0和1的组合,这个组合中的0和1作用于各种门电 路,这些门电路接受了这些不同的输入后,产生不同的输出,然后再作为另外的门电路的输入,造成不同的输出,如此反复...难道事实不是这样子吗?你很难否 则定。
       让电流流一流,如果你觉得比较抽象,那就观察洪水泛滥的过程吧,大河决堤的地点不同,造成的灾难也不同,关键在于决堤处的地势以及其所连接的各种地形,这 一切都是同时发生的,和电流一样,水流在经过一个弯道或者一道拱桥的时候,也会有一些延时和分流,这就可以类比电路中的各种门。
       吃饭了,吃饭了,真烦!



 本文转自 dog250 51CTO博客,原文链接:http://blog.51cto.com/dog250/1678286


相关文章
|
弹性计算 安全 定位技术
阿里云服务器机房具体地址在哪?查询方法来了
阿里云服务器机房具体地址在哪?查看详细地址方法太牛了
13766 2
阿里云服务器机房具体地址在哪?查询方法来了
|
7月前
|
存储 人工智能 安全
函数计算进化之路:AI Sandbox 新基座
AI Agent Sandbox 是应对 AI 代理自主性风险的关键技术,提供安全隔离环境以执行代码、交互应用和处理敏感数据。它解决了三大挑战:隔离与安全、状态管理与成本、可扩展性与运维。阿里云函数计算凭借物理隔离架构、Serverless 弹性与成本优势,结合会话亲和、隔离及存储安全等创新能力,成为 AI Agent Sandbox 的理想运行时平台,助力 AI 技术安全落地与商业化发展。
|
8月前
|
缓存 运维 监控
《微服务架构从故障频发到自愈可控的实战突围方案》
本文以某金融科技平台支付结算系统的“超时连锁故障”为切入点,复盘了微服务架构在高并发场景下的稳定性危机。故障根源在于渠道路由模块配置加载的并发冲突,以及线程池与超时参数的失配,且因缺乏有效隔离机制导致故障蔓延。团队通过重构配置加载逻辑、构建参数动态匹配模型、搭建三维监控体系、引入服务隔离与流量治理策略,并结合混沌工程演练,将架构从“被动修复”升级为“自愈可控”。最终系统交易成功率稳定在99.98%以上,同时沉淀出微服务韧性建设的实战方法论。
238 0
|
存储 缓存 网络协议
深入理解Linux网络——内核是如何发送网络包的
一、相关实际问题 1. 查看内核发送数据消耗的CPU时应该看sy还是si 2. 在服务器上查看/proc/softirqs,为什么NET_RX要比NET_TX大得多 3. 发送网络数据的时候都涉及那些内存拷贝操作 4. 零拷贝到底是怎么回事 5. 为什么Kafka的网络性能很突出
|
传感器 监控 物联网
《解锁分布式软总线:构建智能设备统一管理平台》
随着智能设备数量激增,如何有效管理这些设备成为一大挑战。分布式软总线技术应运而生,作为一种创新通信技术,它整合Wi-Fi、蓝牙、NFC等优势,打破设备间连接壁垒,提供统一通信接口,极大降低开发难度。通过设备自发现机制、灵活组网方式及抽象控制模型,分布式软总线实现了设备的统一管理。在智能家居中,用户可一键控制多品牌设备;智能办公场景下,任务可在多设备间无缝流转;工业互联网领域,实时监控与智能调度显著提升生产效率。这一技术为智能化生活和工作提供了强大支撑,推动各行业向数字化、智能化发展。
333 0
|
负载均衡 安全 网络安全
|
缓存 前端开发 Linux
PAS工具分享 - FrameScope与RTRadar
本次分享的主题是PAS工具分享 - FrameScope与RTRadar,由阿里云基础软件系统研发团队工程师刘依男、苏峰分享。主要分为三个部分: 1. PAS性能分析套件综述 2. PAS FrameScope 3. PAS RTRadar
421 0
|
小程序 搜索推荐 前端开发
小剧场短剧影视小程序开发
小剧场短剧影视小程序旨在为用户提供一个便捷、互动的平台,让用户能够随时随地观看、分享和评论各类小剧场短剧。通过小程序,用户可以浏览热门短剧、搜索感兴趣的内容、参与社区互动,以及享受个性化的推荐服务。

热门文章

最新文章

下一篇
开通oss服务