中国首个高通量以太网联盟诞生!阿里云等40多家企业率先加入

简介: 阿里云与中国科学院计算技术研究所联合发起高通量以太网联盟,中国首个高通量以太网协议即将发布

【阅读原文】戳:中国首个高通量以太网联盟诞生!阿里云等40多家企业率先加入

6月21日消息,在天津举行的“2024晶上系统生态大会”上,中国工程院院士孙凝晖公布了中国首个高通量以太网联盟的最新进展。该联盟由阿里云和中国科学院计算技术研究所联合发起,目前已有北京大学、平头哥、盛科、腾讯、字节跳动、曙光、寒武纪等40余家单位率先加入。高通量以太网联盟将在今年9月发布国内首个高通量以太网协议1.0,提出面向智算场景的网络方案解决方案,同时首次完整提出了针对集合通信的在网计算解决方案。

 

 

在AI大模型时代,单纯依赖提高芯片性能已不足以应对训练和推理过程中迅猛增长的算力需求,行业的关注点转向了在系统架构方面进行创新。2023年7月,阿里云和中国科学院计算技术研究所联合发起了高通量以太网联盟(ETH+ Consortium),希望通过开源开放的技术合作促进创新,凝聚国内网络产业链力量,帮助国内企业率先形成落地产品体系。

 

高通量以太网联盟下设协议标准和产业项目两大工作组,其中协议组聚焦高通量以太网协议设计,在兼容传统以太网协议的同时,重点解决其可扩展性不足、负载不均、性能欠佳等问题;产业项目工作组负责对接应用场景需求,组织产业项目实施。同时,联盟特设产业咨询会,负责跟进产业需求、拉动产业资源;设置执行委会制定技术路线图,协同推进各小组工作。

 

据孙院士介绍,联盟将于今年9月发布高通量以太网协议标准草案1.0版,内容包括性能提升的网络层、链路层和物理层定义,以及国内首个完整开放的在网计算方案。同时,也将发布与协议配套的开源硬件IP、商业版IP和验证原型。

 

据介绍,中国科学院计算技术研究所是中国第一个专门从事计算机科学技术综合性研究的学术机构,研究和开发了我国自主的曙光系列高性能计算机系统,在高性能网络领域拥有20余年的技术积累,研制了京兆系列高性能互连芯片,并将对其核心芯片设计进行开源。

 

据了解,阿里云在高性能网络领域已深耕多年,提出了端网融合的可预期网络技术体系,并在业界率先实践完成RDMA低延时网络、智算集群网络架构HPN 7.0等先进网络技术的大规模实践。其中,HPN 7.0架构即面向AI时代对网络高性能需求而研发,针对大模型训练场景下规模大、大流多、突发强烈、稳定性需求高的特点,创新性地设计了“双上联+多轨+双平面”的网络架构,并配合最新一代的51.2 Tbps单芯片以太网交换机和400 G高性能网卡,自研Solar-RDMA和ACCL通信库,实现了单层千卡、两层万卡的高性能和高稳定互联。

 

阿里巴巴曾获评权威机构AMiner全球十大最具影响力的网络研究机构。不久前,阿里云成功入选超以太网联盟(UEC)技术咨询委员会,成为唯一的中国公司成员,与微软、Meta、AMD、博通等,共同推进开放网络系统及核心技术的研发及标准制定。同时,阿里云也是开放网络SONiC社区7个发起成员之一和技术委员会副主席单位。


我们是阿里巴巴云计算和大数据技术幕后的核心技术输出者。

欢迎关注 “阿里云基础设施”同名微信微博知乎

获取关于我们的更多信息~

相关文章
|
2月前
|
存储 弹性计算 数据库
阿里云权益中心,助力学生、开发者、企业用云上云无忧
阿里云权益中心支持学生、开发者和企业快速上云,提供“99计划”惠及中小企业和开发者,包括云产品试用、精选优惠和上云扶持。高校用户可通过“云工开物”计划享专属优惠。企业用户可获上云抵扣、1对1服务及成长权益。多种云产品免费试用,降低上云门槛。
阿里云权益中心,助力学生、开发者、企业用云上云无忧
|
2月前
|
弹性计算 运维 Serverless
阿里云Elasticsearch Serverless助力大型企业咨询公司大幅提升效能
阿里云Elasticsearch Serverless服务,提升了某大型企业咨询公司的数据查询速度和准确性,在实现成本可控的同时,帮助提高了企业效能并加强了客户服务能力。
336 0
|
4天前
|
弹性计算 运维 Kubernetes
阿里云ECS与混合云策略的结合,不仅为企业搭建了一个既灵活又稳定的IT基础架构,还为业务的快速发展与创新提供了坚实的技术支撑。
【7月更文挑战第3天】阿里云ECS在混合云中扮演关键角色,提供弹性计算资源和多样计费模式,确保业务连续性与灵活性。通过VPC互通、应用迁移、数据同步服务,如VPC对等连接、DTS,实现云上云下资源的高效整合。结合安全解决方案,保证在混合环境下的合规与安全。阿里云ECS助力企业数字化转型,应对市场变化。
31 1
|
9天前
|
运维 Kubernetes Devops
阿里云云效操作报错合集之Message: code: 403, 当前代码组下无法创建可见性为企业可见的代码库,该如何处理
本合集将整理呈现用户在使用过程中遇到的报错及其对应的解决办法,包括但不限于账户权限设置错误、项目配置不正确、代码提交冲突、构建任务执行失败、测试环境异常、需求流转阻塞等问题。阿里云云效是一站式企业级研发协同和DevOps平台,为企业提供从需求规划、开发、测试、发布到运维、运营的全流程端到端服务和工具支撑,致力于提升企业的研发效能和创新能力。
|
23天前
|
弹性计算 安全 持续交付
深度评测:阿里云“高效构建企业门户网站”解决方案
阿里云的“高效构建企业门户网站”解决方案在操作便捷性、系统稳定性、扩展性以及成本控制等方面都表现出色,为企业用户提供了一站式的网站建设和托管服务。
54 3
|
9天前
|
敏捷开发 Kubernetes 网络安全
阿里云云效产品使用问题之代码从一个账号迁移到另一个账号(从一个企业迁移到另一个企业),该如何迁移
云效作为一款全面覆盖研发全生命周期管理的云端效能平台,致力于帮助企业实现高效协同、敏捷研发和持续交付。本合集收集整理了用户在使用云效过程中遇到的常见问题,问题涉及项目创建与管理、需求规划与迭代、代码托管与版本控制、自动化测试、持续集成与发布等方面。
|
2月前
|
弹性计算 运维 监控
【阿里云弹性计算】从物理机到阿里云ECS:企业IT架构转型升级之路
【5月更文挑战第29天】随着云计算兴起,企业正转向阿里云ECS以应对传统物理机的挑战。本文详述了这一转型过程,包括现状评估、迁移计划制定、测试环境搭建、应用数据迁移及后期监控优化。转型升级可提升资源利用率,降低运维成本,加快业务响应,并增强数据安全。示例代码展示了使用阿里云Python SDK创建ECS实例的过程。
159 1
|
2月前
|
存储 人工智能 运维
|
2月前
|
存储 弹性计算 运维
阿里云Elasticsearch Serverless助力医疗科技企业实现业务提效和加速创新
通过采用阿里云Elasticsearch Serverless服务,某医疗科技企业解决了大规模智能床垫数据存储和分析的挑战。Serverless架构帮助客户降低50%以上的成本,实现资源弹性伸缩,免去运维负担,提高业务弹性和稳定性,企业能更专注于产品创新和用户体验优化。
395 1