「智驱未来,云网随行」阿里云基础设施AI技术沙龙云网络专场在杭州举办

简介: 6月20日,阿里云基础设施AI Tech Day ·云网络专场在杭州太极禅院成功举办。活动吸引了来自吉利、极氪、浙江大学等35位技术负责人及师生参与。现场围绕AI场景下的算力资源网络建设,探讨了数据采集、模型调度、算力池化等关键技术方案,分享了阿里云在通义模型、PAI平台、弹性计算及云网络方面的最佳实践,助力企业构建智能、弹性的AI基础设施。

聚焦AI场景下的算力资源网络建设,「智驱未来,云网随行」阿里云基础设施AI Tech Day首场 ·云网络专场于6月20日下午在杭州太极禅院顺利举办,现场吸引了来自吉利、极氪、万帮、正元智慧、分叉智能、小影科技、哈啰、国家(杭州)新型互联网交换中心、飞致云等25家AI领域相关企业或有AI建设诉求企业的35名技术/研发负责人、架构师及IT运维工程师参与,同时也吸引了浙江大学、浙江外国语学院、杭州师范大学等从事AI领域研究的师生参与现场学习讨论。 本次技术沙龙旨在聚焦企业在AI模型及应用运营或者使用过程中的实际需求,探讨如何通过优化模型调度、算力资源池化、数据深度挖掘等场景下的AI基础设施 & 网络架构,帮助企业打造智能、弹性、稳定的下一代AI Infra。


阿里云 公共云事业部 江浙皖大区副总经理 张思远(紫鉴)致开场辞,随着AI能力的加持,企业的IT基础设施建设已经不仅仅是一个流程和工具的重构,而是深刻地纳入企业的业务流程,成为很多企业的战略决策参与者。在AI的加持下,我们今天的云基础设施也在重新被定义,也希望云基础设施能够成为AI爆发的创新土壤。在AI时代,无论是企业还是个人的竞争更多是认知速度的竞争。认知速度都要向网络速度靠拢,零等待的高性能智能网络可能是AI时代业务爆发的一个底座和前提。希望阿里云无论是网络、计算、通义、PAI等基础能力能够助力大家共同创造和见证AI未来。

Part 1:AI 数据采集和模型调用

在这一章节,围绕着企业AI模型训练和推理过程中的数据采集、模型调度和弹性资源池建设等问题,就阿里云解决方案以及最佳实践展开分享。


在这一章节,阿里云 通义实验室 高级产品解决方案架构师郑海超(海焘) 介绍了阿里云通义模型的建设和实践经验。随着多年的发展,通义已经成为全球最大的开源模型家族,并在多个行业场景支持业务创新,加速创维电视/雷鸟AI眼镜等消费电子产品创新,以及陶白白/猎聘AI面试官等社交娱乐体验;而通义系列模型的强大能力,离不开阿里云AI Infra层的支撑,包括 PAI、弹性算力、全球一张算力网络等,支撑通义从数据采集到数据加工,模型训练和调优以及提供推理服务的全场景需求。

阿里云 云网络 产品解决方案架构师 姜辉(靖韦)就AI场景数据采集网络方案和实践进行了分享,包括AI数据采集场景的常见痛点,模型训练场景常用的数据采集方式及业务特点,阿里云在数据采集场景的方案等,其中方案层面重点介绍了阿里云的海量IP数据采集方案、NAT网关数据采集方案和定向数据采集方案等,基本覆盖了客户常见的数据采集场景。

阿里云 弹性计算 产品解决方案架构师 储依帆(徽岳)分享AI Infra 关键基础算力与容器编排调度方案。阿里云具备AIInfra整体全栈能力,不仅提供了通用与加速计算高性能算力,并在IaaS基础上基于深厚的技术积累演进推出了AI训推任务的加速组件DeepGPU,实现了算力效率的大幅提升;同时,面向全链路工程化,阿里云ACK容器服务可以帮助客户更高效地串联起AI模型与AI应用,具备了数据采集与处理、算力调度与监控、角色拓扑编排、数据加速等方面的全栈能力。

Part 2:AI 算力资源池化

无论是AI模型的训推或者AI应用的搭建和服务提供,均离不开强大的算力支撑,那如何整合异构算力资源,以更高效的提升企业AI效能,阿里云PAI和云网络就此展开解决方案和最佳实践的分享。


阿里云 计算平台 高级产品解决方案架构师曹志(骁志)就PAI全球化模型推理服务的创新与实践展开分享。围绕资源的高利用率、服务的高性能、业务的高可用,AGI的推理服务有诸多挑战,BladeLLM核心引擎,提升AGI服务的性能与效率,提供全面多样的量化功能支持、高效的请求调度策略以及支持采用Prompt Cache和高效解码方法,实现两阶段加速;同时,在AI平台共享网关的基础上,EAS提供专属网关实现跨地域的服务调度,满足客户在安全隔离与访问控制方面的需求,降低客户高并发和高吞吐业务场景带来的网络风险。

阿里云云网络 高级产品解决方案架构师 任江波(硕丰)紧接着就AI场景算力池化网络方案与实践进行分享,模型的训练、 AI应用的迭代均离不开强大的算力支撑,如何整合异构算力,让算力池化,按需调度,让业务专注于自身。基于阿里云弹性公网 EIP、云企业网CEN、私网连接PrivateLink和云原生ALB等核心产品构建一张覆盖全球的异构AI算力网络,真正实现算网融合,算力资源池化,弹性调度,按需使用。支撑AI场景下高效数据采集、超大带宽训练数据运载、超低时延推理数据传输、超高安全工具调用和极致高效的算力调度能力。



在最后的客户互动讨论环节,来自阿里云网络、通义、PAI、ECS等团队的PDSA、PD和研发同学,与到场客户一起围绕企业AI(模型/应用等)建设及使用场景的典型问题展开深度探讨和交流,包括IaaS层核心力与网络需求、外部数据获取与模型优化、AI应用与智能体服务部署、基础架构重构与资源融合等相关的架构合理性、合规性、成本、质量等。

相关文章
|
4月前
|
弹性计算 安全 应用服务中间件
阿里云渠道商:怎么配置阿里云网络ACL?
阿里云网络ACL是子网级无状态防火墙,支持精准流量控制、规则热生效且免费使用。本文详解5步配置流程,助您实现Web与数据库层的安全隔离,提升云上网络安全。
|
4月前
|
人工智能 安全 架构师
2025云栖大会 | 阿里云网络技术Session主题资料和视频回放归档
2025年9月24日-26日,杭州,一年一度的云栖大会如期而至;阿里云飞天洛神云网络作为阿里云计算的连接底座,是飞天云操作系统的核心组件,致力于为上云企业提供高可靠、高性能、高弹性、智能的连接服务。本次云栖,云网络产品线也带来全系列产品升级,以及创新技术重磅解读,围绕增强确定性、提效自动化、深耕智能化和敏捷全球化带来技术、产品和服务升级,以及全新的云网络产品生态合作计划发布。
637 2
|
4月前
|
机器学习/深度学习 人工智能 监控
上海拔俗AI软件定制:让技术真正为你所用,拔俗网络这样做
在上海,企业正通过AI软件定制破解通用化难题。该模式以业务场景为核心,量身打造智能解决方案,涵盖场景化模型开发、模块化架构设计与数据闭环优化三大技术维度,推动技术与业务深度融合,助力企业实现高效、可持续的数字化转型。
149 0
|
4月前
|
弹性计算 网络安全 数据中心
阿里云创建专有网络VPC的【IPv4网段】如何选择?有什么区别?
阿里云VPC创建时需选IPv4网段,默认提供10.0.0.0/16、172.16.0.0/16、192.168.0.0/16,三者无功能差异。若仅单VPC且不连本地数据中心,可任选其一,确保不冲突即可。多VPC或混合云场景需规划避免IP重叠。不支持100.64.0.0/10等特殊网段。建议结合IPAM进行地址管理。
|
5月前
|
监控 前端开发 安全
Netty 高性能网络编程框架技术详解与实践指南
本文档全面介绍 Netty 高性能网络编程框架的核心概念、架构设计和实践应用。作为 Java 领域最优秀的 NIO 框架之一,Netty 提供了异步事件驱动的网络应用程序框架,用于快速开发可维护的高性能协议服务器和客户端。本文将深入探讨其 Reactor 模型、ChannelPipeline、编解码器、内存管理等核心机制,帮助开发者构建高性能的网络应用系统。
349 0
|
机器学习/深度学习 存储 人工智能
AI:技术创新和应用实践
近年来 AI 发展迅猛,从最初的萌芽到今天非常成功的应用,AI 有很多优秀的实践,同时也遇到了非常多的挑战,需要不断地通过技术革新来解决这些困局。阿里巴巴达摩院高级研究员金榕将通过本文介绍当前 AI 已取得的应用实践,解析 AI 的创新以及可探索的未来。
1579 0
AI:技术创新和应用实践
|
4月前
|
消息中间件 人工智能 安全
云原生进化论:加速构建 AI 应用
本文将和大家分享过去一年在支持企业构建 AI 应用过程的一些实践和思考。
1000 50
|
5月前
|
人工智能 安全 中间件
阿里云 AI 中间件重磅发布,打通 AI 应用落地“最后一公里”
9 月 26 日,2025 云栖大会 AI 中间件:AI 时代的中间件技术演进与创新实践论坛上,阿里云智能集团资深技术专家林清山发表主题演讲《未来已来:下一代 AI 中间件重磅发布,解锁 AI 应用架构新范式》,重磅发布阿里云 AI 中间件,提供面向分布式多 Agent 架构的基座,包括:AgentScope-Java(兼容 Spring AI Alibaba 生态),AI MQ(基于Apache RocketMQ 的 AI 能力升级),AI 网关 Higress,AI 注册与配置中心 Nacos,以及覆盖模型与算力的 AI 可观测体系。
1160 54
|
4月前
|
人工智能 运维 Kubernetes
Serverless 应用引擎 SAE:为传统应用托底,为 AI 创新加速
在容器技术持续演进与 AI 全面爆发的当下,企业既要稳健托管传统业务,又要高效落地 AI 创新,如何在复杂的基础设施与频繁的版本变化中保持敏捷、稳定与低成本,成了所有技术团队的共同挑战。阿里云 Serverless 应用引擎(SAE)正是为应对这一时代挑战而生的破局者,SAE 以“免运维、强稳定、极致降本”为核心,通过一站式的应用级托管能力,同时支撑传统应用与 AI 应用,让企业把更多精力投入到业务创新。
583 30
|
4月前
|
设计模式 人工智能 自然语言处理
3个月圈粉百万,这个AI应用在海外火了
不知道大家还记不记得,我之前推荐过一个叫 Agnes 的 AI 应用,也是当时在 WAIC 了解到的。
567 1