AI 网关这一年,成了 AI 进化的缩影

简介: 未来,让每一个想用 AI 的企业,都能稳稳地迈出第一步。

(一)

回顾即将过去的2025年

是 Qwen、DeepSeek 等国产大模型

迈过拐点的一年


模型以外的工程技术

也正以波澜壮阔之势

加速演进和落地

1767750818206_80058a2d8aaf471291a30654964959bc.png

我们做的 AI 网关

从一个听起来有点新的概念

变成了很多客户落地 AI 时

离不开的基础设施

1767750832308_22cf5b7a109d46fab145ae6cca1973b1.png

(二)

记得年初 DeepSeek R1 发布

我们连夜拉会

帮助企业快速

从 OpenAI 切换到国产大模型上

1767750849098_a2a34cec79d04cb4b50d068f0f168a48.png

若干天后,Qwen2.5-Max 发布

我们再次快速响应

不是为了抢热点

而是让那些敢于冲的 AI 企业知道

我们在和他们并肩前行

1767751150521_25cb272b77ad4e5295635cb7377543cb.png


(三)

那会儿我们也在想

光支持模型切换还不够

大模型要真正有用

得能联网、能控权限

能防滥用、能观测效果等


于是我们以插件方式

在业内率先支持联网搜索

帮助大模型获取搜索全文

1767751167603_307e5195ebde4f39a0368ba827b450c1.png

把自己服务早期客户的实战经验

一条条梳理出来

总结出

AI 网关的八大典型场景


说实话

当时并没想到

这会成为行业里

第一份完整的 AI 网关能力图谱

1767751182605_315202bb40844c848b7c10241b4a631d.png

但对我们来说

它就是一张用户痛点地图

每一块都是真实业务里打磨出来的


(四)

我们在开源的路上

持续扩展 AI 网关的能力范畴


例如开放了

专为大模型优化的负载均衡算法

首 Token 延迟直接砍掉50%

0b1ed0a313539cbc77a1715634a69b7d.png

(五)

开源了子项目 HiMarket

基于阿里巴巴内部的

AI 开放平台 IdeaLAB

1767755741130_6edbffe606bd4fafba18d182f89c574b.png

让每一家企业都能拥有

一个专属的

模型、应用和接口的统一管理平台

既方便架构师和运维同学

也方便了

程序员、运营、设计师等

AI 工具的使用者


再加上 AgentScope、AgentRun

就是比较完整的 AI 开发工具链了

1767755751704_ee62864bd8344b2db4d0a2eef3db8422.png

(六)

MCP 爆火那一阵

很多人被存量 API 转 MCP 这事难住了

我们把低代码的转换工具开源了出来

还搭建了一个 MCP 市场

帮助开发者

快速接入 50 多个高质量 MCP

c74966fff6ea88353d3249a349574f9e.png

(七)

一个多月后

Higress 入选

MCPMarket MCP Server

全球 Top 100 排行榜

1767755785407_fb957a84aeea4cc6b040949bad0aa2cf.png


主流的 Agent 开源客户端

都开始接入 Higress


阿里的淘天业务也通过 Higress

把内部 HSF 服务

快速转成 MCP Server

1767755797591_c5f4c0b86a1347a28e9f1743080de72a.png

这是继

通义千问、百炼、PAI、高德、饿了么后

再一次被集团客户使用


(八)

这一年

我们也服务了很多外部客户


携程旅游在中国可信云大会分享

他们是如何通过

Higress 解决大模型上线的真实难题

成为众多客户落地 AI 网关的

参考样例

1767755807966_5f440265c6ee4ccfae314d607fb96739.png

蚂蚁数科 SOFA 团队

基于 Higress 发布了 SOFA Higress

看到自己的开源项目

被金融级的客户深度采用

是我们持续引领 AI 网关的强心剂

1767755819140_45231d4fbe0542a1aaf566bbd49946b5.png

还有我们的天使用户 Sealos

在 Reddit 分享

他们从 Nginx Ingress 迁移到 Higress 的经历

以及性能提升近百倍的完整历程

引发国外开发者的好评

Higress,正在被世界看见

1767755831206_636439ab14e74153876f029a9c9486e8.png

(九)

除了服务企业客户

我们始终重视开发者关系

通过多样化的方式和开发者进行互动

比如参与了

KubeCon、浙大太乙平台、中科院开源之夏

1767755840877_05b849d8b65b40e8bf187934a156e0aa.png

我们还在开放原子基金会的支持下

举办了首届 Higress AI 网关开发者挑战赛

11 支队伍进入决赛

围绕 AI Agent、RAG、智能路比拼技术和创意

c3ab73e85a6ac3d6a6e28c9f1776c70a.png

(十)

但并不是每一个开源项目发展都会非常顺利

11月,我们看到一则非常遗憾的消息

Ingress NGINX 宣布退役

1767755870700_603cfe895e4d4ec1a2d8994fbd38a354.png

K8s 社区把 Higress 等开源项目

及其云产品

列为官方推荐的替代方案

1767755880143_b628053b5af84a92b880c5a0244f733c.png

欣慰之余,我们也在反思

开源无法只靠热情来发电

必须有可持续的商业支撑

才能走得更远


(十一)

我们上线

Higress 企业版的 Serverless 实例

不到十分之一的资源成本

就能搭起一套高可用的 AI 网关

1baa26201ad5eb9354b970657ce4e747.png

有客户跟我们说

原来 AI 工程化

真的可以这么简单

例如森马

就通过 Higress 企业版

实现了多模型、多 MCP 的统一管理

cd50d74c2daeb40a8f58455167a0eaff.png

整体效率提升 30%

快速成为行业里的 AI 落地标杆


(十二)

荣誉来自于积累

在乌镇世界互联网大会获得

开源优秀社区奖

社区贡献者邢国富获得

最具价值贡献者奖

1767755921877_8bc42fc867d4417ca29e2a167e01943e.png

AI 网关基于飞天企业版

在 AI 云产业发展大会上获得

三大创新实践奖项之一


还有 InfoQ 的年度 AI 开源项目


参与起草信通院牵头制定的

AI 网关行业标准


携程、国泰财产保险、君润数智

三家客户案例,入选最佳实践

1767755931904_3e53a5f2dc204597bce93a70bb68d4b2.png


(十三)

这些来自业内的认可

都会是珍贵的记忆

回头看这一年

没有哪个月是轻松的

但每一步都踩在了实处

写代码、做开源、扛需求、跑客户

我们始终相信

开源

是我们对行业的承诺

商业

是我们对长期主义的负责

1767755952558_253f534411e34ee69820a1c0510d3a9a.png

未来

让每一个想用 AI 的企业

都能稳稳地迈出第一步

👣

👣


漫画视频制作教程:👨‍🏫 自制漫画视频|详细教程 ✍️

相关文章
|
26天前
|
存储 人工智能 搜索推荐
AI Agent 记忆系统:从短期到长期的技术架构与实践
当智能体需要处理越来越复杂的任务和更长的对话历史,核心挑战是什么,又该如何突破。
583 13
|
27天前
|
人工智能 安全 API
Nacos 安全护栏:MCP、Agent、配置全维防护,重塑 AI Registry 安全边界
Nacos安全新标杆:精细鉴权、无感灰度、全量审计!
549 64
|
2月前
|
Kubernetes Cloud Native Nacos
MCP 网关实战:基于 Higress + Nacos 的零代码工具扩展方案
本文介绍一种基于开源 Higress 与 Nacos 的私有化 MCP 智能体网关架构,实现工具动态注册、Prompt 实时更新、多租户安全隔离,并支持在无外网、无 Helm 的生产环境中一键部署。
414 25
MCP 网关实战:基于 Higress + Nacos 的零代码工具扩展方案
|
19天前
|
人工智能 弹性计算 运维
探秘 AgentRun丨为什么应该把 LangChain 等框架部署到函数计算 AgentRun
阿里云函数计算 AgentRun,专为 AI Agent 打造的一站式 Serverless 基础设施。无缝集成 LangChain、AgentScope 等主流框架,零代码改造即可享受弹性伸缩、企业级沙箱、模型高可用与全链路可观测能力,助力 Agent 高效、安全、低成本地落地生产。
298 48
|
26天前
|
Kubernetes 应用服务中间件 API
应对 Nginx Ingress 退役,是时候理清这些易混淆的概念了
本文希望提供一种更简单的方式,来理解这些容易混淆的技术概念:Nginx、Ingress、Ingress Controller、Ingress API、Nginx Ingress、Higress、Gateway API。
638 65
|
25天前
|
人工智能 Cloud Native
云原生为基,AI为翼:回望阿里云云原生的2025年
感谢支持,新的一年继续携手同行。
|
12天前
|
人工智能 自然语言处理 运维
阿里开源 Assistant Agent,助力企业快速构建答疑、诊断智能助手
一款快速构建智能客服、诊断助手、运维助手、AIOps 的开源框架。
380 10
|
12天前
|
人工智能 负载均衡 安全
探秘 AgentRun|流量一大就瘫痪?如何解决AI 模型调用之痛
阿里云函数计算AgentRun全新发布,推出“探秘AgentRun”系列,聚焦企业落地Agent的模型稳定性、安全与治理难题。通过统一模型管理、多模型接入、高可用治理策略(主备切换、负载均衡、智能路由等),实现生产级可靠调用。支持无代码快速搭建与高代码深度定制,助力Agentic AI高效进入生产环境。欢迎加入钉钉群134570017218交流体验。
|
2月前
|
存储 人工智能 运维
一行代码实现智能异常检测:UModel PaaS API 架构设计与最佳实践
阿里云 UModel PaaS API 发布:通过 Table + Object 双层抽象,屏蔽存储差异、自动处理字段映射与过滤条件,让每一个实体都成为一个‘可调用的对象’,真正实现‘以实体为中心’的智能可观测。
862 126
|
23天前
|
人工智能 测试技术 开发者
AI Coding后端开发实战:解锁AI辅助编程新范式
本文系统阐述了AI时代开发者如何高效协作AI Coding工具,强调破除认知误区、构建个人上下文管理体系,并精准判断AI输出质量。通过实战流程与案例,助力开发者实现从编码到架构思维的跃迁,成为人机协同的“超级开发者”。
1496 106