Higress v2.2.3完整更新解读:AI网关与Gateway API能力全面升级

在线体验各类最新模型,更有模型 免费Token 额度领取!
立即体验
简介: Higress推出v2.2.3正式版本,主仓库完成48项功能迭代与缺陷修复,配套Higress Console管理控制台同步更新8项交互优化。本次更新核心围绕AI网关流量治理、K8s标准Gateway API、AI推理流量调度、传统Ingress平滑迁移、网关安全与运行稳定性、控制台操作体验六大板块迭代,同时项目完成CNCF Sandbox入驻,开源治理、合规体系实现标准化。下文分模块完整拆解本次版本全部更新内容,并标注适配升级的业务场景。

Higress推出v2.2.3正式版本,主仓库完成48项功能迭代与缺陷修复,配套Higress Console管理控制台同步更新8项交互优化。本次更新核心围绕AI网关流量治理、K8s标准Gateway API、AI推理流量调度、传统Ingress平滑迁移、网关安全与运行稳定性、控制台操作体验六大板块迭代,同时项目完成CNCF Sandbox入驻,开源治理、合规体系实现标准化。下文分模块完整拆解本次版本全部更新内容,并标注适配升级的业务场景。

一、AI Gateway核心能力新增与缺陷修复

AI网关是Higress差异化核心能力,本次持续优化多厂商大模型协议兼容、流量前置拦截、推理负载调度,统一各类LLM、向量服务入口,减少业务侧协议适配开发成本。
阿里云部署AI Agent:OpenClaw/Hermes Agent全网最简单,只需两步,详情👉访问阿里云OpenClaw/Hermes一键部署专题页面了解。
OpenClaw1.png
OpenClaw2.png
OpenClaw02.png
openClaw3.png
OpenClaw031.png
OpenClaw03.png
OpenClaw04.png
OpenClaw5.png
Openclaw6.png
Token Plan Token最便宜/支持多模型切换:👉访问订阅阿里云百炼Token Plan AI大模型服务 。支持多模型切换,用于多模态模型灵活调用,实现多模型、多工具、多场景下的额度共享与统一管理,兼顾灵活性、稳定性与安全性,大幅降低企业使用大模型的门槛与成本。
tokenplan1.png
tokenplan1.png

新增增强能力

  1. vLLM协议原生透传支持,完整兼容Anthic Messages规范与新版OpenAI接口,网关无需转换请求体,缩短转发链路,降低线上故障排查难度。
  2. 上线ai-context-limit WASM前置插件,在网关入口校验Token总量,长文档问答、RAG检索、多轮对话、代码分析场景可提前拦截超限请求,避免浪费后端推理算力。
  3. ai-security-guard安全防护插件升级,新增结构化拦截返回报文、异常访问指标、完整AI操作日志,同时扩展Embedding向量接口内容检测能力,拦截时清晰输出违规原因,便于对接告警、审计系统。
  4. ai-load-balancer负载均衡新增一致性哈希cluster_hash调度策略;model-router路由组件支持完整保留原始模型名称,提升推理缓存命中率。

    协议兼容问题修复

    补齐Vertex、Claude系列工具调用字段传递逻辑,修复流式输出中tool type解析异常;将Claude接口识别从模糊匹配改为后缀精准匹配,大幅减少客户端切换模型时400参数报错;修复SSE流式首包仅返回角色字段的兼容故障。

二、Gateway API标准与推理扩展打磨

Gateway API作为下一代K8s入口流量标准,相比Ingress拆分网关管理、实例、路由资源,更适配多网关隔离架构,本次完善资源隔离与推理专属调度能力。

新增优化

  1. GatewayClass可配置隔离机制,单集群可同时部署公网、内网、测试多套Higress网关,各网关仅监听对应路由资源,边界清晰互不干扰。
  2. 默认关闭Alpha实验性API监听,仅启用稳定版本资源,降低控制器同步异常风险,实验能力按需手动开启。

    缺陷修复

    修正Gateway状态地址写入逻辑,自动化发布、DNS同步、平台展示系统可正常读取网关IP与域名;修复推理路由合并时调度配置丢失问题,多条推理路由挂载同一域名不会降级为普通HTTP负载均衡,可持续使用AI专属调度策略。

三、Gateway API Inference Extension推理调度优化

普通Web负载均衡仅依据连接数、权重调度,AI推理需结合GPU负载、队列长度、缓存状态做差异化转发。本次修复路由合并丢失调度规则问题,保障多模型推理场景下,网关持续感知后端推理实例负载,实现更合理的流量分发,该扩展仍在持续迭代演进,是AI云原生网关重要发展方向。

四、Ingress NGINX平滑迁移增强

大量存量集群仍基于Ingress NGINX运行,本次版本持续降低迁移改造成本,最小化改动原有集群资源。

新增配置兼容

Helm部署脚本支持跳过自动创建IngressClass,适配企业统一管控IngressClass的集群环境,安装网关不覆盖已有平台资源。

细节缺陷修复

同步保留LoadBalancer返回域名,避免DNS、自动化发布链路中断;调整镜像拉取策略至容器级别,补齐控制器、监控Sidecar镜像配置,插件镜像Tag跟随Chart版本同步,减少版本不一致故障。

五、网关安全与运行时加固

网关作为流量唯一入口,安全校验、插件运行容错全面升级,所有修复项直接关系线上业务稳定性。

  1. jwt-auth新增远程JWKS公钥托管,密钥轮转无需修改网关配置;单服务支持多组访问凭证,适配分阶段业务迁移。
  2. OIDC组件升级,修复回调空指针、Cookie损坏故障,认证服务不可用时执行关闭策略,拒绝放行受保护路由,杜绝安全漏洞。
  3. 收紧TLS校验规则,取消默认跳过上游证书校验的宽松策略,抵御中间人攻击。
  4. 限流Cookie解析健壮性提升;MCP插件高内存时自动重建,移除无意义WASM重建触发条件,减少网关频繁重启抖动。

六、Higress Console控制台体验优化

配套控制台共8项更新,聚焦LLM密钥、MCP服务、路由配置高频操作,降低配置失误概率。

  1. LLM服务商Token列表支持折叠,多套负载均衡密钥页面更简洁。
  2. MCP服务修复多项解析问题:服务名称含冒号正常识别、删除MCP不会误删同名路由、SSE传输路径拼接修正。
  3. 修复权重缓存过期、空指针、YAML尾部空格提交、OSS部署流水线等隐性Bug。

七、社区重大进展:Higress完成CNCF Sandbox入驻

版本周期内项目通过CNCF技术委员会投票,正式入驻Sandbox项目,代表项目开源治理、知识产权、长期维护能力获得行业标准化认可,落地多项合规与治理规范:

  1. 知识产权合规:签署统一贡献协议,商标、Logo移交Linux基金会,采用Apache2.0开源协议,配套第三方依赖合规扫描。
  2. 中立托管:项目迁入CNF独立开源组织,脱离单一厂商绑定,由基金会长期中立维护。
  3. 标准化治理文档:完善安全策略、社区行为准则,启用DCO贡献校验,落地OpenSSF安全最佳实践。
  4. 社区透明化:活跃度、贡献数据接入公开监控看板,维护者名单纳入CNCF统一聚合列表。
    项目后续将持续向CNCF孵化阶段推进,扩充全球开发者与企业采用生态。

八、适配升级业务场景与部署方式

推荐升级场景

  1. 使用Higress承载vLLM、Claude、Vertex等大模型推理流量,需要AI安全、上下文拦截、专属负载均衡;
  2. 企业集群落地Gateway API,使用推理扩展调度AI流量;
  3. 存量Ingress NGINX集群计划平滑迁移,希望复用原有配置;
  4. 业务对OIDC、TLS、MCP/WASM运行安全容错要求高;
  5. 依靠控制台批量管理LLM密钥、MCP智能体与复杂路由。

    标准升级操作

    通过Helm工具执行更新,升级前建议在测试环境渲染配置文件,对比新旧资源差异后灰度发布,规避配置变更引发流量中断。

九、版本贡献说明

本次v2.2.3版本共有18位开发者提交代码,其中10位为首次参与项目贡献,各类修复与新功能均来源于真实线上业务场景反馈,持续完善云原生AI网关全链路能力。

整体总结

Higress v2.2.3围绕AI原生网关完成全方位迭代,补齐多厂商大模型协议、前置安全拦截、推理专属调度能力;同时完善Gateway API云原生标准实现,大幅简化传统Ingress集群迁移成本,同步加固认证、传输、插件运行时安全体系。社区层面完成CNCF Sandbox入驻,项目长期中立维护、合规运营得到官方背书。对于部署私有化推理集群、百炼等大模型API、MCP智能体的云原生团队,本次版本可显著降低流量治理、安全审计、运维管理成本,是线上生产环境推荐迭代版本。

目录
相关文章
|
7天前
|
人工智能 JSON 自然语言处理
让教学更智慧:用阿里云百炼工作流,自动生成中小学教材内容#小有可为#有温度的AI
通过可视化工作流编排,将大模型推理能力转化为标准化的教学内容生成引擎。教师只需输入教材标题和适用学段,即可自动获得结构完整、符合课程标准的章节内容,大幅降低备课门槛,助力教育资源均衡化。
474 123
|
8天前
|
人工智能 定位技术 SEO
我学 GEO 第 15 天:终于知道AI GEO该如何做?
我是暴走的莉莉酱,边旅行边研究AI GEO的数字游民。专注普通人如何提升“AI可见度”——让AI在回答用户问题时准确识别、理解并推荐你。不讲玄学,只做可测、可调、可持续的GEO实践。
451 127
|
16天前
|
Linux 程序员 数据格式
【2026最新】Notepad++下载、安装和使用一篇搞定(附中文版安装包)
Notepad++ 是一款免费开源、轻量高效的 Windows 文本编辑器,支持 C/Python/HTML 等 80+ 语言语法高亮、代码折叠、正则替换、编码转换及插件扩展,专为程序员与文本处理用户打造,完美替代系统记事本。(239字)
|
11天前
|
机器学习/深度学习 人工智能 调度
🐴 HappyHorse 1.1 现已上线阿里云百炼!快来查收模型使用指南,现在调用享 6 折~
HappyHorse 1.1 是新一代视频生成大模型,全面升级动态表现力、角色一致性、指令遵循、视觉质感与音画协同能力。支持I2V/T2V/R2V三类生成,适配短剧、电商广告、品牌营销等场景,提供高质、流畅、可控的AI视频生产力。
781 5
🐴 HappyHorse 1.1 现已上线阿里云百炼!快来查收模型使用指南,现在调用享 6 折~
|
3天前
|
人工智能 安全 Cloud Native
Higress 新发布:AI Gateway 能力增强,Gateway API 及其推理扩展持续打磨
增强 AI 网关能力,持续打磨 Gateway API 及其推理扩展。
299 122
|
3天前
|
消息中间件 存储 Kafka
Kafka 原生消息入湖能力上线!一键打通实时流与数据湖
阿里云消息队列 Kafka 版正式上线原生消息入湖能力。
249 121
|
8天前
|
缓存 人工智能 运维
阿里云618百炼大模型Qwen3.7-Max功能、免费试用、订阅计费、配置接入详解
Qwen3.7-MAX是阿里云百炼平台推出的通义千问3.7系列旗舰大语言模型,专为智能体时代复杂任务打造,依托阿里云全域算力与自研技术,在逻辑推理、长文本处理、代码工程、长周期自主执行等领域达到行业顶尖水平。2026年618期间,该模型推出多重免费试用权益、按量计费5折、订阅套餐优惠等专属福利,覆盖个人开发者、团队与企业全场景需求,以下从核心功能、免费试用、订阅计费、配置接入四方面展开详细解析。
464 124

热门文章

最新文章