2026年7月2日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


我要投稿

Higress v2.2.3 发布:AI Gateway 能力增强,Gateway API 及其推理扩展持续打磨

发布日期:2026-06-26 16:55:50 浏览次数: 1514
作者:Higress

微信搜一搜,关注“Higress”

推荐语

探索AI Gateway新特性与Gateway API增强,了解如何优化AI推理流量调度与集群安全。

核心内容:
1. AI Gateway新增vLLM透传与上下文限制插件,强化安全与兼容性
2. Gateway API实现多网关隔离与版本兼容,提升路由稳定性
3. Ingress迁移优化与安全加固,减少对现有集群资源的改动

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家


💡 目录 💡


    01  AI Gateway:自建模型、长上下文与安全拦截


    02  Gateway API:多网关隔离与版本兼容


    03  Gateway API 推理扩展:让 AI 推理流量获得更合理的调度


    04  Ingress 迁移:尽量减少对既有集群资源的改动


    05  安全与稳定性

    

    06  Console:配置增多后的操作体验优化

    

    07  CNCF Sandbox 入驻完成

    

    08  谁应该升级?

    

    09  贡献者




Higress 近期发布了 v2.2.3 版本,主仓库共 48 项更新、Higress Console 8 项更新。核心变化包括:

  • AI Gateway:新增 vLLM 协议透传与 ai-context-limit 上下文限制插件,增强 AI 安全防护与负载均衡,并修复一批多厂商协议兼容问题。
  • Gateway API 与推理扩展:支持可配置的 GatewayClass 隔离、默认分离稳定与实验性资源,并修复推理路由在 HTTPRoute 合并时的配置丢失问题。
  • Ingress 迁移:支持跳过 IngressClass 创建、正确保留 LoadBalancer hostname,尽量不改动集群中已有的资源。
  • 安全与稳定性jwt-auth 支持 remote JWKS,并加固 OIDC、TLS 校验、限流与 WASM/MCP 运行时。
  • Console:LLM provider token 列表支持折叠,并修复多项 MCP 与路由配置问题。


此外,社区层面 Higress 已正式完成 CNCF Sandbox 入驻。下面按主题展开。


01

AI Gateway:自建模型、长上下文与安全拦截

过去几个版本里,Higress 的 AI Gateway 能力一直围绕一个方向演进:让不同模型服务尽量通过统一入口接入,同时少让业务应用自己处理协议差异。v2.2.3 继续在这条线上做了增补,并修掉了一批协议兼容上的小毛病。


新增与增强

  • AI Proxy 支持 vLLM 透传 Anthropic Messages 和新版 OpenAI endpoints(#3989)。能原样透传的请求不再做多余转换,链路更短,排查也更轻。
  • 新增 ai-context-limit WASM 插件(#4000),可以在网关层提前判断请求是否超过模型上下文限制,省去等请求打到模型服务才失败的浪费。长文档问答、RAG、多轮对话、代码分析这类场景会比较实用。
  • ai-security-guard 增加结构化拒绝响应、错误路径指标和 AI 日志(#3894),并支持 Embedding API 内容检测(#3895)。安全插件在拦截之后还能把原因说清楚,方便业务侧展示提示、做审计、接告警。
  • ai-load-balancer 新增基于一致性哈希的 cluster_hash 策略(#3898);model-router 支持保留完整原始模型名(#3916)。


问题修复

  • Vertex 场景补齐 tool call ID、保留 thoughtSignature、完善 Claude stream delta 中的 tool call type(#3973#3985#3990)。
  • Claude API 名称识别从宽泛匹配改成更准确的后缀判断(#3839),减少同一套客户端换个模型就出现异常 400 的概率。
  • 修复 ai-cache 在 SSE 流式响应首个 chunk 只有 role 时的兼容问题(#3962,修复 #3953)。


02

Gateway API:多网关隔离与版本兼容

Gateway API 正在成为 Kubernetes 入口流量管理的重要标准。它比传统 Ingress 拆得更细:GatewayClass 负责说明谁来管网关,Gateway 负责网关实例,HTTPRoute 等资源负责路由规则。拆得更清楚之后,多团队、多网关、多协议的边界也更容易表达;但标准持续演进,生产环境里也会随之冒出一些现实问题。


新增与增强

  • 支持可配置的 GatewayClass 隔离(#3981)。过去 Higress 默认监听固定的 GatewayClass,对单套网关很直接;当一个集群里同时有公网、内网、测试等多套网关时,就需要更明确地分清谁处理哪些资源。现在多套 Higress 可以在同一集群里各自管理对应的资源。
  • 默认关闭 alpha Gateway API watch(#3971),把稳定资源和实验性资源分开:常规能力默认启用,实验性能力按需开启,减少版本差异对控制器启动和同步的影响。


问题修复

  • 修复 Gateway 状态地址写入(#3980)。对依赖 Gateway 状态做自动化发布、DNS 更新或平台展示的团队来说,状态写准确很重要。


03

Gateway API 推理扩展:让 AI 推理流量获得更合理的调度

普通 Web 服务做负载均衡,常见依据是权重、连接数、健康状态。AI 推理流量会更复杂一些:不同请求可能命中不同模型,不同副本的 GPU 负载不同,队列长度不同,缓存命中情况也不同。Gateway API Inference Extension 想解决的就是这类问题:让网关在转发 AI 推理请求时,可以结合推理后端的状态做更合适的调度。


本次版本修复了 InferencePool 路由配置在 HTTPRoute 合并时可能丢失的问题(#3964)。当多个推理路由挂在同一个网关和域名下时,Higress 需要正确保留每条路由对应的推理调度配置,不能在合并过程中退回普通负载均衡。


这项能力还在跟随 Gateway API Inference Extension 持续演进,但它代表了 AI Gateway 的一个重要方向:网关不再只是入口,也会逐步参与推理流量调度。


04

Ingress 迁移:尽量减少对既有集群资源的改动

Gateway API 是未来方向,但 Ingress 仍然是大量线上系统的现实入口。尤其是 Ingress NGINX,很多团队已经用了很多年,配置、发布系统、告警、DNS 自动化都围着它跑。所以从 Ingress NGINX 迁移到 Higress 时,用户最关心的往往不是新网关能不能写一套全新配置,而是已有配置能不能少改一点、现有平台边界能不能不被打乱。继 v2.2.2 的 nginx-rewrite-compatible 插件之后,v2.2.3 继续在迁移和安装细节上做补强。


新增与增强

  • Helm 支持跳过 IngressClass 创建(#3979)。很多集群里的 IngressClass 是预先创建和统一管理的,安装网关时不应擅自覆盖或新建。现在可以让 Higress 监听指定对象,而不动平台已有资源。


问题修复

  • 正确保留 Ingress LoadBalancer hostname(#3994)。有些云厂商返回的是域名而非 IP,状态同步时若丢了 hostname,外部系统、DNS 自动化和迁移验证都会受影响。
  • imagePullPolicy 从 PodSpec 调整到容器级别(#3924),并补齐 controller 和 promtail sidecar 的镜像拉取策略(#4002);plugin-server 镜像 tag 默认跟随 Chart 版本(#3998)。


这些都算不上亮眼的功能,但迁移真正落地时,往往正是这些小地方决定了你要不要回滚。


05

安全与稳定性

网关在入口位置,安全默认值不能含糊。这一节大多是修复和加固,但每一项都直接关系到线上的可靠性。


新增与增强

  • jwt-auth 支持 remote JWKS(#3838),便于把认证公钥集中管理,后续密钥轮转也更方便。
  • Key Auth 支持同一个服务配置多个凭证(#3849),对迁移和多客户端接入更友好。


问题修复与加固

  • OIDC:升级 oauth2-proxy 修复 verifier callback 中的 nil panic(#3914),修复 Session 刷新时 Set-Cookie 被损坏的问题(#3928),并在 verifier 不可用时 fail closed(#4013)。最后一项尤其重要:认证组件异常时,受保护路由应该明确失败,而不是悄悄放行。
  • TLS:回滚了跳过 HTTPS 上游证书校验的行为(#4016),恢复更谨慎的默认校验。
  • 限流插件增强了 cluster key rate limit cookie 解析的健壮性(#4012)。
  • 运行时:MCP filter 在高内存使用时会重建(#3922),并移除了 WASM request-count rebuild 触发条件,减少不必要的重建(#3923)。


06

Console:配置增多后的操作体验优化

Higress Console v2.2.3 包含 8 项更新,主要集中在 MCP、LLM provider 配置和路由操作体验。


新增与增强

  • LLM provider token 列表支持折叠(higress-console#722)。配置多个 token 做负载均衡或容灾时,页面不用一直摊开一长串内容。


问题修复

  • MCP:服务名称包含冒号时可以正确解析(higress-console#724),删除 MCP server 时不会误删同名 route(higress-console#735),SSE transport 的 direct routing path 拼接也做了修正(higress-console#734)。
  • 其他:修复服务权重表 stale state(higress-console#733)、系统服务潜在 NPE(higress-console#729)、YAML 尾随空白提交(higress-console#730)、deploy-to-OSS workflow(higress-console#737)等问题。


Console 这些改动的目标很直接:减少配置出错,让页面更易使用。


07

CNCF Sandbox 入驻完成

比起上面这些功能细节,这个版本周期里更值得说的,是 Higress 在社区治理上的一步:经 CNCF TOC 投票通过后,Higress 已经正式完成 CNCF Sandbox 入驻(cncf/sandbox#481)。


入驻不是一句口号,而是一份需要逐项落实的清单。围绕这份清单,Higress 在这段时间里完成了几类工作:

  • 知识产权与合规:签署项目贡献协议(Contribution Agreement),将商标、Logo 等资产移交 Linux Foundation;遵循 CNCF IP 政策,采用 Apache 2.0 许可证,并接入许可证扫描以满足第三方依赖的合规要求。
  • 中立托:项目迁入独立、中立的 GitHub 组织,并加入 CNCF 的 GitHub Enterprise 账号,由基金会保障中立托管,不再绑定在单一公司名下。
  • 治理与安全制度:建立开放治理与安全策略文档,在仓库中明确引用 CNCF 行为准则,为所有仓库启用 DCO,并持续推进 OpenSSF 最佳实践徽章。
  • 社区透明度:维护者名单并入 CNCF 聚合列表,项目接入 DevStats、CLOmonitor、LFX Insights 等社区健康度看板,活跃度、贡献分布等数据公开可查。


对正在选型或已经在用 Higress 的团队来说,这些事不像功能那样直接可感,但它们回答的是另一个更要紧的问题:当你把生产流量交给一个开源网关,它背后的项目,是否在被认真、长期、透明地维护。完成 Sandbox 入驻,意味着 Higress 的治理、合规与社区运作被纳入了 CNCF 的公共框架,而不只是依赖某一家公司或某几个人。


接下来,Higress 也会朝 Incubation 阶段继续准备。目前在活跃贡献者、社区关注度和 PR 活跃度上已经有了不错的基础,后续会把更多精力放在治理流程、安全治理,以及贡献者和采用方来源的多元化上。


如果你已经在生产或重要测试环境中使用 Higress,欢迎提供采用案例;如果你愿意参与 CNCF 采用方访谈,也欢迎主动联系 Higress maintainer。


08

谁应该升级?

如果你符合下面这些场景,建议关注 v2.2.3:

  • 正在使用 Higress 作为 AI Gateway,特别是接入 vLLM、Vertex、Claude-compatible API、流式响应、AI 安全防护或上下文限制能力。
  • 正在使用 Gateway API,或者关注 Gateway API Inference Extension 在 AI 推理调度中的落地。
  • 正在评估从 Ingress NGINX 迁移到 Higress,希望尽量复用现有 IngressClass、LoadBalancer 状态和平台发布流程。
  • 对认证链路、OIDC、TLS 校验、限流 Cookie、WASM/MCP 运行稳定性比较敏感。
  • 正在使用 Higress Console 管理 LLM provider、MCP server 或路由权重。


级方式

helm repo update
helm upgrade higress higress.io/higress --version 2.2.3


如果你正在使用 Gateway API、Ingress 迁移相关配置、AI Gateway 插件或自定义 Helm 参数,建议先在测试环境渲染并对比安装结果:

helm template higress higress.io/higress --version 2.2.3 > higress-2.2.3.yaml


09

贡献者

本次发布共有 18 位贡献者参与,其中 10 位是首次贡献:

首次贡献:

@GHX5T-SOL·@FAUST-BENCHOU · @ponypony0123 · @XinhhD · @geekspeng · @philo-x · @yyyCode · @zijiren233 · @enkilee · @Rand01ph

持续贡献:

@Betula-L · @JianweiWang · @zat366 · @EndlessSeeker · @Jing-ze · @CH3CHO · @johnlanni · @JayLi52

每一个 PR 背后都是真实的使用场景和真实的问题。感谢每一位让 Higress 继续向前的贡献者。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询