网络 2026-06-12

Azure API Management推出统一模型API网关及MCP内容安全能力

Azure API Management在Build 2026宣布上线统一模型API抽象层,并集成MCP(Model Content Policy)内容安全策略引擎,支持LLM输出合规性实时拦截。
5
⏱ 时效
4
💥 影响
1
🔥 话题
3
🌐 普适

微软在 Build 2026 开发者大会上宣布,将全面增强 [Azure API Management 的 AI 网关能力](https://techcommunity.microsoft.com/blog/integrationsonAzureblog/new-ai-gateway-capabilities-in-Azure-API-management/4524604)。本次主要新增能力如下:一是推出统一模型 API(Unified Model API),客户端仅需使用一种 API 格式,Azure API Management 即可自动将请求适配为各类后端服务商对应的格式;二是 AI 网关现已支持接入 Anthropic 和 Google Vertex AI 旗下模型;三是内容安全策略升级,防护范围拓展至 MCP 工具调用以及智能体间(A2A)通信,与原有大语言模型流量一并纳入保护。 [APIM 团队撰文](https://techcommunity.microsoft.com/blog/integrationsonAzureblog/whats-new-in-Azure-API-management-at-microsoft-build-2026/4524683)指出: 相较于为智能体单独搭建专属治理平台,Azure API Management 可帮助企业将成熟的 API 治理规则直接沿用至新兴的智能体生态体系中。 [统一模型 API](https://learn.microsoft.com/en-us/Azure/API-management/genai-gateway-capabilities) 现已进入公开预览阶段,解决了企业团队日益突出的运营痛点——随着团队越来越多地混合使用 OpenAI、Anthropic、Google 等提供商的模型(基于性能、成本、延迟或区域需求方面的考虑),每个提供商暴露的 API 格式各不相同。统一模型 API 让客户端可以统一采用一种格式(目前为 OpenAI Chat Completions),APIM 会透明地将请求转换为后端提供商的原生格式,无论是 Anthropic Messages API 还是其他模式。团队可以更换后端提供商、添加新模型或在不同提供商之间路由流量,都无需修改客户端代码。 这不仅仅是一个简单的功能适配层。将模型访问统一接入单一 API 接口后,无论由哪家服务商执行推理,所有治理策略、限流规则、内容安全检测与令牌用量统计都可统一生效。已经使用 APIM 进行传统 API 治理的组织可以将相同的模式延伸至 AI 工作负载,无需额外引入独立的治理体系。 内容安全能力向 MCP 与 A2A 场景延伸是本次架构层的 llm-content-safety 策略原本用于对照 Azure Content Safety 扫描 LLM 请求和响应内容,现在已同步覆盖 MCP 工具调用参数、MCP 响应文本以及 A2A 智能体交互载荷。同时,该策略包含两层独立安全防护:分类内容过滤,针对仇恨、自残、色情、暴力四类内容进行管控,支持设置风险等级阈值,范围为 0(最严格)至 7(最宽松);独立的 shield-prompt 属性,用于识别对抗性提示词注入攻击。典型配置示例如下: 团队需要注意的一个实现细节,即该策略在流式响应中的行为有所不同。在非流式模式下,一旦检测到违规内容,系统会直接返回 403 状态码。在流式模式下,策略会[在滑动窗口中缓冲事件](https://learn.microsoft.com/en-gb/Azure/API-management/llm-content-safety-policy),并直接停止向客户端转发后续事件,且不会返回错误信息。因此,使用流式补全能力的智能体需适配这种内容中断的情况,不能依赖错误码做判断。两个新增的属性 window-size 和 window-overlap-size 可用于调整超长内容的拆分规则,适配 Azure 内容安全服务 10000 字符的评估上限。 词元统计指标已进行了升级,适配多提供商的使用场景。APIM 现在会将推理词元、缓存词元和音频词元记录到 Application Insights,支持 OpenAI Chat Completions、OpenAI Responses 和 Anthropic Messages API 等格式,可监控 Microsoft Foundry、OpenAI、Amazon Bedrock、Google Vertex AI 等多加服务商。对于需要构建成本仪表盘和预算警报的 FinOps 团队来说,扩展后的指标能够反映当前模型的实际行为——推理和缓存消耗了大量早期指标未能捕捉的词元预算。 在资源发现方面,Azure API Center 数据平面 MCP 服务器已[正式发布(GA)](https://techcommunity.microsoft.com/blog/integrationsonAzureblog/whats-new-in-Azure-API-management-at-microsoft-build-2026/4524683)。它可作为企业统一的资源发现端点:智能体和开发者工具可以通过单个 MCP 连接访问已注册的 MCP 服务器、工具、API、智能体及各类 AI 资产。当团队在 API Center 注册新的 MCP 服务器时,所有已连接的智能体都能自动发现它,无需逐个客户端重新配置。 APIM 现在还支持[将已有的 REST API 暴露为 MCP 服务器](https://learn.microsoft.com/en-us/Azure/API-management/genai-gateway-capabilities),这意味着早于智能体时代的企业 API 无需重构即可被智能体调用。结合本次在 Build 大会上正式发布的 [Logic Apps MCP 服务器](https://www.infoq.com/news/2026/06/Azure-logic-apps-automation/),微软正在构建两条并行路径,帮助企业对接智能体:一条通过 API 网关层(APIM),另一条通过集成平台层(Logic Apps)。 对于正在评估 AI 网关方案的团队来说,行业竞争态势具有重要参考意义。亚马逊云科技的 Bedrock Guardrails 用于内容过滤和模型访问控制,但暂无产品可对标 APIM 的多厂商统一模型 API,以及针对 MCP、A2A 的全维度内容安全能力。谷歌的 APIgee 已添加一些 AI 网关功能,但尚未达到 APIM 现在覆盖的协议广度。Cloudflare 的 AI Gateway 侧重成本管控与缓存能力,而非多协议治理。APIM 的核心思路是:API 网关(而非全新品类产品)才是承载 AI 工作负载的天然控制平面。 AI 网关能力在所有 APIM 层级中均可用。统一模型 API 处于公开预览阶段。针对 MCP、A2A 的内容安全功能、升级后的词元指标以及 API Center MCP 服务器已正式发布(GA)。[AI Gateway 实验室](https://aka.ms/ai-gateway/labs)提供 30 多个实操 Jupyter Notebook,包含分步说明和可部署的 Bicep 模板。 查看英文原文:[https://www.infoq.com/news/2026/06/Azure-APIm-ai-gateway-build/](https://www.infoq.com/news/2026/06/Azure-APIm-ai-gateway-build/)