Azure API Management推出统一模型API网关及MCP内容安全能力 · AI日报

微软在 Build 2026 开发者大会上宣布，将全面增强 [Azure API Management 的 AI 网关能力](https://techcommunity.microsoft.com/blog/integrationsonAzureblog/new-ai-gateway-capabilities-in-Azure-API-management/4524604)。本次主要新增能力如下：一是推出统一模型 API（Unified Model API），客户端仅需使用一种 API 格式，Azure API Management 即可自动将请求适配为各类后端服务商对应的格式；二是 AI 网关现已支持接入 Anthropic 和 Google Vertex AI 旗下模型；三是内容安全策略升级，防护范围拓展至 MCP 工具调用以及智能体间（A2A）通信，与原有大语言模型流量一并纳入保护。 [APIM 团队撰文](https://techcommunity.microsoft.com/blog/integrationsonAzureblog/whats-new-in-Azure-API-management-at-microsoft-build-2026/4524683)指出：相较于为智能体单独搭建专属治理平台，Azure API Management 可帮助企业将成熟的 API 治理规则直接沿用至新兴的智能体生态体系中。 [统一模型 API](https://learn.microsoft.com/en-us/Azure/API-management/genai-gateway-capabilities) 现已进入公开预览阶段，解决了企业团队日益突出的运营痛点——随着团队越来越多地混合使用 OpenAI、Anthropic、Google 等提供商的模型（基于性能、成本、延迟或区域需求方面的考虑），每个提供商暴露的 API 格式各不相同。统一模型 API 让客户端可以统一采用一种格式（目前为 OpenAI Chat Completions），APIM 会透明地将请求转换为后端提供商的原生格式，无论是 Anthropic Messages API 还是其他模式。团队可以更换后端提供商、添加新模型或在不同提供商之间路由流量，都无需修改客户端代码。这不仅仅是一个简单的功能适配层。将模型访问统一接入单一 API 接口后，无论由哪家服务商执行推理，所有治理策略、限流规则、内容安全检测与令牌用量统计都可统一生效。已经使用 APIM 进行传统 API 治理的组织可以将相同的模式延伸至 AI 工作负载，无需额外引入独立的治理体系。内容安全能力向 MCP 与 A2A 场景延伸是本次架构层的 llm-content-safety 策略原本用于对照 Azure Content Safety 扫描 LLM 请求和响应内容，现在已同步覆盖 MCP 工具调用参数、MCP 响应文本以及 A2A 智能体交互载荷。同时，该策略包含两层独立安全防护：分类内容过滤，针对仇恨、自残、色情、暴力四类内容进行管控，支持设置风险等级阈值，范围为 0（最严格）至 7（最宽松）；独立的 shield-prompt 属性，用于识别对抗性提示词注入攻击。典型配置示例如下：团队需要注意的一个实现细节，即该策略在流式响应中的行为有所不同。在非流式模式下，一旦检测到违规内容，系统会直接返回 403 状态码。在流式模式下，策略会[在滑动窗口中缓冲事件](https://learn.microsoft.com/en-gb/Azure/API-management/llm-content-safety-policy)，并直接停止向客户端转发后续事件，且不会返回错误信息。因此，使用流式补全能力的智能体需适配这种内容中断的情况，不能依赖错误码做判断。两个新增的属性 window-size 和 window-overlap-size 可用于调整超长内容的拆分规则，适配 Azure 内容安全服务 10000 字符的评估上限。词元统计指标已进行了升级，适配多提供商的使用场景。APIM 现在会将推理词元、缓存词元和音频词元记录到 Application Insights，支持 OpenAI Chat Completions、OpenAI Responses 和 Anthropic Messages API 等格式，可监控 Microsoft Foundry、OpenAI、Amazon Bedrock、Google Vertex AI 等多加服务商。对于需要构建成本仪表盘和预算警报的 FinOps 团队来说，扩展后的指标能够反映当前模型的实际行为——推理和缓存消耗了大量早期指标未能捕捉的词元预算。在资源发现方面，Azure API Center 数据平面 MCP 服务器已[正式发布（GA）](https://techcommunity.microsoft.com/blog/integrationsonAzureblog/whats-new-in-Azure-API-management-at-microsoft-build-2026/4524683)。它可作为企业统一的资源发现端点：智能体和开发者工具可以通过单个 MCP 连接访问已注册的 MCP 服务器、工具、API、智能体及各类 AI 资产。当团队在 API Center 注册新的 MCP 服务器时，所有已连接的智能体都能自动发现它，无需逐个客户端重新配置。 APIM 现在还支持[将已有的 REST API 暴露为 MCP 服务器](https://learn.microsoft.com/en-us/Azure/API-management/genai-gateway-capabilities)，这意味着早于智能体时代的企业 API 无需重构即可被智能体调用。结合本次在 Build 大会上正式发布的 [Logic Apps MCP 服务器](https://www.infoq.com/news/2026/06/Azure-logic-apps-automation/)，微软正在构建两条并行路径，帮助企业对接智能体：一条通过 API 网关层（APIM），另一条通过集成平台层（Logic Apps）。对于正在评估 AI 网关方案的团队来说，行业竞争态势具有重要参考意义。亚马逊云科技的 Bedrock Guardrails 用于内容过滤和模型访问控制，但暂无产品可对标 APIM 的多厂商统一模型 API，以及针对 MCP、A2A 的全维度内容安全能力。谷歌的 APIgee 已添加一些 AI 网关功能，但尚未达到 APIM 现在覆盖的协议广度。Cloudflare 的 AI Gateway 侧重成本管控与缓存能力，而非多协议治理。APIM 的核心思路是：API 网关（而非全新品类产品）才是承载 AI 工作负载的天然控制平面。 AI 网关能力在所有 APIM 层级中均可用。统一模型 API 处于公开预览阶段。针对 MCP、A2A 的内容安全功能、升级后的词元指标以及 API Center MCP 服务器已正式发布（GA）。[AI Gateway 实验室](https://aka.ms/ai-gateway/labs)提供 30 多个实操 Jupyter Notebook，包含分步说明和可部署的 Bicep 模板。查看英文原文：[https://www.infoq.com/news/2026/06/Azure-APIm-ai-gateway-build/](https://www.infoq.com/news/2026/06/Azure-APIm-ai-gateway-build/)