Anthropic 的最新前沿模型 Claude Fable 5 正式上线 Microsoft Foundry,同时为 GitHub Copilot 和 Foundry Agent Service 提供推理能力。这意味着开发者可以在 Azure 生态内直接调用 Anthropic 最强的模型来构建自主代理,不再需要跨平台对接。
为什么这件事值得关注
过去要在 Azure 上使用 Claude,开发者往往需要自行桥接 Anthropic API 和 Azure 的部署管线。现在 Claude Fable 5 直接入驻 Foundry,几个关键变化随之而来:
- 统一入口:模型部署、监控、安全策略全部在 Azure 门户内完成,和企业现有的合规流程无缝衔接。
- 代理优先:Foundry Agent Service 原生支持 Claude Fable 5,不需要手动编排模型调用和工具链。
- GitHub Copilot 加持:Copilot 的代理场景(如代码审查、自动修复)可以直接调用 Fable 5 的推理能力,响应质量和复杂任务处理能力有望提升。
从部署到调用:Foundry 中的 Claude
使用 Claude Fable 5 的核心流程和调用其他 Azure AI 模型一致:先创建部署,再通过推理端点发请求。
创建模型部署
在 Azure AI Foundry 门户中,选择项目后点击「Deploy model」,从模型目录找到 claude-fable-5,完成部署后会拿到推理端点和 API Key。
也可以用 CLI 一键完成:
az ai model deploy \\
--resource-group my-rg \\
--project-name my-foundry-project \\
--model-name claude-fable-5 \\
--model-provider Anthropic \\
--sku-name Standard \\
--deployment-name claude-fable-5-deploy
部署完成后,记下端点 URL 和密钥,后续调用会用到。
用 Python SDK 调用推理
以下示例基于 Azure AI Inference SDK 的典型调用模式——具体参数以 Foundry 门户中的实际文档为准:
pip install azure-ai-inference
from azure.ai.inference import ChatCompletionsClient
from azure.core.credentials import AzureKeyCredential
# 替换为你的实际部署端点和密钥
endpoint = "https://my-foundry-project.services.azureml.net/models/claude-fable-5-deploy/v1/chat/completions"
key = "YOUR_API_KEY"
client = ChatCompletionsClient(
endpoint=endpoint,
credential=AzureKeyCredential(key),
)
response = client.complete(
messages=[
{"role": "system", "content": "你是代码审查助手,只指出真正的 bug,不提风格建议。"},
{"role": "user", "content": "审查这段代码:\n\ndef add(a, b):\n return a - b"},
],
model="claude-fable-5-deploy",
max_tokens=512,
)
print(response.choices[0].message.content)
运行前把 endpoint 和 key 替换成你自己的值即可。
在 Foundry Agent Service 中编排代理
Foundry Agent Service 把模型、工具、记忆组合成完整的自主代理。以下 YAML 是一个最小代理定义——字段结构参考公开文档,具体参数可能随版本变化:
agent:
name: code-review-agent
model:
provider: Anthropic
deployment: claude-fable-5-deploy
instructions: |
你是代码审查代理。收到代码片段后:
1. 识别潜在的 bug 和安全漏洞
2. 给出具体修复建议,附带修改后的代码
3. 如果代码没有问题,直接回复"通过"
tools:
- name: search-docs
type: azure-search
index: coding-best-practices
memory:
type: conversation-summary
max_turns: 10
上传到 Foundry Agent Service 后,代理自动以 Claude Fable 5 为推理引擎,配合搜索工具检索最佳实践文档,并在多轮对话中保持上下文摘要。
上线前的几个考量
| 维度 | 建议 |
|---|---|
| 成本控制 | Fable 5 是前沿模型,token 单价高于轻量模型。简单任务优先用小模型,复杂推理才调用 Fable 5。 |
| 数据合规 | 模型在 Azure 区域内推理,数据不出区域。确认租户区域和合规要求匹配。 |
| 代理边界 | 自主代理的"自主"程度需要显式设定——哪些操作可以自动执行,哪些必须人工确认,建议写进 instructions。 |
| 监控 | Foundry 提供推理日志和指标面板,上线后关注延迟、token 消耗和错误率,避免静默超支。 |
上手清单
- 在 Azure AI Foundry 创建项目,部署
claude-fable-5。 - 用上面的 Python 脚本验证端点可用。
- 在 Foundry Agent Service 中定义一个简单代理,跑通单轮对话。
- 逐步加入工具和记忆,观察多轮任务表现。
- 上线前设定成本上限和操作权限边界。
Claude Fable 5 进入 Microsoft Foundry,不只是多了一个模型选项——它让 Azure 上的代理开发从"拼凑 API"变成"平台内原生编排"。对已经在 Azure 上跑业务的团队来说,这是最直接的接入路径。