Claude Fable 5 登陆 Microsoft Foundry：自主代理的新引擎

预计阅读时间：6 分钟

Anthropic 的最新前沿模型 Claude Fable 5 正式上线 Microsoft Foundry，同时为 GitHub Copilot 和 Foundry Agent Service 提供推理能力。这意味着开发者可以在 Azure 生态内直接调用 Anthropic 最强的模型来构建自主代理，不再需要跨平台对接。

为什么这件事值得关注

过去要在 Azure 上使用 Claude，开发者往往需要自行桥接 Anthropic API 和 Azure 的部署管线。现在 Claude Fable 5 直接入驻 Foundry，几个关键变化随之而来：

统一入口：模型部署、监控、安全策略全部在 Azure 门户内完成，和企业现有的合规流程无缝衔接。
代理优先：Foundry Agent Service 原生支持 Claude Fable 5，不需要手动编排模型调用和工具链。
GitHub Copilot 加持：Copilot 的代理场景（如代码审查、自动修复）可以直接调用 Fable 5 的推理能力，响应质量和复杂任务处理能力有望提升。

从部署到调用：Foundry 中的 Claude

使用 Claude Fable 5 的核心流程和调用其他 Azure AI 模型一致：先创建部署，再通过推理端点发请求。

创建模型部署

在 Azure AI Foundry 门户中，选择项目后点击「Deploy model」，从模型目录找到 claude-fable-5，完成部署后会拿到推理端点和 API Key。

也可以用 CLI 一键完成：

az ai model deploy \\
  --resource-group my-rg \\
  --project-name my-foundry-project \\
  --model-name claude-fable-5 \\
  --model-provider Anthropic \\
  --sku-name Standard \\
  --deployment-name claude-fable-5-deploy

部署完成后，记下端点 URL 和密钥，后续调用会用到。

用 Python SDK 调用推理

以下示例基于 Azure AI Inference SDK 的典型调用模式——具体参数以 Foundry 门户中的实际文档为准：

pip install azure-ai-inference

from azure.ai.inference import ChatCompletionsClient
from azure.core.credentials import AzureKeyCredential

# 替换为你的实际部署端点和密钥
endpoint = "https://my-foundry-project.services.azureml.net/models/claude-fable-5-deploy/v1/chat/completions"
key = "YOUR_API_KEY"

client = ChatCompletionsClient(
    endpoint=endpoint,
    credential=AzureKeyCredential(key),
)

response = client.complete(
    messages=[
        {"role": "system", "content": "你是代码审查助手，只指出真正的 bug，不提风格建议。"},
        {"role": "user", "content": "审查这段代码：\n\ndef add(a, b):\n    return a - b"},
    ],
    model="claude-fable-5-deploy",
    max_tokens=512,
)

print(response.choices[0].message.content)

运行前把 endpoint 和 key 替换成你自己的值即可。

在 Foundry Agent Service 中编排代理

Foundry Agent Service 把模型、工具、记忆组合成完整的自主代理。以下 YAML 是一个最小代理定义——字段结构参考公开文档，具体参数可能随版本变化：

agent:
  name: code-review-agent
  model:
    provider: Anthropic
    deployment: claude-fable-5-deploy
  instructions: |
    你是代码审查代理。收到代码片段后：
    1. 识别潜在的 bug 和安全漏洞
    2. 给出具体修复建议，附带修改后的代码
    3. 如果代码没有问题，直接回复"通过"
  tools:
    - name: search-docs
      type: azure-search
      index: coding-best-practices
  memory:
    type: conversation-summary
    max_turns: 10

上传到 Foundry Agent Service 后，代理自动以 Claude Fable 5 为推理引擎，配合搜索工具检索最佳实践文档，并在多轮对话中保持上下文摘要。

上线前的几个考量

维度	建议
成本控制	Fable 5 是前沿模型，token 单价高于轻量模型。简单任务优先用小模型，复杂推理才调用 Fable 5。
数据合规	模型在 Azure 区域内推理，数据不出区域。确认租户区域和合规要求匹配。
代理边界	自主代理的"自主"程度需要显式设定——哪些操作可以自动执行，哪些必须人工确认，建议写进 instructions。
监控	Foundry 提供推理日志和指标面板，上线后关注延迟、token 消耗和错误率，避免静默超支。

上手清单

在 Azure AI Foundry 创建项目，部署 claude-fable-5。
用上面的 Python 脚本验证端点可用。
在 Foundry Agent Service 中定义一个简单代理，跑通单轮对话。
逐步加入工具和记忆，观察多轮任务表现。
上线前设定成本上限和操作权限边界。

Claude Fable 5 进入 Microsoft Foundry，不只是多了一个模型选项——它让 Azure 上的代理开发从"拼凑 API"变成"平台内原生编排"。对已经在 Azure 上跑业务的团队来说，这是最直接的接入路径。