Anthropic Mythos 级模型不再零保留：30 天数据留存意味着什么

预计阅读时间：9 分钟

如果你所在的组织此前依赖 Anthropic 的"零数据保留"（Zero Data Retention，ZDR）条款来确保 Claude 不存储任何交互数据，那么从 2026 年 6 月 9 日起，这条规则对最强能力级别的模型将不再适用。Anthropic 新发布的政策明确：Claude Mythos 5、Claude Fable 5 等"覆盖模型"（Covered Models）的提示词与模型输出将被强制保留 30 天，用于信任与安全分析。

这不是一个抽象的合规通知——它直接影响你调用 API 时数据流向的选择。

哪些模型被划入"覆盖模型"

Anthropic 将其模型按能力级别分层，Mythos 是当前最高级别。政策覆盖的范围包括：

Claude Mythos 5——旗舰级推理模型
Claude Fable 5——同级别的另一变体

关键点在于：即使你的组织已经签署了 ZDR 协议，对上述模型的调用数据仍然会被保留 30 天。ZDR 对这些模型"不再豁免"。

其他级别（如更低能力的模型）目前不受此政策影响，ZDR 仍然有效。

30 天保留具体保留什么

被留存的数据范围：

提示词（Prompt）——你发送给模型的完整输入文本
模型输出（Model Output）——Claude 返回的完整响应

这些数据用于 Anthropic 内部的信任与安全分析，主要检测滥用模式、违规内容生成等。Anthropic 强调这不是用于模型训练，但 30 天窗口期内数据确实存在于其基础设施中。

对你而言，这意味着：任何通过 Mythos 5 / Fable 5 处理的敏感信息——客户数据、内部代码、商业决策内容——都会在 Anthropic 的日志中停留 30 天。

实践：如何在 API 层面识别和处理受影响模型

如果你的系统自动选择模型或允许用户指定模型，现在需要加入一层判断：当调用覆盖模型时，敏感数据不应进入请求，或者你需要接受 30 天留存的现实。

下面是一个 Python 示例，展示如何在调用 Anthropic API 时自动检测覆盖模型并做出路由决策：

import os
from anthropic import Anthropic

# 覆盖模型列表——随 Anthropic 政策更新而维护
COVERED_MODELS = {
    "claude-mythos-5",
    "claude-fable-5",
}

client = Anthropic(api_key=os.environ["ANTHROPIC_API_KEY"])

def call_claude(prompt: str, preferred_model: str, allow_data_retention: bool = True):
    """
    根据模型是否为覆盖模型，决定路由策略。
    - allow_data_retention=True: 允许使用覆盖模型（接受30天留存）
    - allow_data_retention=False: 拒绝使用覆盖模型，自动降级
    """
    model_to_use = preferred_model

    if preferred_model in COVERED_MODELS and not allow_data_retention:
        # 降级到非覆盖模型，ZDR仍然有效
        model_to_use = "claude-sonnet-4"
        print(f"[路由] {preferred_model} 为覆盖模型，已降级到 {model_to_use}")

    response = client.messages.create(
        model=model_to_use,
        max_tokens=1024,
        messages=[{"role": "user", "content": prompt}],
    )

    # 在日志中标记数据留存状态
    retention_note = (
        "30天留存" if model_to_use in COVERED_MODELS else "ZDR生效"
    )
    print(f"[留存状态] 模型={model_to_use}, 数据={retention_note}")

    return response.content[0].text

# 示例1：接受留存，直接使用最强模型
result = call_claude(
    prompt="分析这份季度财报的关键风险指标",
    preferred_model="claude-mythos-5",
    allow_data_retention=True,
)

# 示例2：拒绝留存，自动降级
result = call_claude(
    prompt="处理包含客户隐私数据的合规审查",
    preferred_model="claude-mythos-5",
    allow_data_retention=False,  # 系统会自动降级到 sonnet-4
)

运行前需要设置环境变量：

export ANTHROPIC_API_KEY="sk-ant-..."
pip install anthropic

这段代码的核心思路是：把模型选择从"谁最强用谁"变成"数据敏感度决定模型级别"。COVERED_MODELS 集合需要你随 Anthropic 的政策公告持续更新。

合规视角的三个决策点

面对这项政策，组织需要明确三个问题：

1. 哪些业务场景必须用 Mythos 级模型？

Mythos 5 的推理能力确实更强，但很多日常任务——摘要、格式转换、常规问答——Sonnet 级别已经足够。只在真正需要高推理深度时才调用覆盖模型，可以大幅缩小 30 天留存的暴露面。

2. 哪些数据绝对不能进入 30 天留存窗口？

医疗记录、金融客户数据、受 GDPR / 数据本地化法规约束的信息——如果这些出现在提示词中，就不应走覆盖模型。要么降级模型，要么在发送前做数据脱敏。

3. 是否需要更新内部数据处理协议？

如果你的 DPA（数据处理协议）或隐私政策中写明了"AI 服务商零数据保留"，现在对 Anthropic 的覆盖模型这部分需要修订。30 天留存是一个新的数据驻留事实，必须反映在文档中。

降级不是唯一的选项

降级到 Sonnet 意味着放弃 Mythos 的推理优势，这在某些场景下不可接受。另一个思路是在提示词层面做隔离：

def sanitize_prompt(raw_prompt: str, sensitive_terms: list[str]) -> str:
    """将敏感词替换为占位符，模型只看到脱敏版本"""
    sanitized = raw_prompt
    for i, term in enumerate(sensitive_terms):
        sanitized = sanitized.replace(term, f"[REDACTED_{i}]")
    return sanitized

# 使用方式：先脱敏，再调用覆盖模型
safe_prompt = sanitize_prompt(
    raw_prompt="客户张三的贷款余额为 120 万元，违约概率评估为",
    sensitive_terms=["张三", "120 万元"],
)
result = call_claude(safe_prompt, "claude-mythos-5", allow_data_retention=True)

脱敏后即使数据被保留 30 天，也不包含可识别的敏感信息。代价是模型推理的上下文完整性有所损失——你需要权衡脱敏粒度与推理质量。

检查清单

在 2026 年 6 月 9 日政策生效前，建议完成以下事项：

✅ 确认当前系统中是否有自动路由到 Mythos / Fable 模型的逻辑
✅ 梳理所有经过 Claude 处理的数据流，标记敏感数据类别
✅ 更新 COVERED_MODELS 配置，确保路由逻辑能识别新政策覆盖的模型
✅ 修订内部 DPA 和隐私声明，反映 30 天留存的现实
✅ 评估脱敏方案对推理质量的影响，决定哪些场景走降级、哪些走脱敏
✅ 建立 Anthropic 政策变更的持续跟踪机制——覆盖模型列表可能扩展

30 天留存不是灾难性的变化，但它确实打破了"零保留"这个此前很多组织依赖的安全假设。现在该做的，是把模型选择从单纯的能力排序，变成数据敏感度与推理需求的双重权衡。