Anthropic Mythos 级模型不再零保留:30 天数据留存意味着什么

2026-06-11 32 预计阅读时间: 1 分钟
来源: oschina.net AI 摘要 Original link

Disclaimer: This article is an AI-assisted summary. Read it together with the original source when precision matters. The summary may omit context, version differences, or edge cases and is not official documentation.

预计阅读时间:9 分钟

如果你所在的组织此前依赖 Anthropic 的"零数据保留"(Zero Data Retention,ZDR)条款来确保 Claude 不存储任何交互数据,那么从 2026 年 6 月 9 日起,这条规则对最强能力级别的模型将不再适用。Anthropic 新发布的政策明确:Claude Mythos 5、Claude Fable 5 等"覆盖模型"(Covered Models)的提示词与模型输出将被强制保留 30 天,用于信任与安全分析。

这不是一个抽象的合规通知——它直接影响你调用 API 时数据流向的选择。

哪些模型被划入"覆盖模型"

Anthropic 将其模型按能力级别分层,Mythos 是当前最高级别。政策覆盖的范围包括:

  • Claude Mythos 5——旗舰级推理模型
  • Claude Fable 5——同级别的另一变体

关键点在于:即使你的组织已经签署了 ZDR 协议,对上述模型的调用数据仍然会被保留 30 天。ZDR 对这些模型"不再豁免"。

其他级别(如更低能力的模型)目前不受此政策影响,ZDR 仍然有效。

30 天保留具体保留什么

被留存的数据范围:

  • 提示词(Prompt)——你发送给模型的完整输入文本
  • 模型输出(Model Output)——Claude 返回的完整响应

这些数据用于 Anthropic 内部的信任与安全分析,主要检测滥用模式、违规内容生成等。Anthropic 强调这不是用于模型训练,但 30 天窗口期内数据确实存在于其基础设施中。

对你而言,这意味着:任何通过 Mythos 5 / Fable 5 处理的敏感信息——客户数据、内部代码、商业决策内容——都会在 Anthropic 的日志中停留 30 天。

实践:如何在 API 层面识别和处理受影响模型

如果你的系统自动选择模型或允许用户指定模型,现在需要加入一层判断:当调用覆盖模型时,敏感数据不应进入请求,或者你需要接受 30 天留存的现实。

下面是一个 Python 示例,展示如何在调用 Anthropic API 时自动检测覆盖模型并做出路由决策:

import os
from anthropic import Anthropic

# 覆盖模型列表——随 Anthropic 政策更新而维护
COVERED_MODELS = {
    "claude-mythos-5",
    "claude-fable-5",
}

client = Anthropic(api_key=os.environ["ANTHROPIC_API_KEY"])

def call_claude(prompt: str, preferred_model: str, allow_data_retention: bool = True):
    """
    根据模型是否为覆盖模型,决定路由策略。
    - allow_data_retention=True: 允许使用覆盖模型(接受30天留存)
    - allow_data_retention=False: 拒绝使用覆盖模型,自动降级
    """
    model_to_use = preferred_model

    if preferred_model in COVERED_MODELS and not allow_data_retention:
        # 降级到非覆盖模型,ZDR仍然有效
        model_to_use = "claude-sonnet-4"
        print(f"[路由] {preferred_model} 为覆盖模型,已降级到 {model_to_use}")

    response = client.messages.create(
        model=model_to_use,
        max_tokens=1024,
        messages=[{"role": "user", "content": prompt}],
    )

    # 在日志中标记数据留存状态
    retention_note = (
        "30天留存" if model_to_use in COVERED_MODELS else "ZDR生效"
    )
    print(f"[留存状态] 模型={model_to_use}, 数据={retention_note}")

    return response.content[0].text

# 示例1:接受留存,直接使用最强模型
result = call_claude(
    prompt="分析这份季度财报的关键风险指标",
    preferred_model="claude-mythos-5",
    allow_data_retention=True,
)

# 示例2:拒绝留存,自动降级
result = call_claude(
    prompt="处理包含客户隐私数据的合规审查",
    preferred_model="claude-mythos-5",
    allow_data_retention=False,  # 系统会自动降级到 sonnet-4
)

运行前需要设置环境变量:

export ANTHROPIC_API_KEY="sk-ant-..."
pip install anthropic

这段代码的核心思路是:把模型选择从"谁最强用谁"变成"数据敏感度决定模型级别"COVERED_MODELS 集合需要你随 Anthropic 的政策公告持续更新。

合规视角的三个决策点

面对这项政策,组织需要明确三个问题:

1. 哪些业务场景必须用 Mythos 级模型?

Mythos 5 的推理能力确实更强,但很多日常任务——摘要、格式转换、常规问答——Sonnet 级别已经足够。只在真正需要高推理深度时才调用覆盖模型,可以大幅缩小 30 天留存的暴露面。

2. 哪些数据绝对不能进入 30 天留存窗口?

医疗记录、金融客户数据、受 GDPR / 数据本地化法规约束的信息——如果这些出现在提示词中,就不应走覆盖模型。要么降级模型,要么在发送前做数据脱敏。

3. 是否需要更新内部数据处理协议?

如果你的 DPA(数据处理协议)或隐私政策中写明了"AI 服务商零数据保留",现在对 Anthropic 的覆盖模型这部分需要修订。30 天留存是一个新的数据驻留事实,必须反映在文档中。

降级不是唯一的选项

降级到 Sonnet 意味着放弃 Mythos 的推理优势,这在某些场景下不可接受。另一个思路是在提示词层面做隔离

def sanitize_prompt(raw_prompt: str, sensitive_terms: list[str]) -> str:
    """将敏感词替换为占位符,模型只看到脱敏版本"""
    sanitized = raw_prompt
    for i, term in enumerate(sensitive_terms):
        sanitized = sanitized.replace(term, f"[REDACTED_{i}]")
    return sanitized

# 使用方式:先脱敏,再调用覆盖模型
safe_prompt = sanitize_prompt(
    raw_prompt="客户张三的贷款余额为 120 万元,违约概率评估为",
    sensitive_terms=["张三", "120 万元"],
)
result = call_claude(safe_prompt, "claude-mythos-5", allow_data_retention=True)

脱敏后即使数据被保留 30 天,也不包含可识别的敏感信息。代价是模型推理的上下文完整性有所损失——你需要权衡脱敏粒度与推理质量。

检查清单

在 2026 年 6 月 9 日政策生效前,建议完成以下事项:

  • ✅ 确认当前系统中是否有自动路由到 Mythos / Fable 模型的逻辑
  • ✅ 梳理所有经过 Claude 处理的数据流,标记敏感数据类别
  • ✅ 更新 COVERED_MODELS 配置,确保路由逻辑能识别新政策覆盖的模型
  • ✅ 修订内部 DPA 和隐私声明,反映 30 天留存的现实
  • ✅ 评估脱敏方案对推理质量的影响,决定哪些场景走降级、哪些走脱敏
  • ✅ 建立 Anthropic 政策变更的持续跟踪机制——覆盖模型列表可能扩展

30 天留存不是灾难性的变化,但它确实打破了"零保留"这个此前很多组织依赖的安全假设。现在该做的,是把模型选择从单纯的能力排序,变成数据敏感度与推理需求的双重权衡。


相关推荐