上个月 OpenAI 和微软悄悄重签了合同,核心变化只有一个数字——380 亿美元。这个数字是双方收入分成的总上限,意味着微软从 OpenAI API 收入中抽取的比例,累计到 380 亿就封顶。超过之后,OpenAI 将保留全部收入。这不仅仅是一笔财务条款的调整,它直接为 OpenAI 与亚马逊、谷歌建立新合作扫清了障碍,也为 OpenAI 走向 IPO 铺路。
为什么需要设上限
微软和 OpenAI 的原始协议本质上是"独家+分成":微软是 OpenAI 云基础设施的独家供应商,同时从 OpenAI 的收入中按比例分成。这种安排在早期对双方都有利——OpenAI 拿到了算力和资金,微软拿到了 OpenAI 技术的优先接入权和持续回报。
但随着 ChatGPT 用户量爆炸、API 调用规模飙升,分成变成了一个没有尽头的抽水管道。对 OpenAI 来说,每多赚一美元,微软就按比例切走一块,这在 IPO 前是一个明显的估值障碍——投资者会问:你的收入到底有多少真正属于你自己?
380 亿上限的设定,相当于给这条管道装了一个阀门。微软的分成收益在累计达到 380 亿后停止增长,OpenAI 之后的所有收入归自己所有。这个数字本身也暗示了双方对 OpenAI 商业规模的预期——如果 OpenAI 的 API 和订阅收入最终远超这个阈值,上限条款的价值就会非常可观。
多云合作从此解绑
原合同中微软的独家云地位,是 OpenAI 无法与 AWS、Google Cloud 等平台签署类似合作的法律障碍。重签之后,OpenAI 获得了与其他云厂商合作的空间。
这背后的逻辑很直接:OpenAI 的模型推理和训练需要海量算力,单一云供应商在容量、价格和地理覆盖上都有瓶颈。与多家云厂商合作,既能分散基础设施风险,也能通过竞争压低算力成本。对亚马逊和谷歌来说,能托管 OpenAI 的模型服务,意味着在 AI 云服务市场上拿到一张重量级入场券。
实际影响已经在显现——OpenAI 近期与亚马逊 AWS 达成了合作,ChatGPT 企业版也将通过更多云渠道分发。对开发者而言,这意味着未来调用 OpenAI API 的入口可能不再只有 Azure,还可能直接从 AWS 或 GCP 的市场订阅,网络延迟和合规路径的选择会更灵活。
开发者视角:API 成本追踪的实际做法
无论收入分成条款怎么写,OpenAI API 的调用费用最终都落在开发者头上。随着多云渠道开放,定价策略可能出现差异,追踪和比较不同渠道的成本变得重要。下面是一个可以直接运行的 Python 脚本,用来估算和记录 OpenAI API 的月度支出,并按模型分类汇总:
#!/usr/bin/env python3
"""
openai_cost_tracker.py — 估算 OpenAI API 月度调用成本
依赖: pip install openai
运行前设置环境变量: export OPENAI_API_KEY="sk-..."
"""
import os
from datetime import datetime
from collections import defaultdict
from openai import OpenAI
# ---- 模型定价表 (USD per 1M tokens, 2024-07 参考价) ----
PRICING = {
"gpt-4o": {"input": 5.00, "output": 15.00},
"gpt-4o-mini": {"input": 0.15, "output": 0.60},
"gpt-4-turbo": {"input": 10.00, "output": 30.00},
"gpt-3.5-turbo": {"input": 0.50, "output": 1.50},
"o1-preview": {"input": 15.00, "output": 60.00},
"o1-mini": {"input": 3.00, "output": 12.00},
}
def estimate_cost(model: str, input_tokens: int, output_tokens: int) -> float:
"""根据模型和 token 数估算单次调用成本"""
if model not in PRICING:
print(f"[警告] 模型 {model} 未在定价表中,使用 gpt-4o-mini 作为参考")
model = "gpt-4o-mini"
p = PRICING[model]
return (input_tokens / 1_000_000) * p["input"] + (output_tokens / 1_000_000) * p["output"]
def track_api_call(client: OpenAI, model: str, prompt: str, max_tokens: int = 512) -> dict:
"""执行一次 API 调用并记录 token 使用与成本"""
resp = client.chat.completions.create(
model=model,
messages=[{"role": "user", "content": prompt}],
max_tokens=max_tokens,
)
usage = resp.usage
cost = estimate_cost(model, usage.prompt_tokens, usage.completion_tokens)
return {
"model": model,
"input_tokens": usage.prompt_tokens,
"output_tokens": usage.completion_tokens,
"cost_usd": cost,
"timestamp": datetime.now().isoformat(),
}
def main():
client = OpenAI(api_key=os.environ.get("OPENAI_API_KEY"))
# ---- 模拟一批调用,实际使用时替换为你的业务逻辑 ----
calls = [
("gpt-4o-mini", "用一句话解释什么是收入分成上限"),
("gpt-4o", "分析云厂商独家协议对 AI 公司 IPO 估值的影响,限 200 字"),
("gpt-4o-mini", "列举三个开发者选择多云 API 渠道的好处"),
]
log = defaultdict(list)
total_cost = 0.0
for model, prompt in calls:
record = track_api_call(client, model, prompt)
log[model].append(record)
total_cost += record["cost_usd"]
print(f" [{record['timestamp']}] {model} | "
f"in={record['input_tokens']} out={record['output_tokens']} | "
f"cost=${record['cost_usd']:.4f}")
print(f"\n===== 月度估算摘要 =====")
for model, records in log.items():
model_cost = sum(r["cost_usd"] for r in records)
total_tokens = sum(r["input_tokens"] + r["output_tokens"] for r in records)
print(f" {model}: {len(records)} 次调用, {total_tokens} tokens, $${model_cost:.4f}")
print(f" 总计: ${total_cost:.4f}")
if __name__ == "__main__":
main()
运行方式:
pip install openai
export OPENAI_API_KEY="sk-你的密钥"
python openai_cost_tracker.py
几点说明:
- 定价表中的数字是参考值,实际价格以 OpenAI 官方页面为准,需定期更新
PRICING字典。 - 如果未来 OpenAI 通过 AWS 或 Google Cloud 提供相同模型,定价可能因云渠道折扣而不同,届时可以扩展脚本增加
channel字段做对比。 track_api_call封装了单次调用的 token 记录,可以嵌入到任何业务流水线中持续采集数据。
上限之后:各方得失与走向
对微软来说,380 亿不是一个小数字——它意味着微软在 OpenAI 上的投资回报有一个可预期的天花板,但这个天花板本身已经远超其 130 亿美元的初始投资额。微软的真正筹码在于:即便分成封顶,Azure 作为 OpenAI 首选云的地位短期内不会动摇,OpenAI 的大规模训练和推理仍然依赖 Azure 的 GPU 集群。
对 OpenAI 来说,解绑之后的选择空间更大,但也带来了新的复杂性:
- 多云运维成本:跨云部署模型服务需要统一监控、安全策略和合规框架,这不是签个合同就能自动解决的。
- 合作伙伴博弈:亚马逊和谷歌不会只做"托管商",它们都有自己的大模型(Claude、Gemini),与 OpenAI 的合作必然伴随竞争。
- IPO 估值叙事:收入分成上限让 OpenAI 可以向投资者展示"长期收入留存率将显著提升",但前提是业务规模确实能突破 380 亿的阈值。
对开发者和企业用户来说,最实际的变化是:未来调用 OpenAI 模型的渠道可能增多,不同云上的定价、延迟、数据驻留选项会出现差异。提前建立成本追踪和多云路由的能力,比等渠道开放后再匆忙适配要稳妥得多。