5 月 12 日 OpenRouter 公布的最新数据里,两个数字值得注意:Hermes Agent 日 Token 调用量达 2910 亿,最近一周超过 1.75 万亿;而小米 MiMo 模型以单月 1.45 万亿 Token 调用量排名第一。小米同步宣布面向全球 AI 用户免费发放 Token 权益——这意味着开发者可以零成本上手体验这个调用量冠军模型。
调用量第一意味着什么
Token 调用量不是营销指标,它是模型被真实使用的刻度。一个模型能在 OpenRouter 上跑出月度 1.45 万亿 Token,说明三件事:
- 集成广度:大量应用和 Agent 已经把 MiMo 接入了生产链路,而不是停留在评测榜单上。
- 稳定性过关:万亿级调用意味着模型服务没有频繁宕机或降级,否则开发者会迅速切换。
- 性价比被认可:OpenRouter 是多模型路由平台,开发者会根据价格、速度、质量动态选择。MiMo 能在竞争中拿到最高调用量,说明它在某个性价比区间里赢了。
Hermes Agent 的爆发式增长同样值得关注——2910 亿日调用量说明 Agent 场景正在从实验走向规模化部署,而 MiMo 在这个场景下被大量选用,是对其 Agent 任务处理能力的实战验证。
OpenRouter 是什么,为什么重要
OpenRouter 是一个统一的模型 API 路由层。开发者用一个 API endpoint 就能访问几十家模型提供商的产品,按 Token 计费,自动路由到可用节点。它的核心价值:
- 不用和每个模型厂商单独签合同、对接 API。
- 可以在同一个请求里通过
model字段切换不同模型,做 A/B 测试或 fallback。 - 价格透明,实时显示各模型的输入/输出 Token 单价。
MiMo 在这个平台上登顶,等于是在一个完全开放、开发者可以随时切换的竞争环境里拿到的第一。
实战接入:用 OpenRouter 调用 MiMo
下面是一个可以直接运行的 Python 示例,通过 OpenRouter 调用 MiMo 模型完成一个 Agent 式的多步推理任务。
先安装依赖:
pip install openai httpx
OpenRouter 兼容 OpenAI SDK,只需要改 base_url 和 api_key:
import os
from openai import OpenAI
# 在 https://openrouter.ai/ 注册后获取 API Key
# 小米免费 Token 权益发放后,可关注官方渠道获取额度
client = OpenAI(
base_url="https://openrouter.ai/api/v1",
api_key=os.environ.get("OPENROUTER_API_KEY"), # 建议用环境变量,不要硬编码
)
# 调用 MiMo 模型——模型 ID 以 openrouter 上实际发布的为准
# 当前可尝试的 ID 格式:xiaomi/mimo 或类似,请在 openrouter.ai/models 确认最新 ID
MODEL_ID = "xiaomi/mimo-7b" # 请根据 OpenRouter 模型列表更新此字段
response = client.chat.completions.create(
model=MODEL_ID,
messages=[
{
"role": "system",
"content": "你是一个任务规划 Agent。收到用户目标后,拆解为可执行的步骤列表。"
},
{
"role": "user",
"content": "帮我规划一个自动化流程:每天早上 8 点抓取 3 个新闻网站的 AI 板块头条,摘要后发到企业微信群。"
}
],
temperature=0.3,
max_tokens=2048,
)
print(response.choices[0].message.content)
运行前做两件事:
- 到 openrouter.ai 注册账号,在 Keys 页面生成 API Key,设到环境变量
OPENROUTER_API_KEY。 - 到 openrouter.ai/models 搜索
mimo,确认当前可用的模型 ID——模型列表会随发布更新,代码里的MODEL_ID需要对应修改。
如果你想做模型对比,只需改 model 字段即可:
# 对比 MiMo 和另一个模型对同一 prompt 的输出
models = ["xiaomi/mimo-7b", "meta-llama/llama-3-8b-instruct"]
prompt = "用三句话解释什么是 Token 调用量,为什么它比评测分数更能反映模型实力。"
for m in models:
resp = client.chat.completions.create(
model=m,
messages=[{"role": "user", "content": prompt}],
max_tokens=256,
)
print(f"【{m}】\n{resp.choices[0].message.content}\n---")
这种对比在 OpenRouter 上成本极低——输入 Token 价格通常在 $0.1/M 以下,跑几十次测试也就几美分。
免费 Token 权益怎么用
小米宣布的免费 Token 权益,具体发放规则还在逐步公开。基于已有信息,开发者可以关注几个要点:
- 发放渠道:大概率通过小米官方开发者平台或 OpenRouter 的促销码机制,留意小米技术官博和 OpenRouter 的 Announcements 页面。
- 适用范围:免费额度通常限定特定模型(MiMo 系列),不会覆盖 OpenRouter 上所有模型。
- 有效期:这类权益一般有到期时间,拿到后尽快用完或规划好测试节奏。
一个实用的策略:拿到免费额度后,先跑一批你业务中的真实 prompt,对比 MiMo 和你当前主力模型的输出质量与延迟,而不是跑通用评测题。真实业务数据才是最有说服力的选型依据。
选型视角:什么时候考虑 MiMo
调用量第一不等于所有场景都合适。几个判断维度:
| 维度 | 适合 MiMo 的信号 | 可能需要再评估的信号 |
|---|---|---|
| 任务类型 | Agent 规划、多步推理、中文指令跟随 | 需要极长上下文(>128K)的场景 |
| 语言 | 中文为主或中英混合 | 纯英文且对英文细微语义极度敏感 |
| 成本敏感度 | 高——需要压低每 Token 成本 | 不敏感,愿意为顶级质量付高价 |
| 集成方式 | 已用 OpenRouter 或愿意迁移 | 有深度绑定的其他 SDK/平台 |
MiMo 在 Agent 场景的调用量爆发,说明它在指令拆解、工具调用、多轮对话这类任务上有实战优势。如果你的应用正好落在这个区间,免费额度是一个零风险验证的机会。
万亿 Token 调用量不是偶然——它反映的是大量开发者在真实业务里反复选择的结果。小米把 MiMo 推到 OpenRouter 上开放竞争,再叠加免费 Token 权益,降低了验证门槛。下一步很简单:注册 OpenRouter,确认 MiMo 的模型 ID,跑一批你自己的 prompt,看看数字背后的模型到底能不能替你干活。