一轮 700 亿元人民币的融资谈判,把 DeepSeek 推到了中国科技创投史的最前排。更值得关注的不是数字本身,而是创始人梁文锋对投资人说的那句话——AGI 的远期目标优先于短期商业化变现。在资本普遍要求快速回报的语境下,这种表态几乎是在主动给估值加约束:钱可以拿,但别指望我急着变现。
从 500 亿到 700 亿,上调的是什么
彭博社援引知情人士的消息,DeepSeek 本轮融资规模最初定为 500 亿元,后来上调至 700 亿元(约 100 亿美元)。上调本身说明需求端在拉——投资方愿意给的比 DeepSeek 最初想的还多。如果交易达成,这将是中国科技初创公司首轮融资的最高纪录。
数字背后有两层含义:
- 算力与数据的硬成本在膨胀。 训练下一代基础模型,GPU 集群、数据管线、推理基础设施的投入是实打实的。700 亿不是估值溢价,很大一部分会直接变成硬件采购和人才开支。
- 市场对 AGI 路线的信心在强化。 投资人愿意押注一个明确说"不急着赚钱"的团队,说明他们相信 AGI 一旦突破,商业回报会指数级释放——晚一点没关系,但不能缺席。
AGI 优先,不是不做产品
梁文锋的表态容易被误读为"完全不考虑商业"。更准确的理解是:在资源分配和战略决策上,当 AGI 研究和短期变现产生冲突时,AGI 研究拿到优先权。
这和 DeepSeek 此前的行为是一致的——他们开源了 DeepSeek-V3 和 DeepSeek-R1 的模型权重,没有选择闭源收费。开源对短期收入是负贡献,但对 AGI 路线有三重正贡献:
- 社区反馈加速模型迭代。 全球开发者用你的模型做实验,发现的边界情况和失败模式比内部测试覆盖得更广。
- 生态锁定降低切换成本。 当大量工具链和下游应用已经围绕你的模型构建,你的下一代模型发布时,迁移阻力天然更小。
- 人才吸引力。 顶尖研究员更愿意加入一个成果能被全世界看到的团队,而不是一个只发闭源 API 的公司。
开发者现在能做什么:接入 DeepSeek-R1 的最小实践
AGI 是远期目标,但 DeepSeek 当前开源的模型已经可以落地使用。下面给出一个可直接运行的示例——用 DeepSeek 官方 API 调用 R1 模型完成一次推理任务。
前提:你需要到 platform.deepseek.com 注册并获取 API Key。R1 模型的定价远低于同级别竞品,这也是 DeepSeek"不急着变现"策略的直接体现。
"""
deepseek_r1_reasoning.py
调用 DeepSeek-R1 完成一道逻辑推理题,并打印模型的思考过程与最终答案。
运行前:pip install openai
环境变量:export DEEPSEEK_API_KEY="sk-xxxx"
"""
import os
from openai import OpenAI
# DeepSeek API 兼容 OpenAI SDK,只需改 base_url
client = OpenAI(
api_key=os.environ.get("DEEPSEEK_API_KEY"),
base_url="https://api.deepseek.com",
)
prompt = """
一个房间里有三个开关,分别控制隔壁房间里的三盏灯。
你只能进入隔壁房间一次。
在进入之前,你可以任意拨动开关。
进入之后,你必须确定每个开关对应哪盏灯。
请给出具体策略。
"""
response = client.chat.completions.create(
model="deepseek-reasoner", # R1 推理模型
messages=[{"role": "user", "content": prompt}],
stream=False,
)
# R1 的回复包含 reasoning_content(思考过程)和 content(最终答案)
choice = response.choices[0]
message = choice.message
print("=== 思考过程 ===")
print(message.reasoning_content)
print("\n=== 最终答案 ===")
print(message.content)
print(f"\nToken 用量: prompt={response.usage.prompt_tokens}, "
f"completion={response.usage.completion_tokens}")
运行方式:
export DEEPSEEK_API_KEY="sk-你的密钥"
python deepseek_r1_reasoning.py
你会看到 R1 先输出一段较长的内部推理链(reasoning_content),再给出精炼的最终答案。这种"先想再说"的模式正是 DeepSeek-R1 的核心差异点——它不是在生成文本时隐式推理,而是把推理过程显式化,让用户可以审查模型的思考路径。
如果你更倾向本地部署,DeepSeek-V3 和 R1 的权重已在 HuggingFace 上开源,可以用 vLLM 或 SGLang 起服务:
# 示例:用 vLLM 本地部署 DeepSeek-R1(需要足够 GPU 内存)
pip install vllm
vllm serve deepseek-ai/DeepSeek-R1 \
--tensor-parallel-size 8 \
--max-model-len 4096 \
--port 8000
# 部署后用 OpenAI SDK 连接本地服务
# 只需改 base_url="http://localhost:8000/v1",api_key 随意填
本地部署的门槛主要在 GPU——R1 是 671B 参数的模型,8×H100 或 A100 是最低配置。如果硬件不够,可以先用官方 API 做验证,再决定是否投入本地资源。
700 亿之后,该关注什么
融资数字是快变量,真正影响行业的是几个慢变量:
- 开源节奏会不会变。 700 亿到位后,DeepSeek 有更多资源训练下一代模型。如果继续保持开源策略,整个中文 AI 生态的基础模型层会持续受益;如果转向闭源,下游开发者需要提前准备替代方案。
- AGI 路线的具体里程碑。 "AGI 优先"是方向声明,但投资者和开发者都需要更具体的节点——比如多模态融合、长程推理、自主规划等能力的量化指标。这些指标一旦公开,就能判断进度是否在预期内。
- 算力供应链的稳定性。 大规模融资意味着大规模采购,GPU 供应、数据中心建设、电力保障都是硬约束。任何一环出问题,都会拖慢训练周期。
对开发者而言,当前最务实的动作是:用 DeepSeek 已开源的模型构建产品原型,同时保持架构的可替换性。 AGI 路线意味着模型能力会快速迭代,今天调 R1 的代码,半年后可能要调 R2 或 V4。把模型调用抽象成一层接口,不要把业务逻辑和特定模型的输出格式绑死。
700 亿是一张入场券,但比赛才刚开始。