DeepSeek 700 亿融资背后：AGI 优先路线意味着什么

预计阅读时间：9 分钟

一轮 700 亿元人民币的融资谈判，把 DeepSeek 推到了中国科技创投史的最前排。更值得关注的不是数字本身，而是创始人梁文锋对投资人说的那句话——AGI 的远期目标优先于短期商业化变现。在资本普遍要求快速回报的语境下，这种表态几乎是在主动给估值加约束：钱可以拿，但别指望我急着变现。

从 500 亿到 700 亿，上调的是什么

彭博社援引知情人士的消息，DeepSeek 本轮融资规模最初定为 500 亿元，后来上调至 700 亿元（约 100 亿美元）。上调本身说明需求端在拉——投资方愿意给的比 DeepSeek 最初想的还多。如果交易达成，这将是中国科技初创公司首轮融资的最高纪录。

数字背后有两层含义：

算力与数据的硬成本在膨胀。 训练下一代基础模型，GPU 集群、数据管线、推理基础设施的投入是实打实的。700 亿不是估值溢价，很大一部分会直接变成硬件采购和人才开支。
市场对 AGI 路线的信心在强化。 投资人愿意押注一个明确说"不急着赚钱"的团队，说明他们相信 AGI 一旦突破，商业回报会指数级释放——晚一点没关系，但不能缺席。

AGI 优先，不是不做产品

梁文锋的表态容易被误读为"完全不考虑商业"。更准确的理解是：在资源分配和战略决策上，当 AGI 研究和短期变现产生冲突时，AGI 研究拿到优先权。

这和 DeepSeek 此前的行为是一致的——他们开源了 DeepSeek-V3 和 DeepSeek-R1 的模型权重，没有选择闭源收费。开源对短期收入是负贡献，但对 AGI 路线有三重正贡献：

社区反馈加速模型迭代。 全球开发者用你的模型做实验，发现的边界情况和失败模式比内部测试覆盖得更广。
生态锁定降低切换成本。 当大量工具链和下游应用已经围绕你的模型构建，你的下一代模型发布时，迁移阻力天然更小。
人才吸引力。 顶尖研究员更愿意加入一个成果能被全世界看到的团队，而不是一个只发闭源 API 的公司。

开发者现在能做什么：接入 DeepSeek-R1 的最小实践

AGI 是远期目标，但 DeepSeek 当前开源的模型已经可以落地使用。下面给出一个可直接运行的示例——用 DeepSeek 官方 API 调用 R1 模型完成一次推理任务。

前提：你需要到 platform.deepseek.com 注册并获取 API Key。R1 模型的定价远低于同级别竞品，这也是 DeepSeek"不急着变现"策略的直接体现。

"""
deepseek_r1_reasoning.py
调用 DeepSeek-R1 完成一道逻辑推理题，并打印模型的思考过程与最终答案。
运行前：pip install openai
环境变量：export DEEPSEEK_API_KEY="sk-xxxx"
"""

import os
from openai import OpenAI

# DeepSeek API 兼容 OpenAI SDK，只需改 base_url
client = OpenAI(
    api_key=os.environ.get("DEEPSEEK_API_KEY"),
    base_url="https://api.deepseek.com",
)

prompt = """
一个房间里有三个开关，分别控制隔壁房间里的三盏灯。
你只能进入隔壁房间一次。
在进入之前，你可以任意拨动开关。
进入之后，你必须确定每个开关对应哪盏灯。
请给出具体策略。
"""

response = client.chat.completions.create(
    model="deepseek-reasoner",  # R1 推理模型
    messages=[{"role": "user", "content": prompt}],
    stream=False,
)

# R1 的回复包含 reasoning_content（思考过程）和 content（最终答案）
choice = response.choices[0]
message = choice.message

print("=== 思考过程 ===")
print(message.reasoning_content)
print("\n=== 最终答案 ===")
print(message.content)
print(f"\nToken 用量: prompt={response.usage.prompt_tokens}, "
      f"completion={response.usage.completion_tokens}")

运行方式：

export DEEPSEEK_API_KEY="sk-你的密钥"
python deepseek_r1_reasoning.py

你会看到 R1 先输出一段较长的内部推理链（reasoning_content），再给出精炼的最终答案。这种"先想再说"的模式正是 DeepSeek-R1 的核心差异点——它不是在生成文本时隐式推理，而是把推理过程显式化，让用户可以审查模型的思考路径。

如果你更倾向本地部署，DeepSeek-V3 和 R1 的权重已在 HuggingFace 上开源，可以用 vLLM 或 SGLang 起服务：

# 示例：用 vLLM 本地部署 DeepSeek-R1（需要足够 GPU 内存）
pip install vllm

vllm serve deepseek-ai/DeepSeek-R1 \
  --tensor-parallel-size 8 \
  --max-model-len 4096 \
  --port 8000

# 部署后用 OpenAI SDK 连接本地服务
# 只需改 base_url="http://localhost:8000/v1"，api_key 随意填

本地部署的门槛主要在 GPU——R1 是 671B 参数的模型，8×H100 或 A100 是最低配置。如果硬件不够，可以先用官方 API 做验证，再决定是否投入本地资源。

700 亿之后，该关注什么

融资数字是快变量，真正影响行业的是几个慢变量：

开源节奏会不会变。 700 亿到位后，DeepSeek 有更多资源训练下一代模型。如果继续保持开源策略，整个中文 AI 生态的基础模型层会持续受益；如果转向闭源，下游开发者需要提前准备替代方案。
AGI 路线的具体里程碑。 "AGI 优先"是方向声明，但投资者和开发者都需要更具体的节点——比如多模态融合、长程推理、自主规划等能力的量化指标。这些指标一旦公开，就能判断进度是否在预期内。
算力供应链的稳定性。 大规模融资意味着大规模采购，GPU 供应、数据中心建设、电力保障都是硬约束。任何一环出问题，都会拖慢训练周期。

对开发者而言，当前最务实的动作是：用 DeepSeek 已开源的模型构建产品原型，同时保持架构的可替换性。 AGI 路线意味着模型能力会快速迭代，今天调 R1 的代码，半年后可能要调 R2 或 V4。把模型调用抽象成一层接口，不要把业务逻辑和特定模型的输出格式绑死。

700 亿是一张入场券，但比赛才刚开始。

DeepSeek 700 亿融资背后：AGI 优先路线意味着什么

从 500 亿到 700 亿，上调的是什么

AGI 优先，不是不做产品

开发者现在能做什么：接入 DeepSeek-R1 的最小实践

700 亿之后，该关注什么

相关推荐

建议反馈