每隔几个月,科技行业的权力版图就在重塑。上一轮是移动互联网把财富推向平台型公司,这一轮的引擎换成了 AI——而且集中速度更快、门槛更高。
钱流向了哪里
看几个硬指标:
- 算力即资本。英伟达 2024 财年数据中心营收超过 470 亿美元,同比翻倍以上。买 GPU 的钱,本质上是在买进入 AI 世界的门票。
- 头部模型公司吸走大部分融资。OpenAI 一轮融资就超过百亿美元,Anthropic、xAI 紧随其后。中小模型团队拿到的份额在缩小。
- AI 相关岗位薪资溢价明显。具备大模型落地经验的工程师,在国内市场薪资比同级别传统开发岗位高出 30%-50%。
这不是"AI 很火"的泛泛之谈——是资本、人才、收入三条线同时向 AI 集中。和移动互联网时代不同,那一轮至少有长尾的 App 生态;这一轮的核心资源(大模型、算力、数据)天然倾向于寡头。
集中的结构性原因
为什么集中速度比以往更快?
1. 模型训练的固定成本极高。 训练一个前沿大模型,算力成本动辄数千万美元,加上数据清洗、对齐、安全测试,门槛远超"几个人在车库写 App"。
2. 数据飞轮效应。 用户越多 → 反馈越多 → 模型越好 → 用户更多。这个循环一旦启动,后来者很难从中间插入。
3. 生态锁定。 OpenAI 的 API、微软的 Copilot 嵌入、Google 的 Gemini 全栈整合——开发者一旦接入某个体系,迁移成本就变成了沉没成本。
开发者能做什么:三个实用策略
面对集中趋势,抱怨没用。关键是找到自己在链条上的位置。
策略一:做 AI 的"管道工",不做 AI 的"炼丹师"
绝大多数公司不会自己训练基础模型,但都需要把模型接入业务。这个环节——数据预处理、Prompt 工程、RAG 搭建、评估体系——才是开发者的主战场。
下面是一个最小可用的 RAG 管线示例,用 LangChain + OpenAI API,跑起来就能给业务文档做问答:
# rag_minimal.py — 最小 RAG 示例,可直接运行
# 依赖:pip install langchain langchain-openai langchain-community faiss-cpu tiktoken
import os
from langchain_community.document_loaders import TextLoader
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain_openai import OpenAIEmbeddings, ChatOpenAI
from langchain_community.vectorstores import FAISS
from langchain.chains import RetrievalQA
# 1. 设置 API Key(也可写入环境变量)
os.environ["OPENAI_API_KEY"] = "sk-你的key"
# 2. 加载业务文档并切片
loader = TextLoader("your_doc.txt") # 替换为你的文档路径
docs = loader.load()
splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=50)
chunks = splitter.split_documents(docs)
# 3. 构建向量索引
embeddings = OpenAIEmbeddings(model="text-embedding-3-small")
vectorstore = FAISS.from_documents(chunks, embeddings)
# 4. 组装问答链
llm = ChatOpenAI(model="gpt-4o-mini", temperature=0)
qa_chain = RetrievalQA.from_chain_type(
llm=llm,
chain_type="stuff",
retriever=vectorstore.as_retriever(search_kwargs={"k": 3}),
)
# 5. 提问
answer = qa_chain.invoke("文档中提到的核心流程是什么?")
print(answer["result"])
运行前准备:把业务文本放入 your_doc.txt,设置好 API Key。这个脚本的核心价值不在代码本身——在于它展示了"模型是别人的,管线是你的"这条路线。
策略二:跟踪成本,别让 API 费用悄悄失控
财富向 AI 集中,一部分就是从你的 API 费用流过去的。写一个简单的成本监控脚本,每周跑一次:
# cost_monitor.py — 统计 OpenAI API 近期用量(需安装 openai)
# pip install openai
from openai import OpenAI
import os
client = OpenAI(api_key=os.environ.get("OPENAI_API_KEY"))
# 获取最近 7 天的用量概览(OpenAI Dashboard API)
# 注:OpenAI 官方 API 目前不直接提供用量端点,以下为替代方案
# 实际项目中建议在每次调用后自行记录 token 数
# ---- 自记录方案(推荐) ----
import json, datetime
LOG_FILE = "api_usage_log.json"
def log_usage(model: str, prompt_tokens: int, completion_tokens: int, cost_usd: float):
entry = {
"timestamp": datetime.datetime.now().isoformat(),
"model": model,
"prompt_tokens": prompt_tokens,
"completion_tokens": completion_tokens,
"cost_usd": cost_usd,
}
records = []
if os.path.exists(LOG_FILE):
with open(LOG_FILE) as f:
records = json.load(f)
records.append(entry)
with open(LOG_FILE, "w") as f:
json.dump(records, f, indent=2)
def weekly_summary():
if not os.path.exists(LOG_FILE):
print("暂无用量记录")
return
with open(LOG_FILE) as f:
records = json.load(f)
cutoff = datetime.datetime.now() - datetime.timedelta(days=7)
recent = [r for r in records if datetime.datetime.fromisoformat(r["timestamp"]) > cutoff]
total_cost = sum(r["cost_usd"] for r in recent)
total_tokens = sum(r["prompt_tokens"] + r["completion_tokens"] for r in recent)
print(f"近 7 天:{len(recent)} 次调用,{total_tokens} tokens,总费用 ${total_cost:.2f}")
# 使用示例:每次 API 调用后记录
# resp = client.chat.completions.create(model="gpt-4o-mini", messages=[...])
# log_usage("gpt-4o-mini", resp.usage.prompt_tokens, resp.usage.completion_tokens, 0.15)
weekly_summary()
在每次 API 调用后调用 log_usage(),把 resp.usage 的 token 数和对应单价写入 JSON。每周跑 weekly_summary() 看趋势。小团队用这个方案就够了,比事后看账单更可控。
策略三:选对模型层级,别在不需要的地方烧钱
不是所有场景都要 GPT-4o 或 Claude Opus。一个实用的分层思路:
| 场景 | 推荐模型层级 | 大致单价(每百万 token) |
|---|---|---|
| 内部文档问答、摘要 | 小模型(gpt-4o-mini / Claude Haiku) | $0.15-$0.25 |
| 代码生成、复杂推理 | 中模型(gpt-4o / Claude Sonnet) | $3-$5 |
| 高精度分析、长上下文理解 | 大模型(o1 / Claude Opus) | $15-$30 |
在 RAG 管线里,检索阶段用小模型做 embedding,生成阶段按场景选模型——这样能把成本压到"全用大模型"方案的 1/5 以下。
看清风险
财富集中意味着依赖集中:
- API 单点故障。OpenAI 一次宕机,你的整个产品可能停摆。建议至少准备一个备用模型端点。
- 定价权在对方手里。模型公司随时可以调价,你没有议价能力。成本监控不是可选的,是必须的。
- 能力迭代不由你控制。模型升级可能改变输出风格或行为,你的 Prompt 可能突然失效。建立评估集(eval set)比写更多 Prompt 更重要。
行动清单
- 本周:选一个业务场景,跑通上面的最小 RAG 示例,体验"管线工"角色。
- 本月:在项目中接入
log_usage,建立成本基线。一个月后看数据,决定是否需要换模型层级。 - 长期:构建自己的 eval 集——50-100 个典型问题和期望答案。每次换模型或调 Prompt,先跑 eval 再上线。
财富向 AI 集中是宏观趋势,但微观上,每个开发者可以选择做管道、做评估、做成本控制——这些环节的技能壁垒正在形成,早入场的人会拿到和"写 CRUD"时代完全不同的溢价。