Gartner 2025 数据库市场份额报告出炉,中国厂商收入前四锁定阿里云、腾讯云、华为、PingCAP——这不再是"潜力榜",而是实打实的营收排序。与此同时,四月国产数据库新品密集发布:达梦 DM9、PingCAP 平凯数据库云服务、金篆 GoldenDB 向量版……从传统关系型到云原生再到向量检索,国产数据库的战场正在同时向多个方向展开。
营收 TOP4 说明了什么
阿里云和腾讯云靠的是公有云数据库的规模效应——PolarDB、TDSQL 的客户基数和弹性计费模式让营收天然领先。华为的 GaussDB 背后是政企市场的深度绑定。PingCAP 作为唯一一家独立数据库厂商进入前四,靠的是 TiDB 在金融和互联网行业的渗透:杭州银行刚以 1053.75 万元采购了 2 年 TiDB 授权许可,这不是试点,而是生产级承诺。
值得注意的信号:独立厂商能挤进云厂商主导的营收榜,说明"开源内核 + 商业授权"这条路在金融等行业客户中已经站稳。
四月新品扫描
达梦 DM9:老牌厂商的内核升级
达梦一口气发布 DM9 等 4 款新品。DM9 的核心变化集中在分布式能力和兼容性增强——对 Oracle 语法和 PL/SQL 的兼容度进一步拉高,这是政企迁移场景中最硬的刚需。
PingCAP 平凯数据库云服务:TiDB 新内核上云
PingCAP 发布基于 TiDB 新一代内核的平凯数据库云服务。这意味着 TiDB 不再只是"你自己部署的开源分布式数据库",而是有了官方托管的云入口。对中小客户来说,免运维的吸引力很大;对大客户来说,自建集群 + 商业授权仍是主流选择。
金篆 GoldenDB 向量版:分布式数据库 + AI 检索
GoldenDB 向量版是最值得玩味的发布。分布式数据库内核加上向量索引和相似度检索能力,直接瞄准了 RAG(检索增强生成)场景——金融行业做内部知识库问答、合规文档检索,不需要再额外部署一套向量数据库。
实战:用国产数据库搭一个最小 RAG 棎架
向量版数据库的发布让"一库搞定结构化数据 + 向量检索"成为可能。下面用一个最小示例演示:在 TiDB(支持向量列)上存储文档向量并做相似度检索,再配合大模型完成 RAG 问答。
前提:你需要一个 TiDB Serverless 集群(免费 tier 即可),从 tidbcloud.com 注册获取连接串。TiDB 从 v7.5 起支持
VECTOR列类型。
第一步:建表并写入向量数据
-- 连接到 TiDB Serverless
-- mysql -u <root> -h <host> -P 4000 -p <password>
-- 创建文档表,含向量列(1536 维,匹配 OpenAI text-embedding-ada-002)
CREATE TABLE docs (
id INT AUTO_INCREMENT PRIMARY KEY,
title VARCHAR(255),
content TEXT,
embedding VECTOR(1536)
);
-- 插入示例文档(向量值用 JSON 数组表示)
INSERT INTO docs (title, content, embedding) VALUES
('国产数据库市场份额', 'Gartner 2025 报告显示中国数据库厂商收入 TOP4 为阿里云、腾讯云、华为、PingCAP。', '[0.0023, -0.0091, 0.0315, ...]'),
('TiDB 金融场景', '杭州银行采购 TiDB 两年授权许可,金额 1053.75 万元,用于核心交易系统改造。', '[0.0045, 0.0122, -0.0078, ...]'),
('达梦 DM9 发布', '达梦发布 DM9 等 4 款新品,重点增强分布式能力和 Oracle 兼容性。', '[0.0011, -0.0034, 0.0229, ...]');
实际 embedding 值需要调用嵌入模型生成,这里用占位符示意。完整流程见下方 Python 代码。
第二步:向量相似度检索
-- 查询与输入向量最相似的 3 条文档
-- cosine_distance 越小越相似
SELECT id, title, content,
cosine_distance(embedding, '[0.0030, -0.0080, 0.0280, ...]') AS distance
FROM docs
ORDER BY distance ASC
LIMIT 3;
第三步:Python 端完整 RAG 流程
import os
import mysql.connector
from openai import OpenAI
# ---- 配置 ----
TIDB_HOST = os.getenv("TIDB_HOST", "gateway01.us-east-1.prod.aws.tidbcloud.com")
TIDB_PORT = int(os.getenv("TIDB_PORT", "4000"))
TIDB_USER = os.getenv("TIDB_USER", "your_user.root")
TIDB_PASS = os.getenv("TIDB_PASS", "your_password")
OPENAI_KEY = os.getenv("OPENAI_API_KEY")
client = OpenAI(api_key=OPENAI_KEY)
def get_embedding(text: str) -> list[float]:
"""调用 OpenAI embedding 模型获取向量"""
resp = client.embeddings.create(
model="text-embedding-ada-002",
input=text
)
return resp.data[0].embedding
def search_docs(query: str, top_k: int = 3) -> list[dict]:
"""在 TiDB 中做向量相似度检索"""
query_vec = get_embedding(query)
vec_str = str(query_vec) # Python list → JSON 数组字符串
conn = mysql.connector.connect(
host=TIDB_HOST, port=TIDB_PORT,
user=TIDB_USER, password=TIDB_PASS,
database="test", ssl_ca="/etc/ssl/cert.pem",
ssl_verify_cert=True
)
cursor = conn.cursor(dictionary=True)
cursor.execute("""
SELECT id, title, content,
cosine_distance(embedding, %s) AS distance
FROM docs
ORDER BY distance ASC
LIMIT %s
""", (vec_str, top_k))
results = cursor.fetchall()
cursor.close()
conn.close()
return results
def rag_answer(query: str) -> str:
"""RAG:检索相关文档 → 拼接 prompt → 调用大模型生成回答"""
docs = search_docs(query)
context = "\n".join(f"- {d['title']}: {d['content']}" for d in docs)
prompt = f"""基于以下参考资料回答问题,如果资料中没有相关信息,请如实说明。
参考资料:
{context}
问题:{query}
回答:"""
resp = client.chat.completions.create(
model="gpt-4o-mini",
messages=[{"role": "user", "content": prompt}],
temperature=0.3
)
return resp.choices[0].message.content
# ---- 运行 ----
if __name__ == "__main__":
question = "国产数据库在金融行业有哪些落地案例?"
print(rag_answer(question))
运行前需要设置环境变量:
export TIDB_HOST="你的 TiDB Serverless 主机"
export TIDB_USER="你的用户名.root"
export TIDB_PASS="你的密码"
export OPENAI_API_KEY="你的 OpenAI Key"
pip install mysql-connector-python openai
python rag_tidb.py
这个示例的关键点:向量列和业务数据在同一张表里,不需要额外的向量数据库组件。这正是 GoldenDB 向量版和 TiDB VECTOR 类型想要解决的核心问题——减少架构复杂度。
选型判断:什么时候该关注这些新品
| 场景 | 优先考虑 | 原因 |
|---|---|---|
| 金融核心系统改造 | TiDB 商业授权 / GoldenDB | 杭州银行等已有生产验证,监管合规路径清晰 |
| Oracle 迁移、政企强合规 | 达梦 DM9 | Oracle 兼容度最高,国产资质最全 |
| 中小团队、不想运维 | 平凯数据库云服务 | 官方托管 TiDB 内核,弹性计费 |
| 内部知识库 / RAG | GoldenDB 向量版 / TiDB VECTOR | 结构化数据 + 向量检索一库搞定 |
最后提醒两点:一是向量版数据库的检索性能和召回率目前还在成熟期,大规模生产部署前务必做基准测试;二是云服务版本的 SLA 和数据主权条款需要逐条确认,尤其是金融和政务场景。国产数据库的四月很热闹,但选型的冷静不能少。