DeepSeek

最后更新：2026-04-23

DeepSeek（深度求索）是2025 年全球 AI 产业最重要的"黑天鹅"——一家隶属于中国量化基金"幻方"的 AI 实验室，用开源 + 低成本双重武器震动了整个基础模型格局。2025-01 R1 发布后，硅谷不得不重新评估"中国 AI 能不能追上"。

一、公司速览

创立：2023 年 7 月
总部：浙江杭州
母公司：幻方量化（由梁文锋2015 年创立，中国头部量化私募）
创始 / CEO：梁文锋
员工数：约 150-200 人（2025 末估算，以 AI 研究员为主）
估值：未融资，全部由幻方出资。按模型能力对标估算"如果融资" $100B+ 级
一句话业务：研发最前沿的开源大模型，冲击国际头部的定价权

二、历史沿革

时间	事件	影响
2023-07	幻方宣布拆分成立 DeepSeek	量化基金做 AI 研究在中国独一份
2023-11	DeepSeek Coder 开源	首个引起国际关注的开源编程模型
2024-05	DeepSeek V2 发布 + 论文	MLA 架构创新，token 定价惊人低
2024-12	DeepSeek V3 发布	训练成本 $5.6M 的传奇（实际 GPU 投入更高）
2025-01-20	DeepSeek R1 开源	推理能力追平 o1，引爆全球讨论
2025-Q2	API 价格再降 50%	进一步挤压头部定价权
2025-Q3-Q4	V3.1 / V3.2 / R2 相继更新	持续高速迭代
2026-Q1	R2（或 V4）发布（预期）	下一个分水岭

三、业务与产品

开源模型系列

DeepSeek V 系列（通用对话）：V1 → V2 → V3 → V4（预期）
DeepSeek Coder：编程专用
DeepSeek R 系列（推理模型）：R1 → R2
DeepSeek VL：视觉理解

API 服务

通过 platform.deepseek.com 提供 API
价格策略：极低（token 成本约 OpenAI 1/10）
主要用户：开发者、中国企业、国际研究者

无 C 端产品

DeepSeek 没有自己的 ChatGPT/Kimi 式消费 App。2025-01 R1 爆火后一度有 App，但策略性地不大力推广——专注研究 + 开源生态，不分心做应用。

四、技术路线

核心差异化

算法工程 efficiency：MLA（Multi-head Latent Attention）降低 KV cache 占用；MoE（混合专家）激活参数更少
训练 pipeline 创新：FP8 混合精度训练、DualPipe 流水并行、专家负载均衡算法
推理模型独特路径：R1 不依赖大规模人工标注数据，用 RL + 自我博弈
开源哲学：weights + 部分训练方法公开，生态友好

工程实现

算力：幻方积累的 H800 / H100 集群（受出口管制影响，规模难公开披露）
2024 年传闻 GPU 投入 $500M+ 量级（SemiAnalysis 估算）

五、商业模式

收入来源（非主要目的）

API 服务（低价引流，非主要盈利）
无订阅产品
无企业合同深度化

真正的"A"是什么？

用 Commoditize Your Complement 视角理解 DeepSeek： - 幻方量化才是真正赚钱的业务 - DeepSeek 对幻方的价值： - 建立 AI 技术声誉（招聘吸引力） - 量化 + AI 融合（文本 / 信号因子） - 挤压 OpenAI 定价权（影响竞争对手使用 AI 的成本） - 社会资本与政策资本（成为"中国 AI 代表"）

DeepSeek 不是一家纯商业公司，是幻方的"研究 arm + 品牌臂"。

六、竞争与壁垒

直接对标

开源基础模型：Llama（Meta）、Qwen（阿里）、Mistral、Gemma（Google 小模型）
推理模型：OpenAI o 系列、Claude Extended Thinking、Gemini Thinking

护城河（用 VRIO 框架分析）

资源	V	R	I	O
算法工程 efficiency	✅	✅	🟡	✅
幻方资金 + 算力独立性	✅	✅	✅	✅
开源社区信誉	✅	✅	✅	✅
工程人才密度	✅	✅	🟡	✅

最强壁垒：独立于融资周期的资金来源 + 开源品牌。

七、关键风险

出口管制升级：美国对中国的 GPU 管制可能进一步收紧（Blackwell B100/B200 被阻止、HBM 供应受限）
幻方母公司压力：如果幻方量化遇到市场风险或监管问题，DeepSeek 的资金来源受影响
人才流失：DeepSeek 因出名后，顶级研究员可能被国际 / 中国大厂挖角
政策风险：中国开源 AI 是否被纳入更严格的出口 / 内容管理
能力被追平：Meta Llama / Qwen / Mistral 追赶可能稀释 DeepSeek 的独特性

八、我的判断

我的看法：

DeepSeek 是 2025 年全球 AI 最重要的变量——它一次性让"中国 AI 能不能追上"从叙事变成事实，迫使 OpenAI / Anthropic 重新思考定价策略

DeepSeek 的战略本质是幻方的"AI 基础设施投资"，不是传统 AI 创业公司。这让它不被季度财报绑架，可以做真正前沿的研究

开源 + 工程 efficiency 的组合 2026 年会继续冲击——R2 如果再次保持数量级能力提升，基础模型公司的估值逻辑会被重大重估

但不会"颠覆"头部——Anthropic / OpenAI 的企业合同 + 品牌壁垒不是开源能完全瓦解的

我可能错在哪里：

监管 / 出口管制的影响被低估：如果美国把"使用 DeepSeek 模型"本身列入制裁，企业采用受阻

V4 / R2 可能不再惊艳：Scaling law 的递减 + 工程 efficiency 边际

幻方的风险事件会传导到 DeepSeek

九、延伸阅读

DeepSeek 技术报告（GitHub / HuggingFace）
SemiAnalysis · DeepSeek Debates（最深度的第三方分析）
晚点 LatePost · DeepSeek 专题
本站 · 中国 AI 梯队结构 · 开源 vs 闭源 · Commoditize Your Complement