跳转至

DeepSeek

最后更新:2026-04-23

DeepSeek(深度求索)是2025 年全球 AI 产业最重要的"黑天鹅"——一家隶属于中国量化基金"幻方"的 AI 实验室,用开源 + 低成本双重武器震动了整个基础模型格局。2025-01 R1 发布后,硅谷不得不重新评估"中国 AI 能不能追上"。

一、公司速览

  • 创立:2023 年 7 月
  • 总部:浙江杭州
  • 母公司:幻方量化(由梁文锋2015 年创立,中国头部量化私募)
  • 创始 / CEO:梁文锋
  • 员工数:约 150-200 人(2025 末估算,以 AI 研究员为主)
  • 估值未融资,全部由幻方出资。按模型能力对标估算"如果融资" $100B+ 级
  • 一句话业务:研发最前沿的开源大模型,冲击国际头部的定价权

二、历史沿革

时间 事件 影响
2023-07 幻方宣布拆分成立 DeepSeek 量化基金做 AI 研究在中国独一份
2023-11 DeepSeek Coder 开源 首个引起国际关注的开源编程模型
2024-05 DeepSeek V2 发布 + 论文 MLA 架构创新,token 定价惊人低
2024-12 DeepSeek V3 发布 训练成本 $5.6M 的传奇(实际 GPU 投入更高)
2025-01-20 DeepSeek R1 开源 推理能力追平 o1,引爆全球讨论
2025-Q2 API 价格再降 50% 进一步挤压头部定价权
2025-Q3-Q4 V3.1 / V3.2 / R2 相继更新 持续高速迭代
2026-Q1 R2(或 V4) 发布(预期) 下一个分水岭

三、业务与产品

开源模型系列

  • DeepSeek V 系列(通用对话):V1 → V2 → V3 → V4(预期)
  • DeepSeek Coder:编程专用
  • DeepSeek R 系列(推理模型):R1 → R2
  • DeepSeek VL:视觉理解

API 服务

  • 通过 platform.deepseek.com 提供 API
  • 价格策略:极低(token 成本约 OpenAI 1/10)
  • 主要用户:开发者、中国企业、国际研究者

无 C 端产品

DeepSeek 没有自己的 ChatGPT/Kimi 式消费 App。2025-01 R1 爆火后一度有 App,但策略性地不大力推广——专注研究 + 开源生态,不分心做应用


四、技术路线

核心差异化

  1. 算法工程 efficiency:MLA(Multi-head Latent Attention)降低 KV cache 占用;MoE(混合专家)激活参数更少
  2. 训练 pipeline 创新:FP8 混合精度训练、DualPipe 流水并行、专家负载均衡算法
  3. 推理模型独特路径:R1 不依赖大规模人工标注数据,用 RL + 自我博弈
  4. 开源哲学:weights + 部分训练方法公开,生态友好

工程实现

  • 算力:幻方积累的 H800 / H100 集群(受出口管制影响,规模难公开披露)
  • 2024 年传闻 GPU 投入 $500M+ 量级(SemiAnalysis 估算)

五、商业模式

收入来源(非主要目的)

  • API 服务(低价引流,非主要盈利)
  • 无订阅产品
  • 无企业合同深度化

真正的"A"是什么?

Commoditize Your Complement 视角理解 DeepSeek: - 幻方量化才是真正赚钱的业务 - DeepSeek 对幻方的价值: - 建立 AI 技术声誉(招聘吸引力) - 量化 + AI 融合(文本 / 信号因子) - 挤压 OpenAI 定价权(影响竞争对手使用 AI 的成本) - 社会资本与政策资本(成为"中国 AI 代表")

DeepSeek 不是一家纯商业公司,是幻方的"研究 arm + 品牌臂"


六、竞争与壁垒

直接对标

  • 开源基础模型:Llama(Meta)、Qwen(阿里)、Mistral、Gemma(Google 小模型)
  • 推理模型:OpenAI o 系列、Claude Extended Thinking、Gemini Thinking

护城河(用 VRIO 框架 分析)

资源 V R I O
算法工程 efficiency 🟡
幻方资金 + 算力独立性
开源社区信誉
工程人才密度 🟡

最强壁垒:独立于融资周期的资金来源 + 开源品牌


七、关键风险

  1. 出口管制升级:美国对中国的 GPU 管制可能进一步收紧(Blackwell B100/B200 被阻止、HBM 供应受限)
  2. 幻方母公司压力:如果幻方量化遇到市场风险或监管问题,DeepSeek 的资金来源受影响
  3. 人才流失:DeepSeek 因出名后,顶级研究员可能被国际 / 中国大厂挖角
  4. 政策风险:中国开源 AI 是否被纳入更严格的出口 / 内容管理
  5. 能力被追平:Meta Llama / Qwen / Mistral 追赶可能稀释 DeepSeek 的独特性

八、我的判断

我的看法

  1. DeepSeek 是 2025 年全球 AI 最重要的变量——它一次性让"中国 AI 能不能追上"从叙事变成事实,迫使 OpenAI / Anthropic 重新思考定价策略
  2. DeepSeek 的战略本质是幻方的"AI 基础设施投资",不是传统 AI 创业公司。这让它不被季度财报绑架,可以做真正前沿的研究
  3. 开源 + 工程 efficiency 的组合 2026 年会继续冲击——R2 如果再次保持数量级能力提升,基础模型公司的估值逻辑会被重大重估
  4. 但不会"颠覆"头部——Anthropic / OpenAI 的企业合同 + 品牌壁垒不是开源能完全瓦解的

我可能错在哪里

  • 监管 / 出口管制的影响被低估:如果美国把"使用 DeepSeek 模型"本身列入制裁,企业采用受阻
  • V4 / R2 可能不再惊艳:Scaling law 的递减 + 工程 efficiency 边际
  • 幻方的风险事件会传导到 DeepSeek

九、延伸阅读