2026 年 AI 行业格局总览

最后更新：2026-04-22

本文是 AI 板块的入口总览，会频繁链接到单家公司、单个产品的深度调研页。数据截至 2026 年 Q1，以公开披露与头部机构研报为主，每条数字都标注来源。

摘要（TL;DR）

基础模型层已收敛为"三强 + 追赶者 + 开源"格局：OpenAI、Anthropic、Google 占据高端市场，DeepSeek / Llama / Qwen 等开源/半开源力量以 10-20 倍的成本优势分食中低端；其余玩家要么找垂直，要么被整合。
利润集中在最上游：NVIDIA 2025 财年毛利率约 75%，而头部模型公司综合毛利为负或刚转正——钱正被芯片厂 + 云厂 抽走，应用层在其上薄薄分一层利润。
2026 的关键变量是推理成本：过去 18 个月 API 价格平均下降约 80–90%（Epoch AI / Artificial Analysis 综合数据）——如果再降一个数量级，Agent 和搜索这类"高调用频次"产品将完全重构商业模型；如果不降，则头部玩家将被自身算力折旧拖死。

一、先看一张全景图

graph TD
    E[能源 · 电力 · 冷却] --> F[光模块/HBM/先进封装<br/>Coherent · TSMC · SK海力士]
    F --> G[GPU / 加速器<br/>NVIDIA · AMD · 自研芯片]
    G --> H[AI 云与数据中心<br/>AWS · Azure · GCP · Oracle · CoreWeave]
    H --> I[基础模型<br/>OpenAI · Anthropic · Google · Meta · xAI · DeepSeek · Moonshot]
    I --> J[应用层 / Agent<br/>Cursor · Perplexity · Harvey · Glean · 字节豆包]
    J --> K[最终用户<br/>开发者 · 企业 · 消费者]

    style G fill:#0ABAB5,color:#fff
    style I fill:#4FD1CC,color:#fff

谁吃掉了多少毛利（按 2025 年公开披露，粗略量级）：

环节	代表公司	2025 毛利率
GPU	NVIDIA	~75% (FY2025 Q3 10-Q)
AI 云 (AI-related segment)	Azure / AWS / GCP	~60%（难单独拆，估算）
基础模型	OpenAI 等	负到接近 0（含折旧算法）
应用层	Cursor / Perplexity	~70% 单位经济正，但规模小

反直觉结论：越下游越接近用户，越容易赚钱；但当前绝大多数风险资本投向了亏损最严重的基础模型层。

二、基础模型层：三强 + 追赶者 + 开源

三强格局

公司	旗舰模型	差异化定位	商业重心
OpenAI	GPT-5 / o 系列	通用性最强、产品形态最多	ChatGPT 订阅 + API + 企业
Anthropic	Claude Opus / Sonnet / Haiku 4 系列	代码 + 企业侧口碑最好	企业 API（比重高于订阅）
Google DeepMind	Gemini 2.5 Pro / Flash	多模态与长上下文强	搜索集成 + Workspace + 云

近 18 个月最重要的变化：推理模型（Reasoning Models）成为行业共识。从 2024 年 9 月 OpenAI o1 首发，到 2025 年 DeepSeek R1 开源、Claude 4 系列将 extended thinking 内建、Gemini 2.5 Pro 全系带 thinking——所有头部模型都已经是"可显式思考 + 可工具调用"的 Agent 底座。详见推理模型专题。

追赶者

xAI：Grok 4 性能已跻身第一梯队，独占 X 平台数据与 Colossus 集群（20 万卡）
Meta AI：Llama 系列奠定了开源世界格局，但应用产品（Meta AI）不温不火
Mistral：欧洲合规卡位 + 开源 weights
Cohere：企业定位，垂直在 RAG / 金融

中国梯队

"六小虎 + 三大厂"（详见中国 AI 梯队结构）：

领跑：DeepSeek（V3/R1 以 1/10 训练成本冲击国际市场）、Moonshot（Kimi，2026 Q1 K2 发布）
梯队二：智谱 AI、MiniMax、阿里通义、字节豆包/Seed
吃紧：百川、阶跃、腾讯混元

中国梯队集体选择了开源 + 性价比路线——DeepSeek V3/R1 以开源打法在 2025 年初把全球开源模型基准一把推高，显著改变了国际对"中国模型能力"的认知。

开源层

Llama（Meta）生态最大
Qwen（阿里）在中文圈主导地位
DeepSeek 是最接近闭源的开源
Mistral 欧洲阵营
Gemma（Google）走小模型路线

开源 vs 闭源之争的现状： - 开源和闭源的能力差距从 12 个月缩到 3-6 个月 - 但最前沿的推理能力、最长的上下文、最强的工具使用仍然在闭源 - 详见开源vs闭源生态格局演变

三、基础设施层：NVIDIA 一超，云厂加 capex

GPU

NVIDIA 仍然独霸——2025 年数据中心 GPU 市占率>90%。旗舰产品演进： - H100 (Hopper) → H200 → B100/B200 (Blackwell, 2025 量产) → Rubin (2026-2027)

挑战者： - AMD MI300X / MI325X：第二名，生态在建 - Google TPU v5p / Ironwood v7：自用为主，Gemini 训练 - Amazon Trainium 2 / 3：AWS 自研，Anthropic 深度合作 - Cerebras / Groq：推理专用芯片，长尾玩家

云厂 capex 军备竞赛

根据 2025 Q4 财报摘要： - Microsoft FY26 capex 指引：$80B+** - Google 2025 capex：**~$75B - Meta 2025 capex：~$40B** - Amazon 2025 capex：**$100B+（含非 AI） - 四家合计 2025 capex 约 $300B——人类历史上最贵的短期资本投入

数据中心与电力瓶颈

美国：北弗吉尼亚、凤凰城、德州成为超级节点
缺电是真事——2025 年 Microsoft 重启三里岛核电站给 AI 数据中心供电
中国：国家数据局"东数西算"调度至西部绿电节点

四、应用层：从 Copilot 走向 Agent

Coding

格局清晰：Cursor（Anysphere） 在开发者中占据头部，Claude Code（Anthropic）、Windsurf、GitHub Copilot、字节 Trae 紧追。详见 AI Coding 产品格局。

搜索与浏览器

Perplexity 开辟新品类，收购 Comet 推浏览器
OpenAI SearchGPT / ChatGPT Search
Google AI Overviews 直接融入主搜
详见生成式搜索革命

企业工具

Glean（企业内搜）、Harvey（法律）、Hebbia（投研）、Abridge（医疗）——每个垂直都跑出 2-3 家头部
AlphaSense 在投研侧吃金融场景（详见 AI 金融板块）

Agent

通用 Agent（还在雏形）： - Claude Code 与 Computer Use：Anthropic 工程味道最浓 - ChatGPT Operator / Agent mode - Manus（中国）、OpenAI Swarm 等实验

垂直 Agent：Devin（Cognition）已从狂热回归理性；Sales / Support / Recruiting 垂直 Agent 开始兑现 ROI。

五、2026 的五个关键变量

1. 推理成本下降速度

基准：GPT-4 API 输入 token 价格从 2023 Q1 的 $30/M 降到 2025 Q4 的 ~$2.5/M（~12× 降）
如果 2026 再降 10×：Agent / 搜索 / 个性化完全重构；当前应用层估值合理
如果降速放缓：头部模型公司财务迅速恶化

2. Agent 能力跃迁

关键观察指标：多步任务完成率（METR 评测、OSWorld、SWE-bench）
2024→2025 这一年 Agent 能独立完成的任务长度从分钟级→小时级
2026 要看能不能到天级 / 工作日级

3. 中美技术管制

美国对中国：GPU 出口、EDA 工具、HBM 设备（详见 AI 训练基础设施 GPU 供需与云厂商格局）
中国对内：大模型备案、内容安全（算法备案 + 深度合成备案）
欧盟：AI Act 第一波合规截止（2026-02 GPAI 条款生效）

4. 开源 vs 闭源路线

DeepSeek V4 / Llama 5 / Qwen 4 会不会继续缩小差距
Meta 会不会在某一代开始闭源最强的那款（有先例，Llama 4 Behemoth 未公开 weights）

5. 算力资本支出的可持续性

问题：**四大云厂 $300B+ 的 capex**，与 AI 相关的**年度收入**（~$50-80B 量级，2025）之间差了 4-5x
历史上所有基础设施超投期最终都会经历一次痛苦的出清（铁路、电信、互联网）
这次不同的理由是——"AI 赚钱的是应用，基础设施只是成本" ≠ 历史上的超投 —— 我个人对这个理由持保留态度

六、我的判断

我的看法：2026 年最可能发生的 3 件事是——

推理模型大幅降价（Claude、Gemini、DeepSeek 继续压低 Token 成本到当前 1/3-1/5）

至少一家中国大模型公司停止基础模型训练，转向应用（"六小虎"继续分化）

一次明显的基础设施市场震荡（某个云厂 capex 回撤或超大单毁约），触发估值 re-rating；但不是崩盘

最不确定的是：Agent 能不能在今年兑现"小时级→工作日级"的跨越。如果能，所有基础模型公司的收入曲线会大幅上修；如果不能，商业化压力会迫使路线再分化。

我可能错在哪里：

路线可能没收敛：我假设推理模型是主流方向，但某一个新范式（如 world models、agentic pre-training）可能再一次洗牌

中国公司可能更强：从技术人才密度和工程速度看，中国梯队的追赶不排除再做出一个 DeepSeek 级别的惊喜

capex 拐点可能晚于预期：只要"AI 收入年增速 > capex 折旧速度"成立，基础设施就能继续烧；而收入增速很可能被低估

七、延伸阅读

同板块深度文章： - 大模型技术路线对比：Dense / MoE / Reasoning - 推理模型专题：从 o1 到 R1 到 Claude Sonnet 4.6 - AI 训练基础设施：GPU 供需与云厂商格局 - AI Agent 行业现状与路线分歧 - 中国 AI 梯队结构

公司级深挖： - Anthropic · OpenAI · Google DeepMind - DeepSeek · Moonshot 月之暗面

姐妹站： - 想看大模型技术原理（Transformer / Diffusion / RLHF / Constitutional AI）：去 AI Notes · 人工智能学习笔记

信息源

Stanford HAI, AI Index Report 2026 (2026-04)
Nathan Benaich, State of AI Report 2025 (2025-10)
Epoch AI · Artificial Analysis · API 价格追踪（持续更新）
SemiAnalysis · 算力与 GPU 供需深度
McKinsey State of AI 2025 · 企业采用数据
OpenAI / Anthropic / Google / NVIDIA 最新财报与 earnings call transcripts
The Information · 独家爆料（需订阅）
晚点 LatePost · 中文一手