AI Agent 行业现状与路线分歧

最后更新：2026-04-23

2024 年 Agent 是 AI 产业的流行词；2025 年开始从 demo 走向实际产品；2026 年要回答一个关键问题——Agent 能不能从"小时级任务"跨越到"工作日级任务"。

一句话结论

Agent 当前正处于 pre-chasm 阶段（借 Crossing the Chasm 框架）——有 Early Adopter 热情但完整解决方案不足，主流企业采用仍需 12-24 个月。

通用 Agent vs 垂直 Agent 路线分歧：前者追求"通用助手"（ChatGPT Agent / Claude Computer Use），后者在特定垂直（Harvey 法律 / Devin 编程 / Abridge 医疗）做深
成功率依然是硬门槛：通用 Agent 在多步任务的零样本成功率仍 <30%（OSWorld / BEHAVIOR）
Coding Agent 跑得最快：因为有天然评判信号（代码是否跑起来），已进入企业 Early Majority

Agent = LLM + 工具调用 + 任务分解 + 自我纠错循环。

最简定义（OpenAI 2024）：

Agent = LLM 系统能够无需人类持续干预完成跨多步骤、可能跨工具 / 跨系统的目标

区别： - Chatbot：一次 input → 一次 output - Copilot：建议下一步，人工决策 - Agent：自主执行多步骤，人工事后 review

产品	公司	状态
ChatGPT Agent（原 Operator）	OpenAI	2025-Q1 Pro 订阅开放
Claude Computer Use	Anthropic	2024-10 预览，2025-Q2 稳定
Gemini with Agent capabilities	Google	Workspace 集成
Manus	中国 Monica AI	2025 爆火，能力争议
Devin	Cognition Labs	2024 轰动，2025 回归理性

编程（最成熟） - Cursor / Claude Code / Windsurf / GitHub Copilot / 字节 Trae - 详见 AI Coding 产品格局

法律 / 合规 - Harvey AI（2024 估值 $3B） - Thomson Reuters CoCounsel - Hebbia（投行、尽调）

医疗 - Abridge（临床文书） - Nabla / OpenEvidence - Epic AI copilot

销售 / 客服 - Sierra（Bret Taylor 创立） - Ada / Forethought - 蚂蚁"支小宝"等中国银行客服

招聘 / HR - Mercor（标注用人才市场） - Fetcher / Paradox

代表：ChatGPT Agent / Claude Computer Use

思路：做通用的"操作系统级 Agent"，能用任何软件、完成任何任务

挑战： - 成功率低（每步 95% 成功 → 20 步串联只有 36% 成功） - 安全与权限问题大 - UI 交互（从"聊天"到"代替用户操作"）用户接受度未验证

代表：Harvey、Abridge、Sierra

思路：选一个窄垂直，做到完整解决方案（whole product）

优势： - 可以针对场景做护栏（评估函数、审核流程） - 客户付费意愿清晰（替代人工成本） - 完整解决方案包括集成、合规、培训

挑战： - 市场规模有限 - 被通用 Agent 追赶的风险

代表：Claude Code / Cursor / Devin

思路：编程有天然评判信号（代码跑不跑）—— 先在编程赛道积累 Agent 能力，再扩张

跑得最快的原因：RL 训练信号清晰、用户容忍度高（程序员能自己 debug）

核心 gap：长时程（hours → days）× 零样本 × 高成功率——三个维度同时满足仍是研究问题。

战略含义：如果你是 startup，不要做通用 Agent（Volume 跑不赢 OpenAI/Anthropic）——选一个垂直死磕。