【系统学AI】10 Anthropic Agent设计理念:从五种模式到Computer Use的进化
Anthropic 2024.12发布的《Building Effective Agents》是Agent设计领域最务实的文章。2025-2026年Anthropic又推出了Computer Use2024.10、Claude Code2025.02、Agent SDK2025.09、Subagents、Memory机制等一系列实践。这篇文章把2024原文2025-2026演进合在一起讲透。一句话总结Anthropic的核心观点从最简单的方案开始只在必要时增加Agent的自主性。Workflow人定义路径解决80%的问题Autonomous AgentAI定义路径只用于剩余20%。2025-2026新增Computer Use让Agent能操作电脑Constitutional AI 2.0用宪法原则做RLAIFSubagents是生产唯一稳定的多Agent模式。1. Agent的定义Anthropic对Agent的定义非常精确Agent LLM通过动态决策来控制循环和工具使用的系统。关键词是动态决策——如果执行路径是预设的那不是Agent是Workflow。1.1 两类系统类型决策者路径示例Workflow人预定义RAG管线搜索→筛选→生成AgentAI动态自主完成调研竞品并写报告1.2 为什么这个区分重要因为自主性不是免费的——Agent越自主越不可预测越难调试成本越不可控。Anthropic的建议是能用Workflow解决的不要用Agent。2. 六种设计模式2.1 Pattern 1: Prompt Chaining最简单的Workflow——线性串联多个Prompt。Prompt 1: 翻译文本 → 输出 ↓ Prompt 2: 校对翻译 → 最终输出优势劣势简单可控无法并行每步可独立调试串联延迟叠加适合流水线任务不适合需要动态调整的任务典型场景翻译校对、摘要扩写、代码生成代码审查2.2 Pattern 2: Routing根据输入类型路由到不同处理路径。输入 ↓ 分类器 / | \ 客服 技术 销售 ↓ ↓ ↓ 处理A 处理B 处理C优势劣势专业化处理分类错误导致路由错误避免一个Prompt做所有事需要维护多条路径典型场景客服系统FAQ/技术问题/投诉分流、多领域问答2.3 Pattern 3: Parallelization多个任务并行执行结果汇聚。输入 / | \ 任务A 任务B 任务C \ | / 汇聚 ↓ 输出两种汇聚方式Sectioning把大任务拆成多个子任务并行如长文档分段总结Voting同一任务跑多次投票取多数如代码审查多角度检查2.4 Pattern 4: Orchestrator-Workers一个指挥官动态分配任务给工人。Orchestrator: 分析任务动态分配 ↓ ↓ ↓ Worker 1 Worker 2 Worker 3 (搜索) (分析) (写作) ↓ ↓ ↓ Orchestrator: 汇聚结果分配下一轮与Routing的区别Routing的分类是预设的Orchestrator的分配是动态的。典型场景复杂代码重构Orchestrator分析代码动态分配不同文件的修改任务2026演进Orchestrator-Workers模式已在Claude Code中产品化为Subagents——主Agent通过Task工具调度子Agent子Agent有独立上下文窗口。2.5 Pattern 5: Autonomous Agent完全自主的Agent——AI自己决定做什么、怎么做。任务 → Agent自主循环(思考→行动→观察) → 完成或超时优势劣势灵活度最高最不可预测适合开放性任务成本不可控能处理意外情况难以调试典型场景SWE-bench代码修复、开放式调研2.6 Pattern 6: Computer Use Agent ⭐ 2025新增Anthropic 2024.10首发的新模式——Agent通过看屏幕、移鼠标、敲键盘来操作真实电脑。任务打开Excel填入财报数据导出PDF 1. 截屏 → Claude看屏幕 2. Claude决策点击Excel图标 3. 执行鼠标点击坐标(100, 200) 4. 截屏 → 验证Excel已打开 5. ... 循环至任务完成优势劣势突破API依赖——能操作任何应用不稳定屏幕识别可能错位适合传统软件无API的场景慢每步要截屏理解真正的数字员工安全风险高典型场景浏览器自动化、桌面应用操作、传统软件迁移、合规审计从Tool Use到Computer UseTool Use是调用程序员定义的APIComputer Use是像人一样操作任何软件。前者受限于API开放程度后者覆盖所有桌面应用。代价是3-5倍的成本和延迟。3. 模式选型决策树2026版你的任务是否需要动态决策 ├── 否 → 用Workflow │ ├── 多步骤→ Prompt Chaining │ ├── 多类型→ Routing │ └── 可并行→ Parallelization └── 是 → 需要多大自主性 ├── 中等任务清晰工具明确 → Orchestrator-Workers / Subagents ├── 完全开放探索 → Autonomous Agent └── 需要操作传统软件→ Computer Use AgentAnthropic的核心建议“When building with LLMs, start with the simplest solution and only add complexity when needed.”用LLM构建时从最简单的方案开始只在必要时增加复杂度。4. Constitutional AI 2.0 ⭐ 2026更新Constitutional AIAnthropic 2022年提出的对齐方法用宪法原则指导AI裁判做RLAIF基于AI反馈的强化学习。2026年升级到Constitutional AI 2.0加入了Computer Use场景的安全原则。4.1 经典Constitutional AI流程Step 1: AI生成回答 自我批评 模型生成回答 → 对照宪法原则自我批评 → 生成修改后的回答 Step 2: AI标注偏好 用另一个模型对(原始回答, 修改后回答)做偏好标注 Step 3: 训练RM PPO 用AI标注的数据训练RM再做PPO4.2 2026 Constitutional AI 2.0新增原则适用场景可逆性原则Computer Use中优先选可撤销的操作审计追溯所有Agent操作必须有日志权限最小化只请求必要的工具/文件权限求澄清优先不确定时主动询问而非猜测“Claude 4.7 知道何时停下来主动求澄清知道何时果断退出死胡同——这是Constitutional AI 2.0的训练成果。” —— Anthropic 20265. Agent设计的工程实践5.1 工具设计原则原则说明反例清晰的输入输出工具接口要明确“处理一下这个”错误信息有用返回文件不存在而非错误“操作失败”幂等性重复调用不产生副作用每次调用都发邮件沙箱执行代码执行在隔离环境直接在主机执行少而精2026新增10个好工具 50个普通工具给Agent 100个工具反而困惑Anthropic实战经验Claude Code内置工具集只有10个左右Bash/Edit/Read/Write/Glob/Grep/WebFetch/WebSearch/Task覆盖了几乎所有正经的coding任务。5.2 安全护栏# 工具执行前的安全检查defsafe_execute(action):# 1. 检查工具是否在白名单ifaction.toolnotinALLOWED_TOOLS:returnError: tool not allowed# 2. 检查参数是否安全ifcontains_sql_injection(action.params):returnError: potentially unsafe input# 3. 检查执行频率ifrate_limited(action.tool):returnError: rate limit exceeded# 4. 危险操作需要确认Computer Use场景ifaction.toolinDESTRUCTIVE_TOOLS:ifnotget_user_confirmation(action):returnCancelled by user# 5. 执行returnexecute(action)5.3 成本控制策略说明2026实现最大步数限制Agent循环不超过N步Claude Agent SDK内置Token预算单次任务消耗Token不超过MMemory Compaction自动压缩小模型路由简单步骤用轻量模型DeepSeek V4-Flash / GPT-4.1 nano缓存相同输入不重复调用LLMPrompt Caching省80%Subagent隔离2026新增长任务下放SubagentClaude Code Task工具6. 从Workflow到Agent的渐进路径2026版不要一步到位上Autonomous Agent而是逐步增加自主性第1步: Prompt Chaining验证流程可行性 ↓ 第2步: Routing处理不同输入类型 ↓ 第3步: Orchestrator-Workers / Subagents动态分配任务 ↓ 第4步: Autonomous Agent必要时才上 ↓ 第5步: Computer Use Agent最后的瑞士军刀每一步都验证效果和成本只有当前一步无法满足需求时才引入更复杂的模式。7. Anthropic 2025-2026 实战案例7.1 Claude CodeClaude Code是Anthropic自家用Claude Agent SDK打造的编程Agent2025.05 GA。架构特点Autonomous Agent Subagents混合内置10个核心工具文件-based Memory跨session保留Skills机制可重用提示片段自动上下文压缩处理数小时长任务实战数据Boris ChernyClaude Code作者发布时用它完成5%日常编码Claude 4上线后跳到30%2026年达到100%。7.2 Computer Use生产部署Anthropic Claude桌面应用 Computer Use2026.03Pro/Max用户macOS全面支持Windows即将跟进配合/schedule实现定时自动执行实测SWE-Bench从2024年个位数到2026年Q1的80.8%3年提升一个数量级。7.3 Skill机制 ⭐ 2026SkillsClaude Code 2026新增的可重用提示片段。比如定义一个代码审查Skill包含完整的审查Prompt 工具调用方案之后调用/skill code-review直接复用。这是把提示工程产品化为技能库。8. 面试高频问题Q1Anthropic为什么建议优先用Workflow而不是Agent三个原因(1) Workflow确定性高容易调试和维护(2) Agent的自主性带来不可预测性和成本膨胀(3) 80%的任务用Workflow就够了Agent只解决剩余20%。Q2Orchestrator-Workers和Multi-Agent有什么区别Orchestrator-Workers是中心化架构一个Orchestrator控制所有WorkersMulti-Agent可以是去中心化的Agent间平等通信。前者更可控后者更灵活。2026年Anthropic实战表明SubagentsOrchestrator-Workers的具体实现是生产唯一稳定的多Agent模式。Q3如何判断任务需要Autonomous Agent(1) 任务步骤无法预定义(2) 需要根据中间结果动态调整策略(3) 涉及不可预测的外部环境。如果三个条件都不满足用Workflow。Q4Computer Use什么时候才该用只有在以下条件都满足时考虑(1) 必须操作传统软件且无API(2) 任务可逆或风险可控(3) 能接受3-5倍的成本和延迟(4) 有审计需求。绝大多数场景用MCP Tool Use即可。Q5Constitutional AI 2.0新增了什么针对Computer Use场景加入了可逆性原则、审计追溯、权限最小化、求澄清优先四条新宪法。核心目标是让Agent在操作真实环境时主动避免不可逆的错误——这是2026年Agent OS化的安全基础。Q6Anthropic的Skill机制是什么Skill是可重用的提示片段用文件的方式存储调用。比如/skill code-review触发完整的代码审查流程。这把Prompt Engineering产品化为技能库管理让最佳实践可复用、可分享、可版本化。总结模式自主性复杂度适用场景2026状态Prompt Chaining最低最低线性流水线经典Routing低低多类型输入分流经典Parallelization低中可并行的任务经典Orchestrator-Workers中中动态分配任务演进为SubagentsAutonomous Agent高高开放性任务经典Computer Use Agent最高最高操作传统软件2025新增Anthropic的设计理念之所以是业界标杆因为它不贩卖焦虑给的是务实的渐进路径——从最简单的方案开始只在必要时增加复杂度。这个原则适用于所有AI系统设计。2025-2026的关键演进Computer Use让Agent突破API边界SubagentsOrchestrator-Workers产品化成为生产唯一稳定的多Agent模式Constitutional AI 2.0加入可逆性、审计追溯等新原则Skills机制把Prompt工程产品化路易乔布斯 © 2026 | AI Agent RAG学习计划 · 模块01-Agent · 第五篇参考文献Anthropic, “Building Effective Agents”, 2024.12Anthropic, “Computer Use API”, 2024.10Anthropic, “Claude Code Documentation”, 2025.05Anthropic, “Constitutional AI 2.0”, 2026Anthropic, “Claude Agent SDK”, 2025.09