搞懂 Claude Code 的 Agent 编排原理，我再也不一个个对话了

张

张建站

2026/5/24 15:56:38

10分钟阅读

你现在的用法大概是这样的打开一个 Claude Code 对话把任务描述扔进去等它一步步做完中途如果超出 context 就再开一个新对话然后把前面的结论复制过来接着跑。这没有任何问题——直到任务变得复杂。一个涉及十几个模块的重构一次需要同时分析前后端代码的 bug 排查一个要并行生成多个微服务脚手架的需求。这时候你会发现一个对话窗口就像让一个人既写代码又做设计还要跑测试效率瓶颈不在于他够不够聪明而在于他只有一双手。Claude Code 从 1.x 版本开始系统性地引入了多智能体编排能力。说白了就是让你可以把任务分发给一批并行工作的 AI 实例每个实例有自己独立的上下文和工具权限。这篇文章是我踩过坑之后整理的实战指南从 Sub-agents 到 Agent Teams从配置方法到实际限制能用的我都写进来了。核心洞察多智能体的本质不是「更聪明的 AI」而是「用空间换时间」——用多个并行 context 换取任务的并行执行。一个对话解决不了大任务在讲怎么用之前先说清楚为什么需要。这个问题的答案不是「因为多智能体很酷」而是有具体的工程限制在里面。Context window 是硬约束不是软限制。即使 Claude 支持 200K token 的上下文一个复杂的全栈项目跑下来代码文件、工具调用结果、中间推理过程加在一起很容易超出。更关键的是context 越长模型的注意力就越分散——不是说它记不住早期内容而是在海量信息中提取关键信号的能力会下降。这在 Anthropic 自己的研究报告里有明确提及。任务天然有并行结构但单对话是串行的。想想一个典型的代码评审场景安全漏洞检查、性能分析、代码规范审核、测试覆盖率评估——这四件事之间几乎没有数据依赖完全可以同时做。但在单对话里你只能一件一件排队。错误传播没有隔离。在一个对话里如果某个中间步骤推断错了后续所有步骤都会在错误的前提上继续构建。多智能体架构让你可以用「竞争假设」模式——让两个 agent 分别从不同角度分析同一个问题最后合并结论这在排查诡异 bug 时特别有用。Anthropic 的官方文档给出了一个相对克制的建议不是所有任务都适合多智能体。判断标准是任务是否可以清晰分解子任务之间是否可以并行错误容忍度有多高如果这三个问题的答案都是「是/高/高」那多智能体值得上。如果你只是想跑一个简单脚本开一个对话就够了别过度工程化。CLAUDE CODE 的三层「并行」架构在具体讲每种方案之前先建立一个整体认知框架。Claude Code 的多智能体能力实际上分三层。第一层主对话Main Session就是你直接交互的那个窗口没什么特别的。第二层Sub-agents子智能体是由主对话按需创建的专家实例。每个子智能体有独立的 context window有预设的工具权限范围完成任务后把结果返回给主对话。通信是单向的主对话分发任务子智能体上报结果子智能体之间不能直接通信。第三层Agent Teams团队模式是目前还在实验阶段的高级功能。它引入了 Team Lead Teammates 的概念成员之间可以双向通信共享一个任务列表适合需要协作推理的复杂场景。image-20260330193940048三种模式的核心区别用一句话说通信方式决定了适用场景。单向分发适合任务独立的并行工作双向通信适合需要协作推理的复杂问题。token 成本上每个 agent 实例都独占一个 context window所以 agent 数量越多token 消耗线性增长。这三层之间有严格的创建权限约束。主对话可以创建任意子智能体Sub-agent 不能创建新的子智能体这是 Anthropic 刻意的安全设计Agent Teams 的 Teammate 本质是特殊的 Sub-agent同样受这个约束限制。理解这个层级关系能帮你避免在设计工作流时踩到权限边界的坑。另一个容易误解的点是多智能体并不等于更快。如果任务之间存在强依赖A 的输出必须作为 B 的输入那并行化毫无意义反而会因为协调开销而变慢。多智能体的加速效果来自于任务图中存在的并行分支不是靠堆 agent 数量。在实际使用中我的经验是先画出任务依赖图找出可以并行的分支再决定启动几个 agent而不是反过来。SUB-AGENTS最实用的「专家团队」Sub-agents 是当前最成熟、最实用的多智能体方案我在生产项目里用得最多的也是它。子智能体的运作原理每个子智能体本质上是一个带有特定系统提示和工具白名单的独立 Claude 实例。它有自己独立的 context window——这意味着它不会「看到」主对话里的历史只知道你分配给它的任务和它自己的工具调用记录。这个设计有两个好处一是 context 隔离让每个子智能体可以在干净的环境里专注于自己的任务二是工具白名单让你可以精确控制每个子智能体的权限范围比如只给代码评审 agent 读文件权限不给写权限降低误操作风险。Claude Code 内置了四个预设子智能体Explore负责代码库探索和理解只有读权限Plan负责任务规划和分解不执行实际操作General-purpose通用型工具集最完整Bash专门处理 shell 命令执行配置一个自定义子智能体内置的四个不够用怎么办写一个 YAML 配置文件。下面是一个 code-reviewer agent 的完整例子# .claude/agents/code-reviewer.yml # 放在项目根目录的 .claude/agents/ 下Claude Code 会自动加载 # 也可以放在 ~/.claude/agents/ 实现跨项目复用 name: code-reviewer description: | 专注于代码质量审查的专家 agent。适合在 PR 合并前对具体文件做深度审查。当你需要检查安全漏洞、性能问题或代码规范时code-reviewer 它。 # 系统提示决定了这个 agent 的「人格」和专业领域 # 写得越具体输出越稳定——模糊的提示会导致模糊的结果 system_prompt: | 你是一个经验丰富的 code reviewer专注于以下四个维度 1. 安全漏洞SQL 注入、XSS、SSRF、敏感信息泄露 2. 性能问题N1 查询、不必要的全表扫描、内存泄漏风险 3. 代码规范命名一致性、函数单一职责、注释完整性 4. 测试覆盖边界条件、异常路径、mock 使用是否合理输出格式要求 - 每个问题标注严重程度[CRITICAL] [WARNING] [SUGGESTION] - 每个问题提供具体的代码行号和修改建议 - 不要泛泛而谈每条评论要有具体的代码依据 # 工具白名单只给它读文件的权限 # 不给写权限是因为 reviewer 不应该直接修改代码——只能提建议 # 这个约束是刻意的防止 agent 在未经确认的情况下改动代码 tools: - read_file - list_files - search_files - bash # 需要 bash 来运行 lint 工具 # 限制可访问的目录防止它读到不相关的配置文件或密钥 allowed_paths: - src/ - tests/ - *.go - *.ts - *.tsx # 模型路由这个 agent 不需要最强的模型 # 用 claude-3-5-haiku 而不是 claude-opus-4token 成本大概降 80% # review 任务对推理深度要求不如架构设计高 model: claude-haiku-4-5三种调用方式自然语言调用在主对话里直接说「用 code-reviewer 帮我检查一下 src/auth/ 目录」Claude Code 会自动匹配并启动对应的子智能体。-mention 调用在对话里用code-reviewer明确指定比自然语言更精确适合你知道具体要用哪个 agent 的场景。Session 级别配置在CLAUDE.md里声明哪些 agent 默认激活这样不用每次手动指定适合固定工作流。!-- 在项目 CLAUDE.md 里加这一段 -- ## 默认 Agent 配置对于这个项目以下 agent 默认激活 - 每次修改 src/ 下的文件后自动触发 code-reviewer - 每次新建功能模块时先跑 plan 生成任务清单再执行踩坑一子智能体不能嵌套这是我踩过最让人头疼的坑。Sub-agent 在执行过程中不能再创建新的子智能体。也就是说你不能让code-reviewer在发现问题之后自动调起fix-agent来修复。这个限制是 Anthropic 刻意设计的目的是控制 agent 的行为边界防止递归创建导致资源失控。实际影响是如果你的工作流需要「发现问题 → 自动修复 → 验证修复」这种链式结构只能在主对话层面串联而不能在子智能体内部实现。设计工作流时要把这个约束考虑进去。AGENT TEAMS真正的「团队作战」Agent Teams 是 Claude Code 目前最激进的实验性功能它解决了 Sub-agents 最大的限制成员之间不能互相通信。和 Sub-agents 的本质区别在 Sub-agents 模式下所有子智能体都只和主对话通信彼此之间是信息孤岛。Agent Teams 引入了 Team Lead 角色Teammates 之间可以双向通信共享一个任务列表。image-20260330194131282说白了Sub-agents 是「星形拓扑」所有通信经过中心节点Agent Teams 是「部分网状拓扑」成员之间可以直接对话。这让一些原本无法实现的协作模式成为可能比如让两个 agent 互相质疑对方的结论。如何开启Agent Teams 目前需要手动启用在项目的.claude/settings.json里加一行{ experimental: { agentTeams: true }, env: { CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS: 1 }, team: { maxSize: 5, taskQueueSize: 30, coordinationModel: claude-opus-4-5, workerModel: claude-haiku-4-5 } }注意coordinationModel和workerModel分开配置——Team Lead 做协调和推理用强模型Teammates 执行具体任务用轻量模型。这是 oh-my-claudecode简称 OMC里的智能路由思路token 成本差异很显著。三个真实使用场景场景一并行代码评审同时启动安全审计 agent、性能分析 agent、代码规范 agent三个 teammate 分别分析同一批代码Team Lead 汇总结论并解决冲突。相比串行评审时间压缩到 1/3而且不同维度的分析互不干扰。场景二竞争假设调试遇到诡异的 bug 时让两个 agent 从不同假设出发各自排查——一个假设是并发问题另一个假设是数据序列化问题。两个 teammate 并行跑Team Lead 对比两条路径的发现这种「让 AI 互相打架」的方式在定位复杂 bug 时出奇地有效。场景三跨层变更做一个需要同时改动数据库 schema、后端 API、前端组件的功能时三个 teammate 分别负责各自的层Team Lead 维护变更依赖关系确保接口契约一致。踩坑二/resume 不恢复进行中的成员Agent Teams 有一个让人抓狂的已知问题如果一个 Team 任务中途中断比如你关掉了终端用/resume命令恢复 session 时已经在执行中的 teammate 不会被恢复只有 Team Lead 会重启它会以为所有子任务还没开始。实际后果是你可能看到重复执行——之前已经完成一半的任务被 Team Lead 重新分配导致文件被重复修改。规避方法在启动 Agent Teams 任务前在任务描述里明确要求 Team Lead 先检查文件修改时间戳判断哪些子任务已完成。这是一个 workaround不是根本解决方案——Anthropic 把这个问题列在了 known limitations 列表里预计后续版本修复。除了 /resume 问题当前 Agent Teams 还有这些已知限制每个 Team 的 teammates 上限是 10 个超出会静默失败任务队列在 session 结束后不持久化Teammate 之间的通信有延迟不是实时的不支持动态扩容mid-task 无法新增 teammate调试信息不够完整排查 teammate 行为比较困难与某些第三方 MCP 工具的兼容性还有问题高并发下偶发 race condition官方确认但未修复社区是怎么玩的OH-MY-CLAUDECODE 的实战经验光看官方文档容易陷入理论层面。我在 GitHub 上找到两个社区项目里面的实战经验比文档有用得多。oh-my-claudecodeOMC目前有 16,900 stars、1,200 forks2026年3月数据是 Claude Code 生态里最活跃的扩展框架之一。claude-howto有 8,900 stars更偏向知识整理。OMC 最有意思的设计是它的Teams-First pipeline把任务执行流程标准化为五个阶段plan任务规划 → prd需求细化 → exec并行执行 → verify验证 → fix修复每个阶段都有对应的 agent 配置和提示词模板可以单独使用某个阶段也可以串联整个流程。OMC 提供了 7 种执行模式其中最值得关注的是两个# ralph 模式持久化执行适合长时间运行的任务 # 它会自动处理 session 断开重连维护任务进度 /ralph 重构整个认证模块分离 JWT 逻辑和 OAuth 逻辑 # ultrawork 模式最大并行适合独立子任务密集的场景 # 它会自动评估任务依赖关系尽可能并行化 /ultrawork 给 user、order、payment 三个模块分别生成完整测试套件 # 普通的 team 模式启动方式 /team 分析这个 PR 的安全风险和性能影响输出评审报告OMC 声称它的智能模型路由可以节省30-50% 的 token 消耗。背后的逻辑是根据任务的推理复杂度自动选择模型——简单的文件读写和格式转换用 Haiku需要深度推理的架构决策用 Opus。这个数字在实际使用中是可信的我自己测下来大概在 35% 左右。OMC 的 CLAUDE.md 模板也值得参考它把 Anthropic 推荐的 3-5 人团队规模、每人 5-6 个任务的参数直接写进了模板配置你不用自己摸索起步规模。什么时候该用多智能体什么时候别用坦白讲我见过不少人把多智能体用成了「有锤子看啥都是钉子」的案例。所以这部分要讲清楚边界。判断框架用三个问题评估一个任务是否值得上多智能体1. 任务可以清晰分解吗如果子任务之间的边界模糊agent 之间的通信协调成本会超过并行带来的收益。比如「优化整个项目的代码质量」这种需求边界太模糊不如「分别优化 A/B/C 三个模块的代码质量」这种有清晰边界的需求。2. 子任务之间可以并行吗如果任务链是线性的A 的输出是 B 的输入B 的输出是 C 的输入多智能体几乎没有优势甚至因为通信开销而变慢。只有任务图中存在可以同时执行的分支并行才有意义。3. 错误代价有多高每个独立 agent 都可能犯独立的错误。在 Sub-agents 模式下子 agent 的错误如果没有被主对话捕获可能静默传播。在关键生产代码修改这种场景宁可慢一点用单对话配合严格的确认步骤。真实的 token 成本一个容易被忽略的问题是 token 成本不是线性的——它是乘法的。如果主对话消耗 20K tokens启动 5 个 Sub-agents 每个消耗 15K tokens总消耗是20K 5×15K 95K是单对话的将近 5 倍。Agent Teams 因为成员间通信还要加上协调本身的 token 消耗。Anthropic 的推荐起步规模是3-5 个 agent每个 agent 5-6 个任务。这个规模能平衡并行效率和成本控制。超过这个规模协调成本开始显著上升边际收益递减。实战建议先用 3 个 agent 跑根据实际任务完成时间和 token 消耗决定要不要扩。不要一上来就拉满。常见问题QSub-agents 和 Agent Teams 能同时用吗可以但要注意层级关系。Agent Teams 的 Teammate 本质上是特殊的 Sub-agent所以「Teams 里的 Teammate 调用外部 Sub-agent」这种嵌套不支持会触发前面说的嵌套限制。保持结构扁平是最稳的做法。Q子智能体的 context window 大小和主对话一样吗默认是一样的都是模型的最大上下文。但 OMC 的配置允许你为每个 agent 设置max_tokens限制主动缩小 agent 的 context 来降低成本。对于任务简单的 agent这是个有效的成本控制手段。QAgent Teams 现在稳定吗适合上生产吗不适合直接上生产。「实验性」这个标签是认真的——当前版本有 7 个已知限制session 恢复问题在关键场景下会造成重复操作。建议先在内部开发环境里用积累一段时间经验再评估。Qoh-my-claudecode 需要付费吗OMC 本身是开源免费的但它底层调用的 Claude API 正常收费。OMC 的价值在于它预配置好了一套合理的 agent 工作流省去了你自己摸索配置的时间。Q如果我用 Cursor 或者 Windsurf这些概念能迁移吗部分可以迁移。多智能体的思路是通用的但具体的配置格式YAML agent 定义、settings.json 字段是 Claude Code 特有的。Cursor 有自己的 Rules for AI 系统可以实现类似的专家角色划分但没有 Agent Teams 这种级别的协作通信机制。参考资料Claude Code 官方文档 - Sub-agentsClaude Code 官方文档 - Agent Teamsoh-my-claudecode GitHub — 16,900 stars实战配置参考claude-howto GitHub — 8,900 stars使用技巧整理Anthropic Blog - Building effective agents多智能体编排会成为 AI 编程的标配工作流还是会像微服务一样在被过度使用一段时间后回归理性我倾向于认为三年内会出现一批专门针对多智能体协调的工具和规范——就像容器编排从手工脚本演化到 Kubernetes 一样。那时候今天这些手工配置的 YAML大概会觉得很古朴。学习资源推荐如果你想更深入地学习大模型以下是一些非常有价值的学习资源这些资源将帮助你从不同角度学习大模型提升你的实践能力。一、全套AGI大模型学习路线AI大模型时代的学习之旅从基础到前沿掌握人工智能的核心技能因篇幅有限仅展示部分资料需要点击文章最下方名片即可前往获取二、640套AI大模型报告合集这套包含640份报告的合集涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师还是对AI大模型感兴趣的爱好者这套报告合集都将为您提供宝贵的信息和启示因篇幅有限仅展示部分资料需要点击文章最下方名片即可前往获取三、AI大模型经典PDF籍随着人工智能技术的飞速发展AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型如GPT-3、BERT、XLNet等以其强大的语言理解和生成能力正在改变我们对人工智能的认识。那以下这些PDF籍就是非常不错的学习资源。因篇幅有限仅展示部分资料需要点击文章最下方名片即可前往获取四、AI大模型商业化落地方案作为普通人入局大模型时代需要持续学习和实践不断提高自己的技能和认知水平同时也需要有责任感和伦理意识为人工智能的健康发展贡献力量。

扫雷游戏，简单C语言实现

扫雷游戏设计与实现：从零开始打造经典小游戏一、游戏设计思路1.1 核心玩法扫雷是一款基于二维网格的逻辑推理游戏，玩家通过点击格子排查地雷。游戏规则如下：安全格：显示周围8格地雷数量（0-8）地雷格&#xf…...

2026/5/24 13:45:11 阅读更多 →

AI审核如何守住数据底线？IACheck构建环境检测报告防篡改与一致性核验新机制

在环境检测行业中，“数据可信”始终是报告价值的核心。一份报告是否具有公信力，不仅取决于检测过程是否规范，更取决于最终数据是否真实、完整、不可篡改。然而，在实际业务中，数据从采集到报告生成要经过多个环节&#…...

2026/5/24 15:54:43 阅读更多 →

GD32F4时钟配置实战：从原理到避坑指南

1. GD32F4时钟系统基础认知第一次接触GD32F4系列MCU的时钟配置时，我完全被那些密密麻麻的时钟树框图吓到了。但后来发现，只要抓住几个关键点，整个时钟系统就会变得清晰起来。GD32F450这颗芯片的时钟架构其实可以想象成一个自来水厂——晶振是…...

2026/5/20 10:52:48 阅读更多 →

Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表·行业首曝）

更多请点击： https://kaifayun.com 第一章：Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表行业首曝） Midjourney 的渐变美学并非传统插值实现，而是由其隐式神经渲染器（Implicit Neu…...

2026/5/24 0:02:18 阅读更多 →

通过curl命令调试Taotoken大模型API，快速排查接入问题

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。 👉 点击领取海量免费额度通过curl命令调试Taotoken大模型API，快速排查接入问题在接入大模型服务时，直接使用HTTP请求进行调试是一种…...

2026/5/24 0:04:53 阅读更多 →

Kubernetes自定义资源：扩展Kubernetes API的能力

Kubernetes自定义资源：扩展Kubernetes API的能力一、Kubernetes自定义资源概述 1.1 自定义资源的定义 Kubernetes自定义资源（Custom Resource，CR）是指用户自定义的资源类型，它扩展了Kubernetes API，允许用…...

2026/5/24 0:08:11 阅读更多 →

Codeforces Round 1057

【打得太糖了】Codeforces Round 1057 (Div. 2) solve 3 题 https://www.bilibili.com/video/BV1Gi4nzYE66/ 【Codeforces Round 1057 (Div. 2)实况】好久没打cf了，只会A-D https://www.bilibili.com/video/BV12q4xzMEy5/ 憧憬成为 Master 第 29 集 —— 反向冲分 (…...

2026/5/24 0:10:42 阅读更多 →