搞完 Hermes Kanban 我才发现,多 Agent 协作根本不是在演戏
最近 Hermes 更新后出了一个 Kanban 的功能。做过敏捷开发的同学应该秒懂——每天站会盯着那块白板谁的卡片卡在哪一列一眼就知道。但这个 Kanban 可不是给人用的。移动卡片的不是人是 Agent。状态流转、失败重试、Agent 交接——全自动。思路跟之前一样不让一个 Agent 干所有的事把大任务拆小分给不同角色各干各的。上一篇我提过协作是能力的放大器不是补丁。放到 Kanban 里也一样。说实话这个操作真的有点像团队里项目经理拆完需求往看板上一贴各人领各人的活。只不过这次领活的全是 AI。两个入口同一块看板Hermes Kanban 有两套操作方式Agent 那边通过内置的工具函数kanban_create、kanban_complete、kanban_block 等自动驱动看板你这边通过 hermes kanban … 命令行或者 /kanban 斜杠命令来操作。两套入口读写的是同一个 kanban.db数据完全一致——Agent 在里面干活你在外面看进度、留言、解除阻塞互不冲突。飞书、Discord、Telegram 这些网关里也能直接用 /kanban list、/kanban create 操作看板不用切到终端。如果你用过飞书的话想象一下你在飞书群里发一句 /kanban create “写一篇Kanban教程” --assignee writer然后切到浏览器看 Dashboard任务已经在看板上了Agent 正在认领、执行。这个体感跟你在飞书里给同事派活没什么区别。从零开始先跑通一个最简单的任务别着急搞什么多 Agent 并行、任务依赖链。我们先从最基础的开始创建一个任务让一个 Agent 把它做完。第一步准备 ProfileHermes 里的 Profile 就是你给 Agent 准备的岗位说明书。你想让它干什么活就给它配什么身份。如果你还没创建过 Profile先建几个常用的hermes profiles create researcher # 调研员hermes profiles create writer # 写手hermes profiles create coder # 开发者hermes profiles create video-worker # 视频创作者每个 Profile 可以配自己的技能Skills、工具Tools和记忆Memory。这不是今天的重点知道有这回事就行。第二步初始化 Kanban 启动网关hermes kanban init # 创建 kanban.db其实这步可以省第一次跑任何 kanban 命令都会自动初始化hermes gateway start # 启动网关里面内置了 Dispatcher调度器Dispatcher 你可以理解成一个工头。它每隔 60 秒扫一遍看板看看有没有 Ready 状态的任务有的话就分配给对应的 Agent 去干。Agent 崩了、超时了它也负责回收和重新分配。hermes dashboard # 打开浏览器看看 Kanban 长什么样六列状态从左到右Triage待梳理→ Todo待办→ Ready就绪→ In Progress进行中→ Blocked阻塞→ Done完成。第三步创建一个任务hermes kanban create make a video about kanban \ --assignee video-worker \ --tenant video-pipeline这条命令做了三件事1.在看板上新建了一张卡片2.指定 video-worker 这个 Profile 来干活3.用 --tenant 给任务打了个标签方便按项目筛选跑完之后Dispatcher 下一次扫描最多等 60 秒就会把这个任务分配给 video-worker然后自动启动一个 Agent 进程来执行。你也可以点 Dashboard 上的Nudge dispatcher按钮让它立刻调度不用等。如果任务被 Blocked 了新手最容易在这里懵。你兴高采烈地创建了任务结果一看状态——blocked。hermes kanban listBoard: default (1 other board — hermes kanban boards list)⊘ t_058c4d9c blocked video-worker [video-pipeline] make a video about kanban别慌Blocked 不是报错是 Agent 在等你的输入。我只说了make a video about kanbanAgent 不知道要什么角度、多长、给谁看它就主动 Block 自己在评论区留下了问题。用 context 命令看看它到底在问什么hermes kanban context t_058c4d9c输出大概长这样hermes kanbancontextt_058c4d9c# Kanban task t_058c4d9c: make a video about kanbanAssignee:video-workerStatus: blockedTenant: video-pipelineWorkspace:scratch/Users/USERNAME/.hermes/kanban/workspaces/t_058c4d9c## Prior attempts on this task### Attempt 1 — blocked (video-worker, 2026-05-10 20:59)make a video about kanban—need spec:whatangle(intro/tips/comparison/tutorial)?duration?audiencelevel?existingsourcematerial?isthereanarticleorblogposttoconvert,orstartfrom scratch?Agent 问得挺具体的什么角度多长受众什么水平有没有现成素材回答它hermes kanban comment t_058c4d9c 做一个入门教程视频时长1分钟左右受众是完全不懂kanban的小白基于我们之前的讨论内容来讲再解除阻塞hermes kanban unblock t_058c4d9cDispatcher 会重新调度这个任务video-worker 拿到你的回答后继续工作。踩坑提醒comment 和 unblock 是两步操作别忘了 unblock。光留言不解除阻塞任务是不会动的。整个流程用一张表总结跑通这个基本流程Hermes Kanban 你就已经能上手干活了。进阶一句话让 Agent 自己拆任务上篇文章发出来后评论区问得最多的一个问题能不能在飞书里搞当时那篇讲的多 Agent 协作要在 Discord 里配群组、配 bot、调 mention流程确实绕。不少人看完觉得东西是好东西但我团队用飞书啊。现在有了 Kanban不用那么复杂了。你在飞书里发一句话Agent 自己拆、自己跑、自己交接。不用配 Discord 群组不用调 bot 权限不用管 mention 那些坑。前面的例子是你手动创建一个任务Agent 来执行。但任务复杂了怎么办比如做一个 90 秒的 Hermes 介绍视频——这明显不是一个 Agent 能搞定的你得有人调研、有人写脚本、有人生成视频。手动拆可以但累。有了 Kanban之前那套复杂的 IM 机器人配置直接省了变成对话即工作流。你只需要在飞书里说一句话创建一个 Hermes Agent 功能介绍视频的任务分配给 researcher 调研核心功能亮点再让 writer 写视频脚本最后让 video-worker 生成 90 秒横版视频。Agent 收到后自动拆成这样T1 t_f3021692 [researcher] 调研 Hermes Agent 核心功能亮点 ✅ ready ↓T2 t_391e4acc [writer] 撰写 90 秒中文视频脚本 ⏳ 等待 T1 ↓T3 t_8ca0e4dc [video-worker] 生成 90 秒横版视频 ⏳ 等待 T2T1 跑完后 T2 自动变成 ReadyT2 完成后 T3 接上。全程不需要你介入。你在飞书里当甩手掌柜Agent 在后台卷生卷死。整个过程不需要写一行命令不需要手动指定 --parent不需要管依赖关系——orchestrator 自己判断、自己建、自己跑。这就是 Kanban 里 orchestrator 角色在干的事。你给它一个目标它自动拆子任务、建依赖、分配 Agent。你在飞书里聊天就能驱动多 Agent 协作跟给同事派活一样。Dashboard 里也能实时看到每个子任务的状态哪个在跑、哪个在等、哪个卡住了。喜欢终端的话hermes kanban watch 也能实时看任务的生命周期——created → linked → claimed → spawned → completed每一步都有日志。最终 video-worker 产出的视频长这样当然学习阶段你想精确控制每一步也可以自己手动创建任务链# 第一步T1$(hermes kanban create 调研 Hermes 核心功能 \ --assignee researcher --tenant video-pipeline --json | jq -r .id)# 第二步依赖 T1T2$(hermes kanban create 写视频脚本 \ --assignee writer --tenant video-pipeline \ --parent $T1 --json | jq -r .id)# 第三步依赖 T2hermes kanban create 生成视频 mp4 \ --assignee video-worker --tenant video-pipeline \ --parent $T2两种模式的区别看这张图到这里单个看板上的玩法就讲完了——从手动建单任务到 Orchestrator 一句话自动拆入门到进阶的主要场景都覆盖了。但如果你跟我一样同时在做公众号内容、客户项目、日常杂事全堆在一个 default 看板上任务一多就眼花。Boards一个项目一块看板Hermes Kanban 支持多看板Boards每个 Board 的数据库、工作空间、调度器完全隔离。下面这张图一看就懂操作也简单hermes kanban boards create blog-content # 新建一个叫 blog-content 的看板hermes kanban boards switch blog-content # 切到这个看板hermes kanban boards list # 看看有哪些看板hermes kanban boards show # 当前在哪个看板切到某个 Board 后你所有的 hermes kanban 命令都只操作那个 Board不影响其他的。也可以不切换直接用 --board 参数操作指定看板hermes kanban --board blog-content listhermes kanban --board client-projects create 做客户项目需求分析 --assignee researcher对比一下Boards 就是干这件事的一个项目一块看板互不干扰。底下跑的是什么聊聊核心机制前面讲的都是怎么用这里说说为什么跑得动。整套系统围绕本地 SQLite 数据库转。每次 Agent 认领任务是原子事务——多个 Agent 竞争同一个任务时只有一个能拿到不会出现两个 Agent 同时干同一件事。Agent 崩了Dispatcher 通过进程存活检测kill(pid, 0)自动发现回收任务重新分配。连续失败三次还触发熔断任务自动锁定等人工介入不会让看板空转。任务之间可以建父子依赖。上游完成后的摘要和元数据自动传给下游 Agent。T2写脚本能知道 T1调研发现了什么——不是靠翻聊天记录是结构化的数据交接。拿我们刚跑的视频任务来说hermes kanban show t_391e4acc 能看到 T2 的完整信息Task t_391e4acc: 撰写 Hermes Agent 功能介绍视频脚本 status: done assignee: writer parents: t_f3021692 children: t_8ca0e4dcBody:请根据 researcher 的调研结果撰写一份 Hermes Agent 功能介绍视频脚本...上游调研任务 workspace 路径: ~/.hermes/kanban/workspaces/t_f3021692/Kanban 里每个任务有自己独立的 workspace 目录。T1researcher跑完后调研文档、notes、summary 都落在自己的 workspace 里。T2 的 body 里写了上游 workspace 路径——writer 启动后直接去那个目录读文件拿到 T1 的全部产出。T1 完成时还会写一个 summary说自己做了什么、产出了哪些文件、关键结论。下游 Agent 同时看两样东西T1 的 summary快速了解全貌和 T1 workspace 里的实际文件拿具体内容。这就是 Kanban 的传参方式——文件式交接 任务状态推进不是共享上下文。官方文档里列了一些协作模式挑几个常用的Web Dashboard 通过 WebSocket 实时推送事件不用刷新页面就能看到任务状态变化。跟 delegate_task 有什么区别如果你之前用过 Hermes 的 delegate_task子 Agent 委派可能会想这跟 Kanban 有什么不一样一句话delegate_task 是函数调用Kanban 是工作队列。要一个快速的问答结果用 delegate_task。跨 Agent 的、需要人工介入的、要活过重启的复杂任务用 Kanban。两者可以共存——一个 Kanban Worker 执行任务的过程中内部完全可以用 delegate_task 去问另一个 Agent 一个小问题。写在最后多 Agent 协作这件事之前总觉得演示看着酷真用起来不太行。以前搞多 Agent要么是一个 Agent 内部疯狂调子 Agent上下文越来越乱要么是多个 Agent 各跑各的没有统一的地方看进度。Kanban 把任务拆解、分配、执行、交接、失败重试、人工介入这些事情拉到了一个看板上。打开 Dashboard 就能看到所有 Agent 在干什么、卡在哪、产出了什么。如果你之前看过我那篇 Hermes 多 Agent 的文章这篇算是它的实战升级版。建议先从最简单的单任务跑起来跑通了再试任务链最后再玩 Orchestrator 自治拆解。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】