Harness Engineer工程开发范式实战教程（非常详细），从入门到精通，收藏这一篇就够了！

张

张建站

2026/5/19 21:41:06

10分钟阅读

Harness Engineer工程开发范式实战教程（非常详细），从入门到精通，收藏这一篇就够了！

一、Harness Engineering 核心哲学1.1 什么是 Harness EngineeringHarness Engineering是 OpenAI 提出的 AI 原生开发方法论核心思想是“设计环境构建反馈回路让 Agent 自主运转”与传统软件开发不同Harness Engineering 强调地图式导航而非详细说明书知识嵌入仓库而非外部文档机械验证而非人工检查迭代自愈而非等待评审1.2 四项核心实践实践传统方式Harness 方式信息组织详细的手册和文档AGENTS.md 地图嵌入式知识规范传递口头传授、文档阅读lint 规则、自动化检查验证闭环人工 review、手动测试自动化测试、Agent 可观测错误修复等待人类介入1-3轮自动迭代收敛1.3 核心洞察模型能力是地基Harness 是上层建筑。投入产出比递减 - AGENTS.md 验证闭环 → 80分巨大提升 - 80分到95分 → 工程量可能是前面的10倍二、AI Coding 阶段论2.1 Steve Yegge 的八阶段模型阶段描述典型工具阶段1零 AI 或接近零 AI偶尔代码补全阶段2IDE 内 Agent需授权Copilot Chat、边栏 Agent阶段3IDE 内 AgentYOLO 模式关闭权限确认阶段4IDE 内Agent 全屏Agent 占满屏幕代码区变 Diff阶段5CLI单 AgentClaude Code、Codex CLI阶段6CLI多 Agent 并行3-5个实例同时工作阶段710 Agent手动管理触及手动管理极限阶段8构建自己的编排器自动化 Agent 工作流编排2.2 范式跃迁的关键节点IDE→CLI****的跃迁CLI 是一等公民本地、远程、CI 流水线环境一致端到端闭环读-改-跑-修是主路径无需配置长时自治可跑几十分钟甚至几小时失败自动重试人机分工清晰人是指挥官Agent 负责全部执行单 Agent → 多 Agent 的跃迁从 subagent 模式主-从到 mailbox 模式peer-to-peerAgent 之间直接协商、分工、同步进度无需中心调度器三、Harness 工程工作流3.1 六步开发流程┌─────────────────────────────────────────────────────────────┐ │ 1. 需求分析 (PRD) │ │ └─ 业务背景 → AI生成初版PRD → 多轮细化 │ ├─────────────────────────────────────────────────────────────┤ │ 2. 技术选型 (Tech Doc) │ │ └─ 市场调研 → 技术选型 → 编写技术文档 │ ├─────────────────────────────────────────────────────────────┤ │ 3. 任务拆分 (Task Doc) │ │ └─ PRDTech Doc → AI拆分任务 → 创建Task清单 │ ├─────────────────────────────────────────────────────────────┤ │ 4. 编码实现 (Code) │ │ └─ TDD → 验证闭环 → 自测功能 │ ├─────────────────────────────────────────────────────────────┤ │ 5. 代码审查 (Review) │ │ └─ 人工审查 AI辅助审查 → Code Health检查 │ ├─────────────────────────────────────────────────────────────┤ │ 6. 交付维护 (Deploy) │ │ └─ CI/CD → 监控 → 自动修复 │ └─────────────────────────────────────────────────────────────┘3.2 文档先行原则核心文档体系文档作用维护者PRD产品需求文档明确功能、用户、业务流程PM/需求方Tech Doc技术设计文档架构、选型、接口定义技术负责人Task Doc任务清单可验证、可执行的小任务AI/开发者Spec详细规格含验证方案开发者Design技术设计模块划分、数据流开发者AGENTS.md项目地图结构、命令、规范团队CLAUDE.md上下文注入项目背景、约束团队文档喂养策略每次开启新会话前将三个核心文档PRD Tech Doc Task Doc喂给 AI 让 AI 了解项目整体情况避免上下文污染3.3 任务拆分原则SMART 原则Specific任务明确不模糊Measurable可验证有完成标准Achievable1-2小时内可完成Relevant与目标相关Time-bound有时限示例 Task Doc 结构## 第一阶段项目基础搭建 ### 1. 三端项目初始化 **博客前台** - [✔] Vue3 Vite 项目搭建 - [ ] 路由配置 - [ ] Axios 封装 **管理后台** - [ ] Vue3 Element Plus 项目搭建 - [ ] 路由与权限配置 ### 2. 数据库设计 - [ ] 用户表设计 - [ ] 文章表设计四、核心开发范式4.1 Spec-Driven Development规范驱动开发Kiro 模式Requirement → Design → Tasks ↑ ↓ ↓ 确认确认执行整个流程串行且不可跳过必须确认上一阶段产出才能推进到下一步每个阶段可审查、修改、追加两种变体Requirement-First先写需求再设计最后任务Design-First已有明确技术方案时先设计再反推需求4.2 Claude Code 的自由模式Anthropic 推荐工作流收集上下文 → 采取行动 → 验证工作 → 循环复杂问题处理要求 Agent 阅读相关文件明确告知先不要编写任何代码要求制定一份计划确认计划后再执行关键警示“如果没有调研和规划步骤Claude 的输出往往会直接跳到编写代码这一步。”4.3 验证闭环设计三层验证体系层级验证内容触发时机L1: 静态检查lint、format、type check每次代码变更L2: 单元测试功能正确性、覆盖率提交前L3: 集成验证启动应用、接口测试、E2EPR前/部署前Agent 可观测性将验证脚本串进 Agent 工作流lint → spotless → build 自动触发通过start.sh启动应用用 curl/websocat 跑接口验证使用 Agent Browser 操作浏览器定位问题4.4 迭代自愈机制改完代码 → 自动跑验证 → 失败 → AI分析修复 → 再验证 ↓ 1-3轮收敛 → 反复失败 → 升级给人类垃圾回收机制后台 Agent 定期扫描代码库发现偏离团队规范的模式自动开 PR 修复持续偿还小额技术债而非等待堆积五、多 Agent 协作模式5.1 协作范式演进模式特点适用场景Subagent主 Agent 派任务给子 Agent收集结果树形任务分解Experts专家 Agent 团队各负责不同领域复杂技术问题Mailbox (Peer-to-Peer)Agent 间直接通信无中心调度高度协作场景SupervisorSupervisor 管理 Specialized Agent 团队系统化工程5.2 Mailbox 机制Claude Code┌─────────────┐ mailbox ┌─────────────┐ │ Agent A │ ←───────────────→ │ Agent B │ │ (Frontend) │ 点对点通信 │ (Backend) │ └─────────────┘ └─────────────┘ ↑ ↑ └────────── 直接协商 ──────────┘特点Agent 之间直接协商、分工、同步进度无需经过中心调度器每个 Agent 是平等的 peer5.3 Helmsman 模式Supervisor┌─────────────────────────────────────────────┐ │ Supervisor Agent │ │ (规划、协调、质量控制) │ └──────────┬────────────────┬─────────────────┘ ↓ ↓ ┌──────────────────┐ ┌──────────────────┐ │ Coding Team │ │ Testing Team │ │ (代码实现 Agent) │ │ (测试生成 Agent) │ └──────────────────┘ └──────────────────┘工作流程Planning用户查询通过人机对话 refine 成可执行计划CodingSupervisor 管理的 Specialized Agent 团队协作构建代码Evaluation代码在闭环模拟中自主测试和 refine六、文档体系规范6.1 AGENTS.md 地图规范核心原则Map not Manual# AGENTS.md - Project Map ## 项目结构src/├── components/ # UI 组件├── services/ # 业务逻辑├── utils/ # 工具函数└── tests/ # 测试文件## 常用命令 - npm run dev - 启动开发服务器 - npm run test - 运行测试 - npm run lint - 代码检查 ## 编码规范 - 见 .cursor/rules - 使用 TypeScript 严格模式 - 组件使用函数式 Hooks ## 架构文档 - [详细设计](./docs/architecture.md) - [API 文档](./docs/api.md)6.2 CLAUDE.md 上下文规范作用为 Claude Code 注入项目级上下文# CLAUDE.md ## 项目背景这是一个现代化的个人博客系统包含 AI 辅助写作功能。 ## 技术栈 - 前端Vue 3 Vite TypeScript - 后端Spring Boot Kotlin - 数据库MySQL Redis ## 开发约束 - 必须使用 Composition API - 所有 API 调用需封装在 services 层 - 表单必须使用 validation 库 ## 常见陷阱 - 不要直接使用 axios使用封装后的 httpClient - 图片上传必须使用压缩6.3 Rules 规范.cursor/rules# .cursor/rules rules: - name: TypeScript 严格模式 pattern: *.ts enforce: strictNullChecks: true - name: 组件命名 pattern: *.vue enforce: PascalCase多词组件名 - name: 禁止直接调用 API pattern: *.ts, *.vue forbid: axios.get|axios.post suggest: 使用 httpClient七、质量保障体系7.1 Code Health 指标AI ReadinessCode Health 9.5理想 10.0低质量代码会降低 AI 表现三层防护层级工具作用生成时code_health_review每段代码生成时检查提交前pre_commit_safeguard对未提交文件检查PR前analyze_change_set分支 vs base 全量检查7.2 覆盖率作为行为护栏传统陷阱覆盖率变成数字游戏过度 mock测试 inflated metricsAgentic 时代设置高阈值如 99%覆盖率回归信号立即可见防止 Agent 删除测试来通过检查7.3 端到端自动化构建可分发产品 → 创建/修改 Git 仓库 → 注入代码异味 ↓ ↓ 调用产品验证 ←────────────────────── 检测问题关键单元测试是基础但只验证局部行为E2E 测试验证真实场景下的产品行为AI 速度下这种自动化成为 non-negotiable八、Agentic Workflow 模式8.1 Prompt Chaining提示链输入 → LLM Call 1 → 检查点 → LLM Call 2 → 检查点 → 输出 ↓ ↓ 中间产物验证中间产物验证适用场景任务可分解为固定子任务用延迟换准确性每步 LLM 调用都是简单任务示例生成营销文案翻译成其他语言检查合规性8.2 Routing路由输入 → 分类器 LLM → 路由到专用 Agent → 输出 ↓ 意图识别适用场景多种类型的任务需要不同处理每个任务有专门的优化 Agent8.3 Parallelization并行化┌→ LLM 1 → 结果 1 ─┐ 输入 ────┼→ LLM 2 → 结果 2 ─┼→ 聚合器 → 输出 └→ LLM 3 → 结果 3 ─┘适用场景任务可分段并行处理需要投票机制提高准确性处理大量相似任务8.4 Orchestrator-Workers编排器-工作者输入 → Orchestrator LLM → 任务分解 ↓ ┌────────┼────────┐ ↓ ↓ ↓ Worker 1 Worker 2 Worker 3 └────────┼────────┘ ↓ 聚合结果 → 输出适用场景复杂任务子任务无法预先确定需要动态规划执行路径8.5 Evaluator-Optimizer评估-优化输入 → LLM 生成 → 评估器评分 → 分数合格? → 输出 ↓否反馈给 LLM 优化适用场景需要多轮优化才能达到质量标准有明确的评估标准学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

为什么你的边缘Python服务总在凌晨崩溃？5类隐蔽资源泄漏模式与内存守护脚本一键修复

第一章：为什么你的边缘Python服务总在凌晨崩溃？5类隐蔽资源泄漏模式与内存守护脚本一键修复边缘设备上的Python服务常在系统负载低、无人值守的凌晨时段突发崩溃——这并非偶然，而是长期累积的资源泄漏在内存压力阈值被悄然击穿后的必然结果。…...

2026/5/12 16:40:03 阅读更多 →

Aerotech系列（1）运动控制实战：从基础API到多轴联动

1. Aerotech运动控制入门：从零搭建开发环境第一次接触Aerotech运动控制器时，我花了整整两天时间才把开发环境配置好。现在回想起来，其实只需要注意几个关键点就能避免踩坑。Aerotech的A3200系列控制器在半导体、激光加工等领域应用广泛&…...

2026/5/12 16:40:05 阅读更多 →

CMU15445(2024fall) Project #1 - Buffer Pool Manager 架构解析与实战避坑

1. Buffer Pool Manager 架构全景解析第一次看到CMU15445的Project #1时，我盯着Buffer Pool Manager（BPM）这个名词发了十分钟呆。作为数据库系统的核心组件，BPM本质上就是内存和磁盘之间的"交通警察"，它要解…...

2026/5/12 16:40:04 阅读更多 →

单相光伏发电并网控制【附代码】

✨ 长期致力于光伏电池、整流控制、逆变控制、最大功率点跟踪技术研究工作，擅长数据搜集与处理、建模仿真、程序编写、仿真设计。 ✅ 专业定制毕设、代码 ✅ 如需沟通交流，点击《获取方式》 （1）自适应变步长电导增量法最大功率点跟…...

2026/5/19 12:48:20 阅读更多 →

【代码】hot100

Easy 两数之和两数之和 class Solution:def twoSum(self, nums: List[int], target: int) -> List[int]:xdict{}for i in range(len(nums)):jtarget-nums[i]if j in xdict.keys():return [i,xdict[j]]else:xdict[nums[i]]i 有效的括号有效的括号 class Soluti…...

2026/5/19 3:45:22 阅读更多 →

G-Helper终极教程：华硕笔记本轻量级性能控制神器

G-Helper终极教程：华硕笔记本轻量级性能控制神器【免费下载链接】g-helper Lightweight Armoury Crate alternative for Asus laptops with nearly the same functionality. Works with ROG Zephyrus, Flow, TUF, Strix, Scar, ProArt, Vivobook, Zenbook, Expertb…...

2026/5/18 5:24:10 阅读更多 →