收藏！揭秘 Claude Code 与 ChatGPT 的差距：harness 才是 AI 能力的关键！

张

张建站

2026/6/16 8:58:15

10分钟阅读

收藏！揭秘 Claude Code 与 ChatGPT 的差距：harness 才是 AI 能力的关键！

本文揭示了 Claude Code 和 ChatGPT 等工具性能差异的真正原因并非模型本身而是它们所搭载的 agent harness。通过 harnessAI 可以更好地理解项目上下文、持久记忆和自动化操作从而显著提升效率。文章建议开发者通过创建项目记忆文件等方式提升 AI 工具的实用性强调 harness 在 AI 应用中的重要性。如果你同时用过 ChatGPT 的网页版和 Claude Code你一定有过这种感觉明明问的是同一个问题Claude Code 给出的答案好得不像话——代码能跑、文件改对了、测试也过了。而网页版呢它给你一段看起来对但其实跑不通的代码然后礼貌地说你可以试试看。你以为是模型的差距。但事实是Claude Code 里跑的 Claude和 claude.ai 聊天框里跑的 Claude是同一个模型。ChatGPT 的网页版和 Codex CLI 里跑的 GPT也是同一个模型。底层发动机一模一样但开起来天差地别。这件事困扰了我挺久直到最近读了 Sebastian Raschka 的一篇文章一句话点透了模型是发动机你日常体验到的 80% 的能力来自发动机外面那辆车。那辆车技术圈叫它 agent harness。聊天框的聪明其实是一种假象你在聊天框里跟 AI 对话感觉它什么都知道。但它真正知道的只有你这次对话里敲进去的那些字。它不知道你的项目用的是 TypeScript 还是 Python。不知道你的测试框架是 pytest 还是 vitest。不知道你昨天刚把一个模块从 class 重构成了函数式。不知道你的团队有个约定——所有 API 返回都要包一层 Result 类型。你以为你在跟一个资深工程师对话其实你在跟一个每次见面都失忆的天才对话。每次打开聊天框你都得重新介绍自己、介绍项目、介绍上下文。稍微漏说一点它就会给你一个正确但没用的答案。而 Claude Code 呢你打开终端的那一刻它已经扫完了你的整个仓库。README 读了目录结构看了git 历史翻了连 .env 的命名风格都注意到了。你还没开口它就已经知道你是谁、你在做什么、你上次做到哪了。这不是模型更聪明了。这是车替你做了所有准备工作。更可怕的差距在动手聊天框里的 AI说到底只能做一件事生成文字。它可以给你写一段代码但它不能帮你创建文件。它可以建议你跑个测试但它自己跑不了。它可以告诉你这个函数的调用方也要改但它不知道调用方在哪因为它根本看不到你的代码库。所以你每天的工作流变成了这样问 AI → 复制代码 → 粘贴到编辑器 → 手动改 → 跑测试 → 测试挂了 → 回去再问 AI → 再复制 → 再粘贴……而有了 harness 的 AI它能自己读文件、写文件、跑命令、搜代码、调 API。你说把 fetchUser 加一个 timeout 参数它 grep 所有调用点一次性改完自己跑测试确认。你不再是它的手和眼。它自己有手有眼了。聊天框 vs Agent Harness差距不在大脑在四肢真正致命的是记忆这一点很多人没意识到。你昨天花了两小时让 AI 帮你重构一个模块。今天想继续优化。打开聊天框——它完全不记得昨天的事了。你得重新解释项目结构、之前改了什么、为什么那样改。每一天你都在跟一个新来的实习生做交接。但套了 harness 的 AI 不一样。它有一个持久记忆文件记着你的项目约定、上次改了什么、为什么改、哪些坑踩过。你今天打开终端说继续昨天的它真的能继续。我自己做了一个 AI agent 系统让它每天自动采集科技热点、选题、写稿、推送到公众号。有一次它报告草稿已写入——但实际上正文根本没生成只有一个空的大纲文件。它不是故意骗我它是真的觉得自己做完了。后来我在流程里加了记忆回溯和硬校验写完稿必须确认文件存在、字数达标、配图齐全。任何一项不过流程直接中断不允许报告已完成。没有记忆的 AI连自己做没做完都不知道。所以模型还重要吗重要。但没你想的那么重要了。Scale AI 的基准测试显示同一个模型放在不同的 harness 里表现差距远大于不同模型之间的差距。换句话说给一个中等模型配一套好的 harness很可能比一个顶级模型裸跑要强。Agent 的工作循环思考 → 行动 → 观察 → 再思考这就像赛车。引擎当然重要但一台普通引擎配上好的底盘、变速箱和悬挂跑出来的成绩可能比一台顶级引擎装在拖拉机上要好得多。过去两年所有人都在卷模型。但接下来这一年真正的战场会转移到 harness 上。Cursor 估值 500 亿美元不是因为它自己训练了模型而是因为它那套 harness 把所有模型都变强了。Claude Code 让 Anthropic 的股价翻了一番不是因为 Claude 模型突然变聪明了而是因为 harness 终于让模型的能力落了地。这跟你有什么关系你可能觉得这是大厂的事。但其实最简单的 harness你今天就能搭。在项目根目录建一个 MEMORY.md把项目的关键约定、架构决策、已知坑点写进去。下次让 AI 干活之前先让它读这个文件。就这一步零成本但效果立竿见影。因为你做的事情本质上跟 Claude Code 做的事情是一样的——在模型开口之前先给它足够的上下文。别再只研究怎么写提示词了。提示词是对话层面的优化harness 是系统层面的优化。一个是在发动机上贴贴纸一个是给它装上变速箱。如何学习大模型 AI 由于新岗位的生产效率要优于被取代岗位的生产效率所以实际上整个社会的生产效率是提升的。但是具体到个人只能说是“最先掌握AI的人将会比较晚掌握AI的人有竞争优势”。这句话放在计算机、互联网、移动互联网的开局时期都是一样的道理。我在一线互联网企业工作十余年里指导过不少同行后辈。帮助很多人得到了学习和成长。我意识到有很多经验和知识值得分享给大家也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限很多互联网行业朋友无法获得正确的资料得到学习提升故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】为什么要学习大模型我国在A大模型领域面临人才短缺,数量与质量均落后于发达国家。2023年人才缺口已超百万凸显培养不足。随着AI技术飞速发展预计到2025年,这一缺口将急剧扩大至400万,严重制约我国AI产业的创新步伐。加强人才培养,优化教育体系,国际合作并进是破解困局、推动AI发展的关键。大模型入门到实战全套学习大礼包1、大模型系统化学习路线作为学习AI大模型技术的新手方向至关重要。正确的学习路线可以为你节省时间少走弯路方向不对努力白费。这里我给大家准备了一份最科学最系统的学习成长路线图和学习规划带你从零基础入门到精通2、大模型学习书籍文档学习AI大模型离不开书籍文档我精选了一系列大模型技术的书籍和学习文档电子版它们由领域内的顶尖专家撰写内容全面、深入、详尽为你学习大模型提供坚实的理论基础。3、AI大模型最新行业报告2025最新行业报告针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估以了解哪些行业更适合引入大模型的技术和应用以及在哪些方面可以发挥大模型的优势。4、大模型项目实战配套源码学以致用在项目实战中检验和巩固你所学到的知识同时为你找工作就业和职业发展打下坚实的基础。5、大模型大厂面试真题面试不仅是技术的较量更需要充分的准备。在你已经掌握了大模型技术之后就需要开始准备面试我精心整理了一份大模型面试题库涵盖当前面试中可能遇到的各种技术问题让你在面试中游刃有余。适用人群第一阶段10天初阶应用该阶段让大家对大模型 AI有一个最前沿的认识对大模型 AI 的理解超过 95% 的人可以在相关讨论时发表高级、不跟风、又接地气的见解别人只会和 AI 聊天而你能调教 AI并能用代码将大模型和业务衔接。大模型 AI 能干什么大模型是怎样获得「智能」的用好 AI 的核心心法大模型应用业务架构大模型应用技术架构代码示例向 GPT-3.5 灌入新知识提示工程的意义和核心思想Prompt 典型构成指令调优方法论思维链和思维树Prompt 攻击和防范…第二阶段30天高阶应用该阶段我们正式进入大模型 AI 进阶实战学习学会构造私有知识库扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架抓住最新的技术进展适合 Python 和 JavaScript 程序员。为什么要做 RAG搭建一个简单的 ChatPDF检索的基础概念什么是向量表示Embeddings向量数据库与向量检索基于向量检索的 RAG搭建 RAG 系统的扩展知识混合检索与 RAG-Fusion 简介向量模型本地部署…第三阶段30天模型训练恭喜你如果学到这里你基本可以找到一份大模型 AI相关的工作自己也能训练 GPT 了通过微调训练自己的垂直大模型能独立训练开源多模态大模型掌握更多技术方案。到此为止大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗为什么要做 RAG什么是模型什么是模型训练求解器损失函数简介小实验2手写一个简单的神经网络并训练它什么是训练/预训练/微调/轻量化微调Transformer结构简介轻量化微调实验数据集的构建…第四阶段20天商业闭环对全球大模型从性能、吞吐量、成本等方面有一定的认知可以在云端和本地等多种环境下部署大模型找到适合自己的项目/创业方向做一名被 AI 武装的产品经理。硬件选型带你了解全球大模型使用国产大模型服务搭建 OpenAI 代理热身基于阿里云 PAI 部署 Stable Diffusion在本地计算机运行大模型大模型的私有化部署基于 vLLM 部署大模型案例如何优雅地在阿里云私有部署开源大模型部署一套开源 LLM 项目内容安全互联网信息服务算法备案…学习是一个过程只要学习就会有挑战。天道酬勤你越努力就会成为越优秀的自己。如果你能在15天内完成所有的任务那你堪称天才。然而如果你能完成 60-70% 的内容你就已经开始具备成为一名大模型 AI 的正确特征了。这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

大模型检索没效果？小白也能学会的排查思路与收藏秘籍！

本文详细介绍了在使用大模型进行检索时，如果遇到“检索不到想要的东西”的问题，如何沿着数据流方向从文档处理、向量化、检索召回、结果过滤等环节逐层排查。关键点包括检查文档是否正确入库、切分质量、元数据完整性、模型一致性、模型能力匹配、查询表…...

2026/6/16 8:51:34 阅读更多 →

智能JSON编辑器：革新VS Code中的结构化数据管理体验

智能JSON编辑器：革新VS Code中的结构化数据管理体验【免费下载链接】vscode-json Json for Visual Studio Code 项目地址: https://gitcode.com/gh_mirrors/vs/vscode-json 在当今数据驱动的开发环境中，JSON作为最广泛使用的数据交换格式&#x…...

2026/6/14 17:19:15 阅读更多 →

OmenSuperHub：重新定义OMEN游戏本性能管理体验

OmenSuperHub：重新定义OMEN游戏本性能管理体验【免费下载链接】OmenSuperHub 使用 WMI BIOS控制性能和风扇速度，自动解除DB功耗限制。项目地址: https://gitcode.com/gh_mirrors/om/OmenSuperHub 问题引入：为何原厂软件总是拖慢你的…...

2026/6/14 17:19:20 阅读更多 →

SketchUp STL插件：打破数字设计与物理制造的壁垒

SketchUp STL插件：打破数字设计与物理制造的壁垒【免费下载链接】sketchup-stl A SketchUp Ruby Extension that adds STL (STereoLithography) file format import and export. 项目地址: https://gitcode.com/gh_mirrors/sk/sketchup-stl 你是否曾在Sketc…...

2026/6/15 6:07:42 阅读更多 →

初中生闭环能力的庖丁解牛

它的本质是：**对于初中生而言，闭环能力不是“完美主义”，而是 “作业-订正-掌握”的最小可行性循环 (MVP Loop of Homework-Correction-Mastery)。核心矛盾：初中阶段学科数量激增（从3门到7-8门）&#xff0…...

2026/6/16 3:24:51 阅读更多 →

FunClip革命：当大语言模型遇见视频剪辑，传统工作流如何被彻底颠覆

FunClip革命：当大语言模型遇见视频剪辑，传统工作流如何被彻底颠覆【免费下载链接】FunClip Open-source, accurate and easy-to-use video speech recognition & clipping tool. LLM-based AI clipping integrated. 项目地址: https://gitcode.co…...

2026/6/15 6:07:42 阅读更多 →

解锁Nintendo Switch终极潜力：3种大气层Atmosphere稳定版部署方案深度解析

解锁Nintendo Switch终极潜力：3种大气层Atmosphere稳定版部署方案深度解析【免费下载链接】Atmosphere-stable 大气层整合包系统稳定版项目地址: https://gitcode.com/gh_mirrors/at/Atmosphere-stable 大气层Atmosphere稳定版作为当前最成熟、最安全的Nin…...

2026/6/15 6:07:37 阅读更多 →