为什么 OpenClaw 和 Claude Code 都使用 Node.js

张

张建站

2026/6/10 3:49:13

10分钟阅读

文章目录前言一、先认识两个真实的标杆项目1. OpenClaw周末项目长成 37 万 Star 怪兽2. Claude CodeAnthropic 官方的命令行 Agent二、技术取舍一事件循环和 ReAct 推理循环是结构同构的三、技术取舍二流式输出是 Node.js 的主场四、技术取舍三npm 生态在消息平台 SDK 上是降维优势五、技术取舍四TypeScript 已经是 LLM 的母语六、技术取舍五ES Modules 动态 import 真正的热插拔七、拆解 OpenClaw 的完整 Agent 架构1. Gateway 是唯一控制平面2. SOUL.md人类可读的人格定义3. Context Compaction滑窗压缩4. ACPAgent 间通信协议八、Python 没有退场是和 Node.js 分工九、什么场景反而不该选 Node.js1. 企业内部 Agent 强依赖 Java/Spring 生态2. GPU 密集的实时推理路径3. 重度依赖 LangChain / LlamaIndex 生态4. 团队没有任何 Node.js 储备总结前言最近团队里有个讨论挺有意思——做 AI Agent 平台时到底该选什么技术栈。会议上 Java 老兵和 Python 拥趸吵了俩小时结果有人甩出一张图GitHub Star 数前十的 Agent 项目九个是 TypeScript / Node.js。这就有点反常识了——Python 不是 AI 的主场吗带着这个问题翻了几个标杆项目的源码发现这不是巧合是工程选型上的必然。结论先抛出来Node.js 在 AI Agent 这个细分领域成为事实标配背后是五个跑不掉的工程取舍——而不是社区情绪。读完这篇你能搞明白OpenClaw37 万 Star和 Claude Code 在用什么样的真实技术栈事件循环和ReAct 推理循环为什么在结构上是同构的npm 生态对 Agent 项目意味着什么——为什么 Python 的同类 SDK 反而是短板TypeScript 为什么被称作 LLM 的母语——这不是吹牛Node.js 不适合做哪些 Agent 场景——架构师视角的边界判断不管你是带 Java 团队往 AI 转的技术负责人还是正纠结新项目选啥栈的架构师这篇都值得看完。开拆。一、先认识两个真实的标杆项目聊技术选型之前先把背景统一。下面这两个项目是当下 AI Agent 领域最值得拆解的标杆——一个是社区现象级开源项目一个是 LLM 厂商官方出品。1. OpenClaw周末项目长成 37 万 Star 怪兽OpenClaw 由奥地利程序员 Peter SteinbergerPSPDFKit 的作者圈内有名的老兵在 2025 年 11 月作为周末项目发布。最初叫 Clawdbot因为商标冲突改名 Moltbot三天后再改成现在的 OpenClaw。定位很简单一句话——一个能自主做事的本地 AI Agent把消息平台Telegram、WhatsApp、Slack、Discord 等当作用户界面在你的本地机器上跑任务。截止 2026 年 6 月仓库已经是 37 万 Star、近 8 万 Fork 的规模社区技能仓库 ClawHub 已经收录 1.3 万第三方技能。这种增长速度在开源圈里已经不是火能形容的了。它的package.json关键字段直接揭示了选型{name:openclaw,version:2026.3.13,license:MIT,bin:{openclaw:openclaw.mjs},type:module,exports:{.:./dist/index.js,./plugin-sdk:{types:./dist/plugin-sdk/index.d.ts,default:./dist/plugin-sdk/index.js},./plugin-sdk/discord:...,./plugin-sdk/memory-core:...}}几个信号一目了然type: module——全栈拥抱 ES Modules是当代 Node.js 的标准姿势入口是.mjs原生 ESM插件系统用 npmsubpath exports实现而不是塞成巨石版本号2026.3.13是 CalVer日历版本号意味着发布节奏极快仓库结构也很说明问题——除了 Node.js 主程序外还配了 iOSSwift、macOSSwift、AndroidKotlin三个原生客户端以及 React Vite 写的 Control UI。也就是说这已经不是个简单的 CLI 工具是一套全平台的 Agent 基础设施。2. Claude CodeAnthropic 官方的命令行 AgentClaude Code 是模型厂商 Anthropic 自己出的 CLI Agent分发方式很 Node.js 味儿npminstall-ganthropic-ai/claude-code打开它的 npm 包描述能看到engines.node 18入口是bin/claude.exe。用户拿到的就是一个跑在 Node.js 上的 CLI——这一点和 OpenClaw 是一致的。⚠️ 一个常见误解先澄清你去 GitHub 仓库anthropics/claude-code看会发现主语言显示 Python。但那些 Python 代码主要是构建脚本、issue 模板、文档工具不是用户实际跑的那个 CLI。选择 Node.js指的是分发方式用户机器上的运行时不是源码用什么写的——这两件事经常被混为一谈。把 OpenClaw 和 Claude Code 的关键字段放在一起对比技术栈相似度高得惊人维度OpenClawClaude Code版本管理CalVer2026.3.13npm: anthropic-ai/claude-code运行时Node.jsESM 模式Node.js核心语言TypeScript31.6 万行TypeScript官方称约 90% 由 AI 编写包管理pnpm monoreponpm构建工具tsdown新一代 TS bundler—插件机制npm 子路径导出 extensions/ 目录内置工具集技能系统SKILL.mdMarkdown YAML frontmatterSKILL.md同一套规范分发方式npm install -g openclawnpm install -g anthropic-ai/claude-code两个完全独立的团队在不到一年内做出来的 Agent技术栈居然高度收敛。这不是抄袭是被同一个工程现实推到了同一个选项上。接下来一章一章拆这背后的取舍。二、技术取舍一事件循环和 ReAct 推理循环是结构同构的Node.js 的事件循环Event Loop和 AI Agent 的 ReAct 循环Reason Act在结构上几乎是同一种东西的两种说法Node.js 事件循环事件队列 → 回调执行 → 异步 I/O → 回到事件队列 Agent ReAct 循环观察 Observe → 推理 ThinkLLM→ 行动 ActTool→ 回到观察这种对应不是文字游戏是真实的技术映射Agent 等待 LLM 响应≈ Node.js 等待网络 I/O都是异步非阻塞Agent 接收 tool_use 指令≈ Node.js 处理事件回调Agent 流式接收 LLM 输出≈ Node.js Stream API天作之合Agent 同时维护多个通道连接≈ Node.js 事件循环本身就是为高并发长连接设计的OpenClaw 一个进程里要同时挂着 Telegram、Discord、WhatsApp、Slack 等多条长连接对 Python 的 asyncio 已经是不小的工程挑战对 Node.js 是默认模式。架构师的视角选型最怕的就是运行时模型和业务模型对不上。Java 的线程池模型擅长 CPU 密集型同步任务Python 的 GIL 在多 IO 场景里要靠 asyncio 重构整个调用栈而 Node.js 的事件循环天然契合等 LLM 回复 → 处理回调 → 触发下一个工具调用这种业务节奏。这是结构性优势不是单点性能。三、技术取舍二流式输出是 Node.js 的主场现代 LLM 全部支持流式返回SSEServer-Sent Events用户不必等整个回答生成完才看到内容。在 Node.js 里这事和内置的ReadableStream、pipeline是一体的importAnthropicfromanthropic-ai/sdkconstclientnewAnthropic()// stream() 返回一个 AsyncIterable原生 ES 语法直接遍历conststreamawaitclient.messages.stream({model:claude-sonnet-4-6,max_tokens:1024,messages:[{role:user,content:分析这段代码}],})forawait(constchunkofstream){if(chunk.typecontent_block_delta){process.stdout.write(chunk.delta.text)}}// 如果模型决定调用工具从最终消息里取出constfinalMessageawaitstream.finalMessage()if(finalMessage.stop_reasontool_use){consttoolUsefinalMessage.content.find(cc.typetool_use)// 调用真实工具把结果反馈给下一轮 LLM}for await...of是 ES2018 的原生语法Node.js 14 全面支持前端工程师写起来零学习成本。Python 那边要用async forhttpx.aiter_lines()加上一堆类型转换能写但确实没这边顺手。架构师视角评估一项语言是否适合做 X最重要的是看核心范式有没有内置支持而不是看能不能写出来。能写出来不等于适合做。Java 也能用 Project Reactor 写流式但生态、心智模型、社区案例都比不上 Node.js 在这个场景下的开箱即用。四、技术取舍三npm 生态在消息平台 SDK 上是降维优势OpenClaw 能在几周内集成 50 消息平台根本原因不是团队多能打是npm 生态里官方/社区 SDK 的覆盖度太可怕了平台npm 包维护方WhatsAppbaileys社区活跃维护Telegramgrammy官方推荐Discorddiscord.js官方维护Slackslack/bolt官方维护Matrixmatrix-js-sdkMatrix 基金会官方飞书/Larklarksuiteoapi/node-sdk字节官方Python 在这些企业通讯平台上存在明显空白——大部分官方 SDK 都优先支持 Node.jsPython 版本要么社区维护、要么功能不完整。这件事的根本原因是这些消息平台本身是事件驱动、长连接、JSON 消息为核心的应用和 Node.js 的核心范式完全对味所以官方倾向于先做 Node SDK。Python 那边的 SDK 主要服务的是数据分析和 Bot 自动化场景对长连接编排的支持是后来才补的。架构师视角选型时生态成熟度的权重远高于语言性能。一个语言要在某领域成为标配必须有官方 SDK 厚度、活跃维护节奏、社区代码案例三件套同时具备。Node.js 在消息平台这块刚好都有。五、技术取舍四TypeScript 已经是 LLM 的母语这是个会自我强化的循环互联网上 JS/TS 代码海量 → LLM 训练数据里 JS/TS 占比极高 ↓ LLM 写 TypeScript 准确率最高 → 用 TypeScript 构建 AI 工具和框架 ↑ 更多 TypeScript 流回互联网OpenClaw 的工具调用 SchemaFunction Calling本质上就是一段 TypeScript 类型定义的 JSON 序列化版本interfaceToolDefinition{name:stringdescription:stringinput_schema:{type:objectproperties:Recordstring,{type:stringdescription:string}required:string[]}}constbashTool:ToolDefinition{name:bash,description:Execute a shell command and return stdout/stderr,input_schema:{type:object,properties:{command:{type:string,description:The shell command to execute},timeout:{type:number,description:Timeout in milliseconds (default: 30000)}},required:[command]}}TypeScript 的静态类型让这种 Schema 在编辑器里就能检查错误不用等到运行时崩才发现。这对 Agent 这种工具调用密集型应用是雪中送炭——一个 schema 写错LLM 就会被错误信息带偏跑出难以排查的链路。架构师视角跟生态优势是一回事的另一面——当 LLM 自己擅长写某种语言时你用这种语言搭工具AI 的辅助质量会高一档。这件事会让选型逻辑出现赢者通吃的滑坡未来几年值得持续观察。六、技术取舍五ES Modules 动态 import 真正的热插拔OpenClaw 的插件系统能在不重启 Gateway 的情况下加载新扩展靠的就是 Node.js ESM 的import()动态导入// OpenClaw 插件加载逻辑简化版源码思路一致asyncfunctionloadExtensions(extensionsDir:string){constentriesawaitfs.readdir(extensionsDir)for(constentryofentries){constpkgPathpath.join(extensionsDir,entry,package.json)constpkgJSON.parse(awaitfs.readFile(pkgPath,utf-8))if(pkg.openclaw?.extensions){for(constentryPointofpkg.openclaw.extensions){// 动态 importESM 原生支持无需重启constmoduleawaitimport(path.join(extensionsDir,entry,entryPoint))module.register(gateway)}}}}Node.js 16 对import()的支持已经是生产级别。安装新技能后服务无需重启对于面向终端用户的本地 Agent这种扩展即装即用的体验是核心壁垒。架构师视角Java 阵营里要做这种热插拔得搬出 OSGi 或自定义 ClassLoader 才能搞复杂度直线飙升。Python 的 importlib 能动态加载但缺乏作用域隔离。Node.js 在这件事上是少有的默认行为就足够好的语言。七、拆解 OpenClaw 的完整 Agent 架构把上面五个技术点的取舍放在一起看OpenClaw 的整体架构就好理解了[输入层] [Gateway 控制平面] [Agent 执行引擎] [工具层] CLI Context 构建 Bash 执行 WebChat ┌──────────────────┐ LLM 调用文件操作 Telegram ───────▶│ WebSocket RPC │───────────▶ ReAct 循环 ──────────────▶ 浏览器自动化 WhatsApp │ Server │ (Observe-Think-Act) HTTP 请求 Discord │ Session Manager │ tool-catalog Sub-Agent iOS/macOS App └──────────────────┘ tool-policy Skills (SKILL.md) │ ▼ [记忆层] SOUL.md人格长期记忆 Markdown 文件默认存储 LanceDB可选向量记忆 Context Compaction滑窗压缩几个值得拆解的设计1. Gateway 是唯一控制平面所有客户端——iOS/macOS 原生 App、Android、浏览器 UI、CLI——全部通过WebSocket RPC自定义 Protocol v3连到 Gateway。这种设计让业务逻辑只有一份新增平台只需要做一个支持 WebSocket RPC 的客户端壳即可。对企业落地的启示——多端 Agent 一定要避免把业务逻辑分散到各端否则版本迭代会变成灾难。2. SOUL.md人类可读的人格定义这是 OpenClaw 最有想法的设计之一。Agent 的人格不是存在向量数据库或者参数文件里而是一个纯 Markdown 文件# My Assistants Soul ## Identity You are a personal AI assistant running locally on this machine. Your owner is [name]. You help with coding, research, and daily tasks. ## Personality - Concise and direct in responses - Proactive about suggesting better approaches - Honest about limitations ## Long-term Memory - Owner prefers TypeScript over JavaScript - Preferred editor: Neovim - Current project: Building an e-commerce platform with Next.js ## Behavioral Rules - Always ask before deleting files - Never send messages to external services without confirmation - Keep responses under 200 words unless asked for detail每次对话开始时这段被注入 System Prompt。设计哲学很值——对于个人 AI 助手人类可读性技术复杂性。你随时能打开文件夹检查你的 Agent 记住了什么避免黑盒焦虑。3. Context Compaction滑窗压缩LLM 的 context window 即使 200K tokens 也是有限的。OpenClaw 在src/agents/里做了上下文压缩超过阈值时调用 LLM 把前 N 轮对话总结成摘要注入 System Prompt 后释放旧 tokens。架构师视角这是 Agent 长期运行的必选项。任何 Agent 平台只要打算服务真实用户超过一周都绕不开 context compaction 的设计。4. ACPAgent 间通信协议OpenClaw 2026 版本引入了 ACPAgent Communication Protocol让多个 Agent 之间能协作——研究助手发现需要写文档时把任务委托给写作助手写作助手完成后把结果回传。这是 Agent 系统从单体走向多智能体的标志性设计。八、Python 没有退场是和 Node.js 分工澄清一个常见误解Node.js 在 Agent 领域兴起不代表 Python 在 AI 系统中失势。两者在能力上是清晰互补的维度Node.js 的主场Python 的主场多通道消息路由✅❌实时流式响应✅⚠️ 能做但费劲工具调用编排✅✅插件热加载✅⚠️ 缺隔离多平台 SDK✅❌模型推理❌✅Embedding 计算❌✅RAG 管道⚠️ 在追赶✅LangChain/LlamaIndex数据科学❌✅科学计算❌✅实际企业里两者的分工长这样用户消息 ─▶ OpenClaw Gateway (Node.js) │ ├─▶ Anthropic / OpenAI API普通任务 ├─▶ LanceDBRust Node binding向量检索 ├─▶ Python FastAPI 微服务复杂数据分析 └─▶ Stable Diffusion APIPython图像生成OpenClaw 本身就内置了这种分工——extensions/memory-lancedb这个扩展TypeScript 编排上层底下调用 Rust 编写的 LanceDB 做向量计算。三层栈协同TypeScript 调度 → Rust 计算 → 向量存储。架构师视角单一语言能解决所有问题的时代已经过去了。现代 AI 系统的常态是多语言协同——Node.js 在边缘做接入和编排Python/Rust/Go 在后端做计算。技术总监们要做的是建立明确的服务边界而不是强求统一栈。九、什么场景反而不该选 Node.js讲完了五个 Node.js 占优的理由我得给个边界说明——架构师的本职是知道工具的边界而不是无脑推荐。下面四个场景我会优先考虑别的栈1. 企业内部 Agent 强依赖 Java/Spring 生态如果你的 Agent 要深度集成公司内部的 Spring Boot 微服务、用现有的 OAuth/SSO 体系、复用已有的 RBAC 权限模型直接基于 Spring AI 做 Agent 会比新搭一套 Node.js 栈成本低。Spring AI 1.0 之后对 Function Calling 和 ChatClient 流式响应都有内置支持不至于像几年前那么割裂。2. GPU 密集的实时推理路径如果 Agent 的核心动作是本地调用大模型推理比如本地 Llama / Qwen那么 Python vLLM / TGI 的链路会比 Node.js 调 Python 子进程更直接。Node.js 在这种场景下只适合做前置的请求路由层。3. 重度依赖 LangChain / LlamaIndex 生态LangChain 的 JS 版本langchain.js的成熟度和文档质量跟 Python 版本差着一代。如果你的 Agent 要大量复用 LangChain 的 Chain 组合、Memory 实现、Retriever 模式用 Python 是更务实的选择。4. 团队没有任何 Node.js 储备技术选型不能脱离团队现实。一个全是 Java 工程师的团队硬上 Node.js 做生产 Agent前三个月会被 ESM / CommonJS 互操作、tsconfig 配置地狱、undefined is not a function这类坑反复教做人。先评估 ramp-up 成本再决定要不要切栈。总结回到开头那个问题——为什么 OpenClaw 和 Claude Code 都使用 Node.js不是某个团队特别有眼光是工程现实把所有人推到了同一个选项上运行时模型契合业务模型——事件循环和 ReAct 推理循环是结构同构的流式输出是原生主场——SSE / for await / ReadableStream 一体集成npm 生态在消息平台上是降维优势——Python 在这块是明显短板TypeScript 是 LLM 的母语——AI 写 TypeScript 准确率最高自我强化ES Modules 动态 import 等于真正的热插拔——其他语言要做到这点都得搬重武器但选型不是站队——Python 在模型推理和 RAG 管道上仍然不可替代Java 在企业内部 Agent 集成上仍然有它的位置。正确的姿势是分清边界、做好分工Node.js 在前端接入和编排Python/Rust/Go 在后端计算。时代变快了。但每一个选型背后依然是同样朴素的工程逻辑——让运行时模型和业务模型贴近让语言生态服务于业务需求让团队能力决定栈的厚度。这些原则没变过。如果你正在做 Agent 平台的选型欢迎评论区聊聊你的判断和踩坑。

覆盖学术写作全流程的6个Prompt，让你快速产出高质量论文！

各位同仁好，我是七哥。一个在高校里从事人工智能相关领域研究，钻研用大模型AI实操的学术人。可以和七哥交流学术写作或Gemini、GPT、Claude 等大模型学术实操相关问题，多多交流，相互成就，共同进步。科研学术不仅考验思维能力和创新能力，更考验我们对时间和效率的把控…...

2026/6/10 3:48:28 阅读更多 →

多 Agent 协同——基于有向状态图构建工业级复杂业务网络

篇章一：多 Agent 协同——基于有向状态图构建工业级复杂业务网络如果说 Codex 和 Claude Code 让我们见识了“单兵 Agent”在局部战场上的极致输出，那么当面对企业级、跨部门、长周期的复杂业务（如自动化多源数据审计、全自动软件工程重构、…...

2026/6/10 3:47:46 阅读更多 →

代码随想录打卡第五十二天

卡码网 101 孤岛的总面积#include<iostream> #include<vector>using namespace std;int inorder[4][2] {0,1, 1,0, 0,-1, -1,0}; void dfs(vector<vector<int>>& mon,int x,int y){if(mon[x][y] 0) return;mon[x][y] 0;for(int i 0;i < 4;i…...

2026/6/10 3:43:42 阅读更多 →