1.1 Multi-Agent 成本的结构性挑战在单体 LLM 应用中,成本模型相对简单:输入 Token 数 × 输入单价 + 输出 Token 数 × 输出单价 = 总成本。但 Multi-Agent 系统的成本结构完全不同——主 Agent 需要协调多个子 Agent,每个子 Agent 独立调用 LLM,加上工具执行、记忆检索等额外开销,成本呈现结构性增长。据 InformationWeek 2026 年 3 月报道,企业级 AI Agent 的持续运营成本已达 $3,200–$13,000/月,其中 Token 消耗占比高达 60%–80%[^1]。随着 Agent 从 Demo 走向生产环境,Token 成本正在成为制约规模化部署的最大障碍。一个典型 Multi-Agent 工作流的 Token 消耗构成如下:消耗环节占比特征System Prompt30%–40%固定成本,每次调用重复发送工具描述15%–25%工具越多,描述越长对话历史20%–30%多轮对话累积增长实际输出10%–