Token省30倍，大模型Agents高效永久记忆框架开源：SimpleMem

张

张建站

2026/5/7 17:19:34

10分钟阅读

当 LLM 开始“断片”痛点 1上下文膨胀多轮对话里 80 % 是「好的」「哈哈」等低熵噪声却被原封不动塞进历史导致“中间丢失”现象。痛点 2反复推理高成本在线过滤型 AgentReadAgent、MemGPT靠多次 LLM 调用筛信息延迟 Token 费用飙升。痛点 3小模型记不住大模型用不起全量历史 16 k tokens 一次推理30 轮后 GPT-4o 也要“失忆”成本 30× 于轻量方案。SimpleMem是通过语义无损压缩来高效管理历史交互经验解决现有记忆系统在长期交互场景下的冗余和效率问题。三阶段“语义无损压缩”流水线Fig.2 架构总览① Semantic Structured Compression压缩熵感知过滤窗口内新实体占比语义偏移度打分低于 τ0.35 直接丢弃。上下文原子化共指消解时间戳归一化把「他昨天去了那儿」变成「Bob 2025-07-12 去了 Starbucks」。输出独立、可解释的原子记忆单元体积 ↓ 90 %。② Recursive Memory Consolidation整合三视角索引Semantictext-embedding-3-smallLexicalBM25Symbolic时间、实体、主题异步合并语义相似时间邻近 0.85 自动抽象成高阶模式如“Sarah 常在早上喝咖啡”。③ Adaptive Query-Aware Retrieval检索查询复杂度估计轻量分类器判断 LOW / HIGH动态决定拿 k[3,20] 条记忆。混合打分S(q,m)λ₁cos(embedding)λ₂BM25γ 符号约束结果单跳查询 3 条就够多跳推理自动扩展到 20 条Token 不浪费。prompt用 1/30 的成本做到 SOTA在 LoCoMo 四任务平均 F1 提升26.4%推理 Token 降到1/30构建速度比 Mem0 快14×检索延迟再降33%。关键数字GPT-4.1-mini 上平均 F143.24vs Mem0 34.20单轮 Token531vs LoCoMo 16 9103B 模型 SimpleMem 直接跑赢 8B基线Fig.3 案例可视化表3 效率对比表4 消融实验学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

Crow框架Mustache模板引擎完整指南：快速构建动态页面

Crow框架Mustache模板引擎完整指南：快速构建动态页面【免费下载链接】crow ipkn/crow: Crow 是一个用于 C 的高性能 RESTful API 框架，可以用于构建高性能的 Web 应用程序和 API 服务，支持多种 HTTP 协议和编程语言，如 C&#xf…...

2026/4/9 22:24:57 阅读更多 →

Qt5实战：QTreeWidget自动列宽设置全攻略（附常见问题解决）

Qt5实战：QTreeWidget自动列宽设置全攻略（附常见问题解决） 在Qt开发中，QTreeWidget是一个常用的控件，用于展示树形结构的数据。然而，很多开发者在使用过程中会遇到列宽设置的问题——要么列宽过窄导致内容显…...

2026/4/9 22:25:14 阅读更多 →

JumpServer堡垒机CVE-2023-42820漏洞复现：从原理到修复的完整指南

JumpServer堡垒机CVE-2023-42820漏洞深度解析与实战防护指南引言在数字化转型浪潮中，企业IT基础设施的安全防护始终是重中之重。作为运维安全的核心组件，堡垒机承担着权限管控与操作审计的关键职责。近期曝光的JumpServer堡垒机CVE-2023-42820漏洞&…...

2026/4/9 22:25:13 阅读更多 →

环境配置与基础教程：2026自动化标注黑科技：使用 Segment Anything (SAM) 零样本辅助标注 YOLO 分割与检测数据集

编者按在计算机视觉项目中，数据标注一直是最让人头疼的环节。根据社区普遍反馈（源自多个CSDN项目经验和公开技术报告），传统人工标注一张包含精细多边形掩码的图像需要3到10分钟，而一个完整的实例分割数据集往往需要上千张图片。如果你曾经带领团队连续加班数周只为了完成…...

2026/5/7 9:24:23 阅读更多 →

如何3步完成TikTok评论数据采集：开源工具的高效实战指南

如何3步完成TikTok评论数据采集：开源工具的高效实战指南【免费下载链接】TikTokCommentScraper 项目地址: https://gitcode.com/gh_mirrors/ti/TikTokCommentScraper TikTokCommentScraper是一个专为抖音内容创作者、市场分析师和社区运营者设计的开源数据…...

2026/5/7 9:24:27 阅读更多 →