微软：构建自进化知识库实现测试时学习

张

张建站

2026/6/6 12:49:19

10分钟阅读

标题Test-Time Learning with an Evolving Library来源arXiv, 2605.14477v1️文章简介研究问题如何在无需更新模型参数且缺乏外部监督信号的黑盒场景下让大语言模型在测试阶段跨任务积累并演化通用知识主要贡献论文提出了 EVOLIB 框架通过维护一个包含模块化技能和反思性见解的动态进化库利用信息增益机制实现知识的自监督积累与复用。重点思路构建双重抽象知识库从模型推理轨迹中自动提取两类知识单元一是可复用的模块化技能如代码函数、推理子步骤二是记录常见错误与修正策略的反思性见解。设计动态加权演化机制引入信息增益IG衡量知识对当前任务的即时效用并利用未来信息增益Future IG评估其生成有价值新知识的潜力据此动态调整库中条目的采样权重。实施知识合并与巩固利用嵌入相似度检索库中现有条目通过大模型将语义相似的新旧知识合并为更通用的抽象形式防止库膨胀并促进知识泛化。执行自监督闭环流程在无真实标签情况下利用模型自我评估解法质量基于评估结果提取新知识、更新权重并巩固库内容实现持续的测试时学习。分析总结EVOLIB 在数学推理、代码生成及多轮智能体任务等多个基准测试中性能显著优于现有的测试时缩放方法及依赖线性记忆更新的测试时学习方法。消融实验证明同时使用模块化技能和反思性见解比单一类型效果更好且跨任务共享知识库比分例独立建库能带来更大的性能提升。知识合并机制至关重要它不仅有效控制了知识库规模的增长还促使特定任务的具体经验演变为适用于多任务的通用抽象。该方法在持续学习设定下表现出极强的鲁棒性即使在任务顺序随机打乱的情况下仍能稳定积累知识克服了传统方法对课程学习顺序的依赖。个人观点论文突破了测试时学习依赖梯度更新或外部奖励的限制引入了“未来信息增益”概念。这使得系统不仅能利用现有知识解决问题还能主动筛选出具有长远演化潜力的知识单元。

微信小程序数据可视化终极指南：3步搞定ECharts图表开发

微信小程序数据可视化终极指南：3步搞定ECharts图表开发【免费下载链接】echarts-for-weixin 基于 Apache ECharts 的微信小程序图表库项目地址: https://gitcode.com/gh_mirrors/ec/echarts-for-weixin 还在为微信小程序的数据展示发愁吗？想让你…...

2026/6/6 12:48:21 阅读更多 →

LabVIEW串口调试助手开发：从数据流原理到工程实践

1. 项目概述与设计初衷在嵌入式开发、工业控制、仪器仪表调试的日常工作中，串口调试助手是工程师手中不可或缺的“瑞士军刀”。无论是查看单片机打印的日志，还是与PLC、传感器、模块进行数据交互，一个稳定、高效、功能齐全的串口工具能极大提…...

2026/6/6 12:48:19 阅读更多 →

【2024最新验证】CSDN AI能否替代SEO/信息流？127份接单案例对比报告揭示：仅19.3%程序员用对了关键参数！

更多请点击： https://intelliparadigm.com 第一章：自由程序员接单能用 CSDN AI 数字营销引流吗？ CSDN 近期上线的 AI 数字营销工具（如“AI 内容助手”“智能SEO优化插件”“流量热力图分析”等），为自由程…...

2026/6/6 12:47:31 阅读更多 →

掌握Markdown实时预览：打造高效写作工作流的3个关键策略

掌握Markdown实时预览：打造高效写作工作流的3个关键策略【免费下载链接】markn Lightweight markdown viewer. 项目地址: https://gitcode.com/gh_mirrors/ma/markn 在当今数字创作时代，Markdown已成为技术文档、博客文章和个人笔记的首选格式。…...

2026/6/5 8:33:56 阅读更多 →

Win10/Win11下Realtek 8188GU网卡驱动感叹号？别急着扔，试试这个手动安装的野路子

Realtek 8188GU网卡驱动故障深度修复指南：从原理到实战当设备管理器里那个顽固的黄色感叹号挥之不去，而你已经尝试了所有"标准操作"——Windows自动更新、第三方驱动工具、甚至重启大法——却依然无济于事时，是时候换个思路了。这篇…...

2026/6/5 5:07:10 阅读更多 →

前轮驱动自行车机器人建模与自适应控制策略优化【附代码】

✨ 长期致力于自行车机器人、前轮驱动、Lagrange方程、自适应模糊控制、RBF网络自适应控制研究工作，擅长数据搜集与处理、建模仿真、程序编写、仿真设计。 ✅ 专业定制毕设、代码 ✅ 如需沟通交流，点击《获取方式》 （1）基于瞬时转…...

2026/6/5 5:07:29 阅读更多 →

ModTheSpire终极指南：5分钟安全安装《杀戮尖塔》模组管理器

ModTheSpire终极指南：5分钟安全安装《杀戮尖塔》模组管理器【免费下载链接】ModTheSpire External mod loader for Slay The Spire 项目地址: https://gitcode.com/gh_mirrors/mo/ModTheSpire 还在为《杀戮尖塔》模组安装的复杂流程而头疼吗？Mod…...

2026/6/4 8:10:02 阅读更多 →