收藏级 | 从小白到精通：RAG系统调优3大方向与实战技巧

张

张建站

2026/7/8 14:38:09

10分钟阅读

前言RAG是一个系统性工程要达到较好的检索结果需要不断地对细节进行优化。为此我整理了RAG高级技术与调优的系统方法主要分为以下三个方向•1.知识库处理•2 .高效召回•3 .图谱检索一、知识库处理1.知识库问题生成当用户提问与知识切片的相似度不高时通过AI为每个知识切片生成可能的问题通过问题与问题的匹配来提高检索准确度。举例如下民用建筑规范条文原文6.6.2 卫生器具配置的数量应符合国家现行相关建筑设计标准的规定。男女厕位的比例应根据使用特点、使用人数确定。在男女使用人数基本均衡时男厕厕位(含大、小便器)与女厕厕位数量的比例宜为1111.5在商场、体育场馆、学校、观演建筑、交通建筑、公园等场所厕位数量比不宜小于11.512根据以上条文生成三种类型的问题1.直接问问根据《民用建筑设计统一标准》在商场、体育场馆这类场所女厕位数量与男厕位含小便器数量的比例最低不应小于多少2.对比问问在设计办公楼的厕所和商场的厕所时规范对男女厕位比例的要求有什么不同3.场景问问我正在为一个大型体育馆设计公共厕所。根据《民用建筑设计统一标准》在规划男、女厕位数量时我应该遵循怎样的比例要求来确保满足规范并避免女性排队过长将以上生成的问题与原知识切片与进行拼接然后再做向量化。这样可以大幅提升检索准确率。2.对话知识沉淀产品上线后每天产生大量对话其中隐藏着高频问题、用户真实需求、最新信息从这些对话中提取和沉淀有价值的知识持续丰富知识库。对于建筑规范问答而言高频问题以及用户的场景化描述是最有价值的信息。针对高频问题针对高频问题对应调整知识切片可增加高频问题回答正确率从而高效优化产品提升用户满意度。用户场景化描述用户的场景化描述一般都都明确指向了规范理解的重点和难点这恰恰也是RAG系统需要处理的重点与难点。例如1.“我想在商业综合体顶层加个员工餐厅目标但原设计是办公约束防火分区怎么调整核心问题“。这是最经典的场景化需求。2.“…和…有矛盾时以哪个为准”揭示了规范冲突点或用户理解难点。3“除了…规定有没有更经济的做法”揭示了成本敏感型需求。3.知识库健康度检查对整个知识库进行健康度检查找出缺少的知识、过期的知识、冲突的知识确保知识库的质量和可靠性。• 完整性是否可以覆盖用户高频问题• 时效性建筑规范是否为最新版本• 一致性是否存在规范冲突4.知识库版本管理与性能比较对知识库进行版本管理实现回归测试、上线前验收并比较不同版本的知识库性能选择最优版本。• 版本对比识别新增、修改、删除的知识切片• 性能测试在相同测试集上比较准确率与响应时间• 回归验证确保更新不会破坏原有问答能力。二、高效召回1.查询扩展使用大模型将用户查询改写成多个语义相近的查询提升召回多样性。在 LangChain旧版本中提供了MultiQueryRetriever支持多路查询召回新版本需要自己编写简单来讲就是一个问题变为多个问题通过多路召回提高覆盖度。例如原始问题楼梯踏步高度是多少扩展后多个问题1.楼梯踏步高度有什么规定2.踏步高度允许范围是多少3.民用建筑楼梯踏步尺寸要求4.楼梯踏步高度限制将以上4个问题同时去知识切片中检索得到的内容一定要比一个问题去检索来的更为全面。2.混合检索• BM25擅长精确匹配术语也就是关键词检索• 向量检索使用语义相似度去匹配也就是模糊检索通常情况下两者需要混合使用两者分数加权融合可根据场景更改权重。专业文档、法规查询权重偏向BM25口语化、泛化查询权重偏向向量检索。通过两者的配合可以极大的提高检索的准确率。3.重排序重排序Rerank主要用于优化初步检索结果的排序提高最终输出的相关性或准确性。重排序模型的精度和准确性要大于向量模型。如果你的个人知识库文档数量有限且你并不介意成本和响应时间那么在召回时可以直接使用重排序模型筛选出最相关的知识切片。一般的还是先进行向量检索再对召回的相关候选切片进行精细打分和重新排序。4.其他召回策略• 双向改写将查询扩展为文档或为文档生成关联查询• small-to-big特别适用于处理长文档或多文档场景。核心思想是通过小规模内容如摘要、关键句或段落建立索引并链接到大规模内容主体中。三、GraphRAGGraphRAG的核心创新在于它先利用知识图谱对文档库进行深度建模将非结构化的文本转化为结构化的知识网络然后基于这个图谱进行检索和推理。传统 RAG就像一个只能通过关键词在图书馆目录中搜索然后找到几本相关书页的助手。GraphRAG则像一位已经读完了整个图书馆的书并画出了一张详细“知识地图”的专家。当你提问时他不仅找到相关知识点还能根据地图理清来龙去脉和整体脉络。普通人如何抓住AI大模型的风口领取方式在文末为什么要学习大模型目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用大模型作为其中的重要组成部分正逐渐成为推动人工智能发展的重要引擎。大模型以其强大的数据处理和模式识别能力广泛应用于自然语言处理、计算机视觉、智能推荐等领域为各行各业带来了革命性的改变和机遇。目前开源人工智能大模型已应用于医疗、政务、法律、汽车、娱乐、金融、互联网、教育、制造业、企业服务等多个场景其中应用于金融、企业服务、制造业和法律领域的大模型在本次调研中占比超过30%。随着AI大模型技术的迅速发展相关岗位的需求也日益增加。大模型产业链催生了一批高薪新职业人工智能大潮已来不加入就可能被淘汰。如果你是技术人尤其是互联网从业者现在就开始学习AI大模型技术真的是给你的人生一个重要建议最后只要你真心想学习AI大模型技术这份精心整理的学习资料我愿意无偿分享给你但是想学技术去乱搞的人别来找我在当前这个人工智能高速发展的时代AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料能够帮助更多有志于AI领域的朋友入门并深入学习。真诚无偿分享vx扫描下方二维码即可加上后会一个个给大家发【附赠一节免费的直播讲座技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等欢迎大家~】大模型全套学习资料展示自我们与MoPaaS魔泊云合作以来我们不断打磨课程体系与技术内容在细节上精益求精同时在技术层面也新增了许多前沿且实用的内容力求为大家带来更系统、更实战、更落地的大模型学习体验。希望这份系统、实用的大模型学习路径能够帮助你从零入门进阶到实战真正掌握AI时代的核心技能01教学内容从零到精通完整闭环【基础理论 →RAG开发 → Agent设计 → 模型微调与私有化部署调→热门技术】5大模块内容比传统教材更贴近企业实战大量真实项目案例带你亲自上手搞数据清洗、模型调优这些硬核操作把课本知识变成真本事‌02适学人群应届毕业生‌无工作经验但想要系统学习AI大模型技术期待通过实战项目掌握核心技术。零基础转型‌非技术背景但关注AI应用场景计划通过低代码工具实现“AI行业”跨界‌。业务赋能突破瓶颈传统开发者Java/前端等学习Transformer架构与LangChain框架向AI全栈工程师转型‌。vx扫描下方二维码即可【附赠一节免费的直播讲座技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等欢迎大家~】本教程比较珍贵仅限大家自行学习不要传播更严禁商用03入门到进阶学习路线图大模型学习路线图整体分为5个大的阶段04视频和书籍PDF合集从0到掌握主流大模型技术视频教程涵盖模型训练、微调、RAG、LangChain、Agent开发等实战方向新手必备的大模型学习PDF书单来了全是硬核知识帮你少走弯路不吹牛真有用05行业报告白皮书合集收集70报告与白皮书了解行业最新动态0690份面试题/经验AI大模型岗位面试经验总结谁学技术不是为了赚$呢找个好的岗位很重要07 deepseek部署包技巧大全由于篇幅有限只展示部分资料并且还在持续更新中…真诚无偿分享vx扫描下方二维码即可加上后会一个个给大家发【附赠一节免费的直播讲座技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等欢迎大家~】

【开源计划】GitGitHub的学习笔记

1. Git工作流程 ——Git工作流示意图来自《Git工作流和核心原理 | GitHub基本操作 | VS Code里使用Git和关联GitHub》 ——Git命令数据流详细示意图 2. 代理设置 2.1 Ubuntu：【复制环境变量】功能 2.2 Windows: Git Bash 2.2.1 使用Clash提供的【复制环境变量】…...

2026/7/2 13:49:43 阅读更多 →

OpenClaw配置优化指南：提升Qwen2.5-VL-7B图文任务执行效率30%

OpenClaw配置优化指南：提升Qwen2.5-VL-7B图文任务执行效率30% 1. 为什么需要优化OpenClaw配置上周我在处理一批包含图文混合内容的自动化任务时，发现OpenClaw执行效率明显下降。一个简单的"读取图片-提取文字-生成摘要"流程，平均…...

2026/7/5 14:39:33 阅读更多 →

OpenClaw学术研究加速：Qwen3.5-9B文献图表数据提取全攻略

OpenClaw学术研究加速：Qwen3.5-9B文献图表数据提取全攻略 1. 为什么需要AI辅助学术数据处理去年冬天整理博士论文参考文献时，我对着300多篇PDF文献里那些格式各异的表格数据差点崩溃——手动复制粘贴不仅耗时，还容易出错。直到发现OpenCla…...

2026/6/18 16:06:57 阅读更多 →

解锁AMD Ryzen处理器深层性能：SMU Debug Tool完全指南

解锁AMD Ryzen处理器深层性能：SMU Debug Tool完全指南【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Table. 项目地址: https://gi…...

2026/7/7 9:57:31 阅读更多 →