一套企业级 RAG 问答系统的实现记录（Spring AI Alibaba ReactAgent + Qdrant）

张

张建站

2026/4/14 1:18:07

10分钟阅读

一套企业级 RAG 问答系统的实现记录（Spring AI Alibaba ReactAgent + Qdrant）

这段时间我基于知识库做了一套问答系统。一开始的想法其实很简单把已有的文档用“问答”的方式更方便地用起来。做的过程中也踩了一些坑。有些地方效果还可以有些地方也还有不少可以继续优化。这篇文章主要是把这次实现过程中的一些做法整理一下。如果你刚好也在做 RAG或许能有一点参考价值。整体思路一个简单的 RAG 流程拆解这套实现主要是基于Spring AI Alibaba ReactAgent来做 Agent 编排向量检索使用的是Qdrant。如果从流程上看可以拆成四个阶段文档处理 → 索引增强 → 检索 → 问答生成对应到实现大概是文档处理语雀 / Markdown → 清洗 → 切块索引增强提取标题、关键词、摘要检索向量检索 BM25 融合排序问答Query Rewrite Agent 多次检索生成答案这几部分拼在一起就是一条比较完整的 RAG 链路。第一步先解决“文档从哪里来”知识源我这边主要用了两类语雀知识库本地 Markdown 文档这里有一个小处理不只是拿正文会把目录结构一起保留下来因为在后面切块的时候目录其实就是天然的上下文信息。⚙️ 第二步文档清洗这一层比较基础但有必要文档拿到之后我没有直接做 embedding。而是先做了一轮清洗去掉无关图片去掉注释和杂质保留代码块统一成 Markdown 文本这一层不复杂但如果不做后面的问题会被放大。✂️ 第三步切块Chunking 比想象中更重要RAG 里一个很容易被忽略的点是文档怎么切很多实现是固定 token 切分或者简单按段落切但这样容易有一个问题上下文被切断我这边采用的是目录结构字数控制大致规则内容不长 → 一个块太长 → 按一级标题切还长 → 按二级标题再长 → 按段落核心逻辑类似这样ListMarkdownUtils.ChunkResult chunks MarkdownUtils.splitWithContext(content, docContext);for (MarkdownUtils.ChunkResult chunk : chunks) { FeaturePoint point extractFromChunk(chunk);}这里我比较在意一点每个 chunk 都必须有“能承接上下文的标题”不是为了好看而是为了表达来自哪篇文档属于哪个目录当前在讲什么可以理解为每个 chunk 是一个“最小语义单元”而不是一段随机文本第四步索引增强不是只存正文切块之后我没有直接入向量库。而是做了一步“信息补充” 提取关键词摘要这里其实有一个小调整过程一开始我是用 Agent 来做关键词提取的。但后面用下来做了一次改动关键词提取改成了代码实现原因比较实际关键词提取更偏规则型任务用代码更稳定、可控调整成本也更低摘要这块如果有需要仍然可以用模型辅助。最终会把这些信息一起存下来QaPair pair QaPair.builder() .featureTitle(point.title()) .featureKeyword(point.keywords()) .featureSummary(point.summary()) .featureContent(point.content()) .build();这里一个比较直观的体会是不是所有环节都适合用 Agent规则明确的地方用工程逻辑反而更合适。第五步向量化拼的不只是内容在向量化时我没有只用正文。而是把这些信息拼在一起标题关键词摘要正文再写入 Qdrant。原因是在企业场景里很多关键信息其实在标题和关键词里比如菜单名字段名功能名如果只 embedding 正文反而容易丢信息。可以简单理解为我不是在存“内容”而是在存“更容易被检索到的内容” 第六步检索向量 BM25 的混合检索检索这一层我没有只用向量检索。因为在实际场景里纯向量检索会有一些问题对精确词不敏感有时候语义相关但不准确所以这里做了一层混合检索向量检索负责语义召回BM25负责关键词命中RRF对多路结果做融合排序核心逻辑类似这样ListDocument vectorResults performVectorSearch(query, vectorTopK, similarityThreshold);ListDocument keywordResults performKeywordSearch(query, bm25TopK);ListDocument mergedResults mergeWithRRF(vectorResults, keywordResults, finalTopK);这样处理之后在我的测试场景里命中效果会相对稳定一些尤其是一些“精确名称类问题”。第七步Query Rewrite多轮对话的关键在多轮对话场景下我加了一层 Query Rewrite。用户问题不会直接进入检索而是先改写当前问题最近几轮对话 → 一个完整问题比如用户说“这个怎么配”“为什么不行”如果直接查基本命不中。改写之后会变成一个更明确的问题再进入检索。本质上这一步是在做Query Reformulation查询重写用来解决对话中的上下文缺失问题。第八步让 Agent 参与“检索过程”最后才进入问答阶段。这里我没有做成检索一次 → 直接生成答案而是让 ReactAgent 可以多次调用检索工具比如换关键词再查多轮查再组织答案核心注册方式类似return ReactAgent.builder() .name(QA-Chat-Agent) .model(chatModel) .methodTools(vectorSearchTool) .build();这种方式更接近 “在查资料”而不是“直接生成”学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

嵌入式设计模式之适配器模式（1）

适配器模式的核心思想将一个类的接口转换成客户端期望的另一个接口，使原本接口不兼容的类可以一起工作。嵌入式适配器模式解决的典型问题1. 新旧硬件接口兼容问题问题场景旧系统使用模拟传感器（电压输出0-5V）新系统使用数字传感器&#xff08…...

2026/4/14 1:16:15 阅读更多 →

Protege与OWL API实战：智能家居推理引擎开发指南

1. 智能家居推理引擎开发入门第一次接触语义网和OWL语言时，我完全被这些概念搞懵了。作为通信工程专业的学生，我的本科毕设题目《基于家居环境的智能推理引擎设计》让我踏入了这个陌生领域。现在回想起来，当初要是有人能给我一份通俗易懂的指…...

2026/4/14 1:16:10 阅读更多 →

网络工程革新：大数据技术对网络工程的深度影响与变革（超详细解析）

网络工程革新：大数据技术对网络工程的深度影响与变革（超详细解析）前言一、大数据技术：核心概念1.1 定义1.2 网络工程中的大数据来源二、大数据技术：对网络工程的五大核心影响2.1 网络监控：从“单点看状态”…...

2026/4/14 1:13:12 阅读更多 →

为了过等保，我们给200+服务器做了OpenSSH 10.0自动化升级，这是完整复盘

企业级OpenSSH 10.0自动化升级实战：从合规需求到批量落地当安全合规成为企业IT建设的刚性需求，基础组件的漏洞修复便从技术问题升级为战略任务。去年某次内部审计中，我们发现全公司237台服务器中，68%的OpenSSH版本存在高危漏洞&a…...

2026/4/13 6:35:30 阅读更多 →

用AI给显示器装上‘眼睛’：复旦博士的EyeReal方案，如何用三层LCD和RTX 4090实现桌面级裸眼3D？

EyeReal技术解析：三层LCDRTX 4090如何重构裸眼3D显示范式当24英寸显示器上跃然而出的立体影像不再需要特制眼镜时，我们或许正站在显示技术革命的临界点。复旦大学马炜杰博士团队发表在《Nature》的EyeReal方案，用三层普通LCD面板和消费级显卡…...

2026/4/13 2:58:30 阅读更多 →

5步轻松打造个人离线小说图书馆：番茄小说下载器完全指南

5步轻松打造个人离线小说图书馆：番茄小说下载器完全指南【免费下载链接】Tomato-Novel-Downloader 番茄小说下载器不精简版项目地址: https://gitcode.com/gh_mirrors/to/Tomato-Novel-Downloader 番茄小说下载器是一款功能强大的开源工具，专为…...

2026/4/13 5:56:55 阅读更多 →