收藏！小白程序员轻松入门RAG，让大模型不再“幻觉”，智能查阅资料秒变专家！

张

张建站

2026/4/18 8:52:31

10分钟阅读

本文介绍了RAG技术如何解决大模型知识局限、无法获取最新信息、访问私有数据及易产生幻觉的问题。RAG通过“检索增强生成”的方式在模型回答前先“查资料”如同给大模型开卷考试提升回答准确性。文章详细阐述了RAG的三阶段工作流程数据准备文档切分、向量化、存入向量数据库、检索阶段问题向量化、相似度搜索和生成阶段结合检索内容与用户问题输入大模型。通过简易RAG实现步骤帮助读者理解并应用RAG技术让大模型回答更贴近实际。前言你是否遇到过这种情况向朋友提问他不查资料、不思考验证随口给出看似合理实则编造的答案。大模型也类似很多时候它不是“查询信息”而是“基于知识储备推测合理答案”这就是“大模型幻觉”产生的原因。那有没有办法让模型回答前先“查阅资料”呢今天介绍的RAG技术就能做到。RAG虽听起来高深核心却只有“检索”与“生成”即先检索、再生成也就是“检索增强生成”。为什么要用RAG先看一个本质问题传统大模型的局限。大模型LLM的知识来源是训练数据互联网语料和固定时间点有知识截止因此存在三个致命问题无法获取最新信息、无法访问私有数据如文档、数据库以及容易编造答案幻觉。RAG的核心思路可以一句话总结在模型回答问题之前先“查资料”再回答。也就是不直接让LLM“凭记忆回答”而是给它“开卷考试”回答也就更贴近实际。RAG到底是怎么工作的举个例子在一份上百页的文档中只有极少部分内容对用户有用。RAG技术会将这份文档切分为若干片段然后筛选出真正对用户有用的5个片段与用户的提问一同发送给大模型。这样大模型便只需处理这5个片段而非整个文档。但这只是一个简化的步骤为了更直观感受下面是我用Gemini生成的一个RAG架构图RAG本质上是一个三阶段流程数据准备离线阶段首先需要完成知识库的构建工作具体分为三个步骤Step1文档切分Chunking将长文本拆分为适合处理的小块常见方式包括按每段200~500字划分或按语义逻辑切分。比如这是因为大模型单次处理的上下文长度存在限制。Step2向量化Embedding将每个文本块转换为向量形式例如RAG可以提升回答准确性会被转化为[0.12, -0.98, …]这样的向量。其核心原理是语义相似的文本对应的向量距离更近。Step3存入向量数据库常用的向量数据库方案有FAISS本地部署、Milvus分布式系统和Chroma轻量级工具。完成这一步后就构建出了一个可高效搜索的知识库。检索阶段在线当用户提出问题时系统会执行以下操作Step1问题向量化将用户问题转换为向量形式Step2相似度搜索在向量数据库中查找最相关的Top-K文本块通常K取值为3或5。生成阶段LLM将检索到的内容与用户问题一同输入大模型格式示例如下已知信息[文档片段1]、[文档片段2]问题RAG的作用是什么请基于以上信息回答这一阶段的关键在于模型不再依赖记忆瞎猜而是基于检索到的证据进行回答。简易RAG实现为确保RAG测试的准确性我先让AI生成了一篇虚构文章随后将该文章输入RAG系统使其基于这篇文章回答相关问题。下面第一步文档切片我是按照制表符进行切分的这里是可以看到我们准备的文章被分成了很多片段第二步向量化加载一个中文预训练嵌入模型shibing624/text2vec-base-chinese将中文文本转换为数值变量并为所有段落生成嵌入向量这里首次加载模型可能得等几分钟。第三步存入向量数据库这一步就是把嵌入向量存入向量数据库到这在用户提问之前的数据准备工作就全部完成了。第四步向量检索将用户的问题生成对应语义向量根据向量相似度在向量数据库中进行检索。第五步重排序如果只使用向量检索可能会检索出很多相关片段但上下文窗口有限而且噪音也会污染模型所以需要进行重排序。一句话总结就是向量检索负责“找可能相关的”重排序负责“找最相关的”。第六步生成回答这里使用了Gemini的API Key将我们检索出的片段与用户问题一同输入大模型再通过制定Prompt引导模型生成答案。到这里我们的简易RAG系统就已全部实现了。完整优化后的代码及相关资料我已整理至公众号后台感兴趣的伙伴可在后台私信【简易RAG系统】领取。总结RAG本质上并非让模型变得更聪明而是让模型不再单纯依赖“记忆”而是学会“查资料”。若作类比LLM就像是“大脑”那么RAG则相当于为它配备了一套“搜索引擎笔记系统”。未来的大模型应用不会是“单纯的模型能力竞争”而是“模型数据检索能力”的组合竞争。如何学习大模型 AI 由于新岗位的生产效率要优于被取代岗位的生产效率所以实际上整个社会的生产效率是提升的。但是具体到个人只能说是“最先掌握AI的人将会比较晚掌握AI的人有竞争优势”。这句话放在计算机、互联网、移动互联网的开局时期都是一样的道理。我在一线科技企业深耕十二载见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事早已在效率与薪资上形成代际优势我意识到有很多经验和知识值得分享给大家也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。我们整理出这套AI 大模型突围资料包✅ 从零到一的 AI 学习路径图✅ 大模型调优实战手册附医疗/金融等大厂真实案例✅ 百度/阿里专家闭门录播课✅ 大模型当下最新行业报告✅ 真实大厂面试真题✅ 2026 最新岗位需求图谱所有资料 ⚡️ 朋友们如果有需要《AI大模型入门进阶学习资源包》下方扫码获取~① 全套AI大模型应用开发视频教程包含提示工程、RAG、LangChain、Agent、模型微调与部署、DeepSeek等技术点② 大模型系统化学习路线作为学习AI大模型技术的新手方向至关重要。正确的学习路线可以为你节省时间少走弯路方向不对努力白费。这里我给大家准备了一份最科学最系统的学习成长路线图和学习规划带你从零基础入门到精通③ 大模型学习书籍文档学习AI大模型离不开书籍文档我精选了一系列大模型技术的书籍和学习文档电子版它们由领域内的顶尖专家撰写内容全面、深入、详尽为你学习大模型提供坚实的理论基础。④ AI大模型最新行业报告2025最新行业报告针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估以了解哪些行业更适合引入大模型的技术和应用以及在哪些方面可以发挥大模型的优势。⑤ 大模型项目实战配套源码学以致用在项目实战中检验和巩固你所学到的知识同时为你找工作就业和职业发展打下坚实的基础。⑥ 大模型大厂面试真题面试不仅是技术的较量更需要充分的准备。在你已经掌握了大模型技术之后就需要开始准备面试我精心整理了一份大模型面试题库涵盖当前面试中可能遇到的各种技术问题让你在面试中游刃有余。以上资料如何领取为什么大家都在学大模型最近科技巨头英特尔宣布裁员2万人传统岗位不断缩减但AI相关技术岗疯狂扩招有3-5年经验大厂薪资就能给到50K*20薪不出1年“有AI项目经验”将成为投递简历的门槛。风口之下与其像“温水煮青蛙”一样坐等被行业淘汰不如先人一步掌握AI大模型原理应用技术项目实操经验“顺风”翻盘这些资料真的有用吗这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理现任上海殷泊信息科技CEO其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证服务航天科工、国家电网等1000企业以第一作者在IEEE Transactions发表论文50篇获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的技术人员这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。以上全套大模型资料如何领取

【收藏级】0基础入门大模型全栈学习路径，程序员小白必看（避坑指南+实战方向）

零基础想入门大模型，LangChain、Transformer、BERT这些核心技术确实需要掌握，但要是一上来就死磕这些复杂内容，那就彻底走偏了！很多小白和刚接触大模型的程序员，都容易陷入“先啃理论、再学应用”的误区，最…...

2026/4/18 8:52:30 阅读更多 →

收藏！小白/程序员必看，大模型入门避坑+转行实战指南（附0-6个月路线）

这两年，大模型彻底打破实验室的壁垒，从高深的技术研究，走进了程序员、在校学生、跨行业转行者的日常工作与职业规划中。打开技术交流群，大模型相关的讨论此起彼伏；梳理自身职业路径，越来越多人想抓住这波技…...

2026/4/18 8:52:29 阅读更多 →

Front Matter媒体管理完全教程：从上传到插入的最佳实践

Front Matter媒体管理完全教程：从上传到插入的最佳实践【免费下载链接】vscode-front-matter Front Matter is a CMS running straight in Visual Studio Code. Can be used with static site generators like Hugo, Jekyll, Hexo, NextJs, Gatsby, and many more.…...

2026/4/18 8:50:13 阅读更多 →

为了过等保，我们给200+服务器做了OpenSSH 10.0自动化升级，这是完整复盘

企业级OpenSSH 10.0自动化升级实战：从合规需求到批量落地当安全合规成为企业IT建设的刚性需求，基础组件的漏洞修复便从技术问题升级为战略任务。去年某次内部审计中，我们发现全公司237台服务器中，68%的OpenSSH版本存在高危漏洞&a…...

2026/4/16 22:05:04 阅读更多 →

用AI给显示器装上‘眼睛’：复旦博士的EyeReal方案，如何用三层LCD和RTX 4090实现桌面级裸眼3D？

EyeReal技术解析：三层LCDRTX 4090如何重构裸眼3D显示范式当24英寸显示器上跃然而出的立体影像不再需要特制眼镜时，我们或许正站在显示技术革命的临界点。复旦大学马炜杰博士团队发表在《Nature》的EyeReal方案，用三层普通LCD面板和消费级显卡…...

2026/4/16 14:29:57 阅读更多 →

5步轻松打造个人离线小说图书馆：番茄小说下载器完全指南

5步轻松打造个人离线小说图书馆：番茄小说下载器完全指南【免费下载链接】Tomato-Novel-Downloader 番茄小说下载器不精简版项目地址: https://gitcode.com/gh_mirrors/to/Tomato-Novel-Downloader 番茄小说下载器是一款功能强大的开源工具，专为…...

2026/4/18 10:31:36 阅读更多 →