【LangChain】LangChain + 通义千问 + Chroma 实现本地知识库问答（附完整源码）

张

张建站

2026/5/10 1:46:52

10分钟阅读

【LangChain】LangChain + 通义千问 + Chroma 实现本地知识库问答（附完整源码）

书接上回前一篇文章点击直达简单说了下向量库相关知识这边文章主要讲解如何具体实现RAG简单实现原理都一样一、环境准备1. 安装依赖库创建 Python 环境执行以下命令安装核心依赖pip install langchain langchain_chroma langchain_community langchain_core pip install transformers torch sentence-transformers2. 准备 API Key前往阿里通义千问开放平台获取你的DASHSCOPE_API_KEY。二、核心代码实现完整源码更改通过上篇内容代码保存的向量库位置import os from langchain_chroma import Chroma from langchain_community.embeddings import HuggingFaceEmbeddings from langchain_community.llms import Tongyi from langchain_core.prompts import PromptTemplate from langchain_core.runnables import RunnablePassthrough from langchain_core.output_parsers import StrOutputParser # ---------------------- 配置 ---------------------- DB_DIR ./chroma_db/chroma_db_txt os.environ[DASHSCOPE_API_KEY] 你自己的KEY print(加载向量库...) # ---------------------- 向量库模型 ---------------------- embeddings HuggingFaceEmbeddings( model_nameBAAI/bge-large-zh-v1.5, model_kwargs{device: cuda}, encode_kwargs{normalize_embeddings: True} ) db Chroma(persist_directoryDB_DIR, embedding_functionembeddings) retriever db.as_retriever(search_kwargs{k: 5}) llm Tongyi(model_nameqwen-turbo, temperature0.1, max_tokens1024) # ---------------------- 提示词 ---------------------- template 你是一个专业的问答助手请根据下面的参考资料回答问题。如果参考资料中没有答案请直接说“没有找到相关信息”。参考资料 {context} 问题{question} 请回答并在最后列出你参考了哪些文件。回答格式要求【回答】 xxx 【参考文件】 xxx prompt PromptTemplate.from_template(template) # ✅ 修复把内容文件名一起传给模型 def format_docs(docs): formatted [] for doc in docs: content doc.page_content filename doc.metadata.get(filename, 未知文件) formatted.append(f【内容】{content}\n【来源文件】{filename}) return \n\n------------------------\n\n.join(formatted) # 调试检索 def debug_retriever(query): print(\n 检索到的知识库内容 ) docs retriever.invoke(query) for i, doc in enumerate(docs): print(f[{i1}] {doc.metadata.get(filename, 未知文件)} | {doc.page_content}) print(\n) # RAG 链 rag_chain ( {context: retriever | format_docs, question: RunnablePassthrough()} | prompt | llm | StrOutputParser() ) # ---------------------- 启动 ---------------------- # 增加知识库向量标签补充回答文本来源 if __name__ __main__: print(\n 知识库启动成功输入 exit 退出) while True: query input(\n输入) if query.lower() exit: print(结束) break debug_retriever(query) answer rag_chain.invoke(query) print(\nAI, answer)三、代码核心解析1. Embedding 模型配置使用BAAI/bge-large-zh-v1.5中文 embedding 模型支持 GPU 加速生成的向量相似度更高检索效果更好。2. 向量库加载直接从本地持久化目录加载已构建好的 Chroma 向量库无需重复构建高效便捷。3. 检索器优化设置k5每次检索5 条最相关的知识库文本平衡精准度与响应速度。4. 文档格式化核心亮点自定义format_docs函数将文本内容来源文件名一起传给大模型实现答案溯源彻底解决大模型 “不知道自己参考了什么” 的问题5. RAG 链构建通过 LangChain 的链式调用串联检索→格式化→提示词→大模型→解析代码简洁、扩展性极强。6. 调试功能内置debug_retriever函数运行时会打印检索到的文本和来源文件方便排查检索效果。四、常见问题解决1. GPU 报错CUDA 不可用解决方案将 embedding 模型的device改为cpumodel_kwargs{device: cpu}

2026年重卡离合器选购指南：如何一眼分辨“好离合器”？

随着重卡大马力化（500-600马力常见）和长途高效物流需求增加，离合器必须同时满足大扭矩承载高耐热长寿命。选购核心指标：摩擦材料：优先陶瓷基或高性能有机材料，耐热>300℃。扭矩容量：匹配…...

2026/5/10 1:46:23 阅读更多 →

骑行升级！VTX316语音合成芯片，让电动车秒变“智能出行伙伴”

日常骑行电动车，你是否也有过这些烦恼？ 低头看仪表盘查电量、辨故障，分心瞬间藏着安全隐患；离车时匆忙健忘，总担心物品遗留车内；操作复杂繁琐，老人、新手上手困难…… 如今，这些骑…...

2026/5/10 1:45:37 阅读更多 →

企业官网搭建的坑，我替你踩过了：别等网站打不开才后悔

三年前，我帮朋友介绍了一家看上去“性价比极高”的官网搭建公司。价格便宜、模板漂亮、承诺一个月上线。结果呢？网站上线不到半年，后台登录不了，联系对方才发现公司已经注销了。域名、源码、数据全在人家手里，想迁走&a…...

2026/5/10 1:44:34 阅读更多 →

2026年AI大模型API中转平台排名揭晓，诗云API(ShiyunApi)脱颖而出成省心之选

在AI开发领域，如何接入模型厂商的官方API是一个绕不开的现实问题。对于海外开发者来说，注册、绑卡、调用，三步即可轻松搞定。然而，国内开发者却面临着跨境网络波动、外币支付门槛、发票合规需求以及多厂商Key碎片化管理等诸多“非…...

2026/5/10 0:00:42 阅读更多 →

CANN/catlass TLA张量详解

TLA Tensors 【免费下载链接】catlass 本项目是CANN的算子模板库，提供NPU上高性能矩阵乘及其相关融合类算子模板样例。项目地址: https://gitcode.com/cann/catlass 本文介绍 TLA 中的 Tensor。如果说 Layout 负责描述“逻辑坐标如何映射到内存”&#xf…...

2026/5/10 0:01:42 阅读更多 →

LinkSwift：解锁九大网盘高速下载的终极浏览器脚本解决方案

LinkSwift：解锁九大网盘高速下载的终极浏览器脚本解决方案【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 ，支持百度网盘 / 阿里云盘 / 中国移动云盘 / …...

2026/5/10 0:09:21 阅读更多 →