大语言模型基础（LLM）大语言模型（Large Language Model-周红伟

张

张建站

2026/5/1 7:07:09

10分钟阅读

大语言模型基础（LLM）大语言模型（Large Language Model-周红伟

大语言模型基础LLM大语言模型Large Language Model简称 LLM是 AI Agent 的大脑理解它是构建智能 Agent 的基础。大语言模型之所以能与你对话、写文章、编程本质上是它在根据你给出的文本提示一个字一个字地猜出最合理的下文。简单来说大语言模型是一个经过海量文本数据训练的深度学习模型它能够理解和生成人类语言。大语言模型通过分析互联网上的海量文本学习语言的统计规律当收到输入时根据学到的规律生成最合理的续写。我们可以把大语言模型想象成一个极其用功、记忆力超群的学生学习阶段训练它阅读了互联网上几乎所有公开的文本——书籍、文章、网页、代码等数据量可达万亿单词级别。在这个过程中它不是在背诵而是在学习一套极其复杂的语言规律。应用阶段推理当你向它提问或给出指令时它就会运用学到的规律一个字接一个字地生成出最合乎逻辑和语境的回答。它的大主要体现在两个方面参数规模大模型内部有数百亿甚至上万亿个可调节的参数记录了学到的语言知识。训练数据大用于训练的文本数据量巨大涵盖互联网公开信息的精华。下图展示了 LLM 逐词生成文本的过程——它每次只预测一个词然后将这个新词纳入输入继续预测下一个词如此循环直到生成完整回答第一步今天天气LLM计算概率分布很输入文本预测词加入下步输入第二步今天天气很LLM计算概率分布好如此循环逐词生成完整回答尽管 LLM 很强大但它也有明确的局限性能力说明局限性知识截止训练数据有截止日期无法获知训练后的新信息数学计算能做简单计算复杂计算容易出错实时信息需要外部工具辅助本身无法获取实时数据事实准确性可能生成错误信息需要事实核查长文本处理上下文长度有限制超长文本会丢失信息逻辑一致性可能前后矛盾需要仔细设计和验证重要提醒LLM 不是全知全能的它本质上是基于统计的模式匹配系统。理解它的局限性才能更好地利用它的能力。核心工作原理Transformer 架构简析LLM 的惊人能力离不开其底层核心技术——Transformer 架构。不需要深究复杂的数学原理但可以理解它的核心思想。想象你要写一篇关于太阳系的文章通读资料你会先看很多相关的书籍和网页。抓住重点你会注意到太阳、行星、轨道、引力这些词频繁出现且相互关联。组织语言根据你想表达的重点比如介绍火星你会选择性地运用之前看到的关于火星大小、颜色、位置等信息并组织成通顺的句子。Transformer 的工作方式与此类似它的核心流程分为三个阶段输入处理你的话被拆分成词或字Token并转换成计算机能理解的数字向量。理解上下文核心自注意力机制Self-Attention开始工作。它让模型在处理句子中每一个词时都能权衡句子中所有其他词的重要性。这个过程是并行的速度极快。生成与循环模型基于对所有词的理解计算出概率分布预测下一个最可能出现的词。选中并输出这个词后将其作为新的输入重复整个过程直到生成完整回答。自注意力机制是 Transformer 最关键的创新。以句子苹果的手机它的电池很大为例当模型处理它这个词时自注意力机制会帮助模型判断它与苹果和手机高度相关。下图展示了这一过程中的注意力权重分布苹果手机它电池很大「它」查询词已高亮对各词的注意力权重高权重中权重低权重弧线越粗、颜色越深表示模型越关注该词正是这种能并行处理并深度理解全局上下文的能力使得基于 Transformer 的 LLM 在语言任务上远超以往技术如 RNN。如何与 LLM 交互Prompt 工程入门Prompt提示词是你给 LLM 的输入它告诉模型你想要什么就像给助理下达指令——指令越清晰结果越好。Prompt 的质量直接决定了回答的质量。一个好的 Prompt 通常由以下四个部分组成上下文角色与背景指令明确任务目标示例可选范例与反例格式要求输出格式与长度四个模块共同构成一条清晰、完整的提示词基本原则明确具体避免模糊表达。不要说写点关于狗的东西而应该说用生动活泼的语言为 6-8 岁儿童写一段 100 字左右的关于金毛寻回犬性格特点的简短介绍。提供上下文告诉模型你的身份、背景和目标。例如你是一位经验丰富的 Python 编程导师。请向一个刚学完基本语法的初学者解释什么是列表推导式并提供一个简单的例子。指定格式如果需要特定格式的输出请明确说明例如请将以下要点总结为三个 bullet points 或请以 JSON 格式输出。分步思考Chain-of-Thought对于复杂问题可以在 Prompt 中引导模型逐步推理例如请一步一步地分析这个问题先列出已知条件再推导中间步骤最后给出结论。这种方式能显著提升复杂推理任务的准确率。LLM 的常见应用场景场景类别具体示例说明内容创作与编辑撰写邮件、报告、博客续写故事润色文案翻译不同风格文本快速生成草稿提供灵感和多种表达方式信息检索与总结快速阅读长文档并提炼核心观点基于知识库的问答比传统搜索更理解问题能进行归纳和整合编程辅助解释代码、生成代码片段、调试错误、重构代码、编写测试用例充当全天候的编程伙伴极大提升开发效率对话与客服智能聊天机器人、个性化导师、角色扮演提供拟人化、上下文连贯的交互体验逻辑推理与分析解数学题、进行基础逻辑推理、分析数据趋势、制定计划在限定领域内展示出令人惊讶的推理能力API 调用与参数设置要构建 AI Agent你需要学会如何通过 API 调用 LLM。本章节我们以 OpenAI API 为例介绍基本的调用方法。openai 是一个强大的 Python 库用于与 OpenAI 的一系列模型和服务进行交互详细内容参考Python OpenAI。开源地址https://github.com/openai/openai-python基础 API 调用1. 安装必要的库pip install openai然后需要去 OpenAI 官网注册账号并在 API 密钥页面生成一个 API Key。实例import osfrom openai import OpenAIclient OpenAI(# This is the default and can be omittedapi_key你申请的 API key,)response client.responses.create(modelgpt-4o,instructionsYou are a coding assistant that talks like a pirate.,inputHow do I check if a Python object is an instance of a class?,)print(response.output_text)我们国内目前访问 openai 还是有点麻烦国内很多也支持 openai比如 DeepSeek、阿里的千问。DeepSeekDeepSeek API 完全兼容 OpenAI 的 API 格式只需修改少量配置即可直接使用 OpenAI SDK 或兼容工具访问 DeepSeek API。核心配置参数:参数取值/说明base_url必填固定值https://api.deepseek.com也可填https://api.deepseek.com/v1仅为兼容OpenAIv1与模型版本无关api_key必填需先在 DeepSeek 官网申请专属 API Key申请地址https://platform.deepseek.com/model必填deepseek-v4-flash对应 DeepSeek 的非思考模式响应速度快适合常规问答deepseek-v4-pro对应 DeepSeek 的思考模式推理能力更强适合复杂问题求解。实例import osfrom openai import OpenAI# 初始化客户端核心配置替换为你的API Keyclient OpenAI(api_keyos.environ.get(DEEPSEEK_API_KEY), # 推荐通过环境变量配置也可直接写死不推荐base_urlhttps://api.deepseek.com # DeepSeek 固定域名)# 调用对话APItry:response client.chat.completions.create(modeldeepseek-v4-flash, # 指定模型可选 deepseek-v4-flash / deepseek-v4-promessages[{role: system, content: You are a helpful assistant}, # 系统角色定义{role: user, content: Hello}, # 用户提问],streamFalse # 非流式输出一次性返回完整结果)# 打印回复内容print(回复结果, response.choices[0].message.content)except Exception as e:print(调用失败, str(e))阿里百炼阿里云百炼的通义千问模型支持 OpenAI 兼容接口您只需调整 API Key、BASE_URL 和模型名称即可将原有 OpenAI 代码迁移至阿里云百炼服务使用。我们需要开通阿里云百炼模型服务并获得 API-KEY。我们可以先使用阿里云主账号访问百炼模型服务平台https://bailian.console.aliyun.com/然后点击右上角登录登录成功后点击右上角的齿轮⚙️图标选择 API key然后复制 API key如果没有也可以创建 API key开通阿里云百炼不会产生费用仅模型调用超出免费额度后、模型部署、模型调优会产生相应计费。现在要使用 API都需要按 token 来计费还好都不贵我们可以先购买个最便宜的包阿里云百炼大模型服务平台。也可以直接使用百炼与方舟的 Coding Plan 套餐https://www.runoob.com/claude-code/coding-plan.html。使用方式接下来我们使用 OpenAI SDK 访问百炼服务上的通义千问模型。非流式调用示例实例from openai import OpenAIimport osdef get_response():client OpenAI(api_keysk-xxx, # 请用阿里云百炼 API Keybase_urlhttps://dashscope.aliyuncs.com/compatible-mode/v1, # 填写DashScope SDK的base_url)completion client.chat.completions.create(modelqwen-plus, # 此处以qwen-plus为例可按需更换模型名称。模型列表https://help.aliyun.com/zh/model-studio/getting-started/modelsmessages[{role: system, content: You are a helpful assistant.},{role: user, content: 你是谁}])# json 数据#print(completion.model_dump_json())print(completion.choices[0].message.content)if __name__ __main__:get_response()运行代码可以获得以下结果我是通义千问阿里巴巴集团旗下的通义实验室自主研发的超大规模语言模型。我可以帮助你回答问题、创作文字比如写故事、写公文、写邮件、写剧本、逻辑推理、编程等等还能表达观点玩游戏等。如果你有任何问题或需要帮助欢迎随时告诉我流式调用示例实例from openai import OpenAIdef get_response():client OpenAI(api_keysk-xxx,base_urlhttps://dashscope.aliyuncs.com/compatible-mode/v1,)completion client.chat.completions.create(modelqwen-plus,messages[{role: system, content: You are a helpful assistant.},{role: user, content: 你是谁}],streamTrue,stream_options{include_usage: True})for chunk in completion:# chunk 里可能没有 choices 或 deltaif hasattr(chunk, choices) and len(chunk.choices) 0:choice chunk.choices[0]if hasattr(choice, delta) and hasattr(choice.delta, content):print(choice.delta.content, end, flushTrue)if __name__ __main__:get_response()运行代码可以获得以下结果我是通义千问阿里巴巴集团旗下的通义实验室自主研发的超大规模语言模型。我可以帮助你回答问题、创作文字比如写故事、写公文、写邮件、写剧本、逻辑推理、编程等等还能表达观点玩游戏等。如果你有任何问题或需要帮助欢迎随时告诉我主流大语言模型以下是主流大语言模型的官网与 API 文档地址整理模型名称所属公司/组织官网API文档地址GPT系列 (GPT-5.2/GPT-4o)OpenAIhttps://openai.com/https://platform.openai.com/docs/api-referenceClaude系列 (Opus 4.6/Sonnet 4.5)Anthropichttps://www.anthropic.com/https://docs.anthropic.com/claude/reference/getting-started-with-the-apiGemini系列 (Gemini 3 Pro/Flash)Googlehttps://deepmind.google/technologies/gemini/https://docs.gemini.com/rest-api/通义千问 (Qwen 3.0系列)阿里巴巴https://www.qianwen.com/https://help.aliyun.com/zh/dashscope/developer-reference/api-details文心一言 (ERNIE 5.0系列)百度https://yiyan.baidu.com/https://qianfan.cloud.baidu.com/docs/智谱清言 (GLM-4.7系列)智谱AIhttps://chatglm.cn/https://open.bigmodel.cn/dev/apiKimi (Moonshot K2.5系列)月之暗面https://kimi.moonshot.cn/https://platform.moonshot.cn/docs/api/chat讯飞星火大模型科大讯飞https://xinghuo.xfyun.cn/https://www.xfyun.cn/doc/spark/Web.htmlDeepSeek系列DeepSeekhttps://www.deepseek.com/https://api-docs.deepseek.com/Llama系列 (Llama 3.1/Llama 4)Metahttps://www.llama.com/https://www.llama.com/docs/overview/Grok系列 (Grok 4.1)xAIhttps://x.ai/https://docs.x.ai/overviewMiniMax (M2.1系列)MiniMaxhttps://www.minimaxi.com/https://api.minimax.chat/docs/api/百川智能 (Baichuan 3系列)百川智能https://www.baichuan-ai.com/https://platform.baichuan-ai.com/docs/apiOllama (本地部署模型)Ollamahttps://ollama.com/https://github.com/ollama/ollama/blob/main/docs/api.md豆包大模型字节跳动https://www.doubao.com/https://www.volcengine.com/docs/82379/1399008?

THINKROUTER：大模型推理的置信度路由优化技术

1. THINKROUTER：大模型推理的置信度路由革命当大型语言模型（LLM）在解决复杂数学题时突然"固执己见"地给出错误答案，或者在代码生成时陷入无意义的循环，这些现象背后往往隐藏着一个关键问题：模型…...

2026/5/1 7:06:27 阅读更多 →

车间设备实时监控难在哪？边缘计算网关才是答案

某家年产值过亿的机械加工厂。生产车间里六十八台设备。数控车床、加工中心、磨床、冲压机，品牌五花八门。老板花了四十万上了MES系统。结果呢。数据还是靠人抄。每两小时巡一次线，拿手写板记设备状态。设备编号、运行时间、报警代码，全部手填…...

2026/5/1 6:54:25 阅读更多 →

hermes agent 框架如何对接 taotoken 平台的自定义模型提供商

Hermes Agent 框架如何对接 Taotoken 平台的自定义模型提供商 1. 准备工作在开始对接前，请确保已安装 Hermes Agent 框架并完成基础配置。同时需要在 Taotoken 平台获取有效的 API Key 和模型 ID。登录 Taotoken 控制台，在「API 密钥」页面创建新密钥&a…...

2026/5/1 6:51:04 阅读更多 →