本文深入探讨了Agent在大模型中的技术现状与落地挑战分析了ReAct和Plan-and-Execute ReAct两种主流决策框架的优缺点并结合实际项目经验提出了针对业务需求复杂性和框架局限性的优化方案。文章详细介绍了快慢思考模型结合、泛化工具定义、多智能体协作等关键技术点为程序员们提供了一套完整的技术解决方案助力Agent应用的实际落地与商业价值实现。2025 年被称为 Agent 元年很多与 Agent 相关的应用、框架和协议在如火如荼的迭代升级。但我的感受是市面上很多 ToC 的 Agent 应用看起来效果很惊艳但真正落地 ToB 场景产生商业价值能给企业带来实际收益的确寥寥无几。除开企业价值等因素单从技术层面以个人薄见主要原因有两点ToB 客户真实的需求场景往往很复杂需要深入挖掘了解业务才知道数据构建和技术应该朝什么方向演进当前 Agent 还处于探索阶段企业客户最关心的“稳定性”难以保证。总的来说客户需要的并不是某个单点技术能力而是一整套解决方案以保障效果和效率。下面分享下个人在实际项目做 Agent 应用过程中遇到的问题以及对现有 Agent 框架做了哪些优化。1、技术现状目前 Agent 主流的决策框架主要有 ReAct 和 Plan-and-Execute ReAct 两种1标准ReAct原理很简单就是用户问题进来后经过 Thought思考-Action返回待执行工具列表-Observation工具执行结果- Thought思考下一步要做什么-…- Answer总结回复这么一套链路。新手需注意大模型不会直接执行工具需要调用工具时只是返回 Action里面记录工具名称和入参由额外的编译器解析执行。图 1标准 ReAct 执行流程这里提到的 MCP 是大模型与外部资源通信的协议具体内容可自行查阅不在这里展开叙述。实际应用中对于单 Agent 的简单场景插件数量也很少可以不需要通过 MCP 协议直接手动补全写个 prompt 就行。标准 ReAct 的 prompt 模版如下Respond to the human as helpfully and accurately as possible.{{instruction}}You have access to the following tools:{{tools}}Use a json blob to specify a tool by providing an {{TOOL_NAME_KEY}} key (tool name) and an {{ACTION_INPUT_KEY}} key (tool input).Valid {{TOOL_NAME_KEY}} values: Final Answer or {{tool_names}}Provide only ONE action per $JSON_BLOB, as shown:{{{TOOL_NAME_KEY}}: $TOOL_NAME,{{ACTION_INPUT_KEY}}: $ACTION_INPUT}Follow this format:Question: input question to answerThought: consider previous and subsequent stepsAction:$JSON_BLOBObservation: action result... (repeat Thought/Action/Observation N times)Thought: I know what to respondAction:{{{TOOL_NAME_KEY}}: Final Answer,{{ACTION_INPUT_KEY}}: Final response to human}Begin! Reminder to ALWAYS respond with a valid json blob of a single action. Use tools if necessary. Respond directly if appropriate. Format is Action:$JSON_BLOBthen Observation:.Question:{{input}}------补充说明------{{instruction}}任务说明描述清楚你需要让模型解决什么问题具体的工作流程和注意事项等{{tools}}工具列表{{input}}用户输入的问题------执行过程------第一次调用大模型的输入放入user role中{{prompt}}Question:{{input}}返回Thought:...Action:...第一次调用工具解析执行器返回Observation:...第二次调用大模型的输入放入user role中{{prompt}}Question:{{input}}Thought:...Action:...Observation:...返回Thought:...Action:...第二次调用工具解析执行器返回Observation:......循环Thought/Action/Observation判断可以给用户总结回复返回Thought:...Action:{{{TOOL_NAME_KEY}}: Final Answer,{{ACTION_INPUT_KEY}}: ...}2Plan-and-Execute ReAct标准 ReAct 更像是“深度搜索”边规划边执行。而该方案类似“广度搜索”先规划后执行使用“1N”多智能体协作的方式先由“1”智能体给出执行计划在协调“N”方向智能体按计划的步骤执行当计划执行完毕后需要反馈给“1”判断是否需要给出新的执行计划如果不需要则给用户总结回复。“1”和“N”方向 Agent 的分工“1”主要负责 plan、异常处理、总结“N”负责具体的执行包括工具调用、异常上报、问答。图 2Plan-and-Execute ReAct 执行流程基于该方案还有进一步的衍生方案比如 LLMCompiler规划时生成一个 DAG 图来执行 Action可以理解成将多个工具聚合成一个工具执行图用拓扑图的方式执行任务。该方式可以并行执行多个无依赖关系的工具减少大模型调用次数以提高响应效率。图 3LLMCompiler 执行流程现在市面上主流的 Agent 框架如 langgraph、MetaGPT、AutoGen 和 CrewAI 等不过是对这 2 种决策模型的工程化实现不再一一介绍。2、项目落地过程中遇到的问题ReAct 框架目前的局限性1标准 ReAct标准 ReAct 框架简单易用非常适用于业务逻辑不复杂单 Agent 少量工具的简单场景。但问题也比较明显a. 最终的回复放在 Action 的 Json 中工程化时需要完整的把 Json 解析完才能给用户展示如果最终回复比较长且回复中可能还会包含其他业务需要大模型总结的结构化信息会导致用户等待时间较长感知不好。b. 每次只能规划调用 1 个工具当工具较多时会导致大模型调用次数增多响应时间太长但实际业务中有些工具之间没有依赖关系可以并行调用。c. 稳定性问题尤其有特定需求需要对标准的 prompt 框架做改动调整时更明显模型经常丢失如“Action:/Thought:”这样的前缀或者最终回复的前面没有经过 Thought 直接输出。2Plan-and-Execute ReAct这个框架看起来很美好先 Plan 再执行也支持并行调用多个工具。但实际使用中模型很难做完整正确的 Plan经常出现的是 Plan 的多个步骤之间有重复或存在缺失即使每次执行完后会重新反思 Replan但重新 Plan 的步骤可能还会出现和上次规划重复或输出与之前有矛盾的步骤需要靠 prompt 工程和复杂的异常处理机制来兜底且每次更换或更新模型相同的 prompt 就不能很好的 work 了调 prompt 就让人心力交瘁。业务需求的复杂性在讲述业务需求之前需要先讨论个概念即什么是 Agent客户、产品和技术侧对这个概念的理解存在差异1客户是一套智能体应用内部实现不一定是采用大模型任务规划。客户关注的是最终产品的展示形态如知识问答类 AI 客服和业务办理类 AI 客服客户认为是 2 个 Agent但内部可能就是 RAG/DeepSearch 问答或通过 workflow 画布流程配置实现。2产品是一个智能体平台支持 2 种配置模式workflow 画布流程静态任务规划另一种是 agentic 的方式无画布流程的动态任务规划3算法我们理解的 Agent 主体是以纯大模型的动态任务规划为主包括多智能体协同以及如何与产品更好的结合。结合刚刚讨论的内容实际做项目过程中客户的业务场景主体分为 3 大类1纯问答类针对客户提供的私域知识文档给用户直接回复。这类业务大多不涉及多轮交互以一问一答为主有的客户在部分场景允许接入联网知识集外知识要区分拒识和闲聊等。2workflow 类我们通常称之为“静态任务规划”以查办类业务为主。这类业务通常有标准的业务流程如车险报案需要逐步让客户提供信息姓名、车辆信息、出险地点等通过在画布中配置连续的提槽节点实现最后形成报案工单步骤明确。模型只需关注意图识别、槽值抽取和话术生成引导、跳转拉回等3 类原子能力其他的如整体的流程控制、工具调用等都可以通过画布拖拽节点实现。出于业务性质和稳定性的考虑实际项目交付过程中大多数业务流程都是通过在产品配置 workflow 实现。3agent 类这里特指需要“动态任务规划”类的业务。适用于无固定交互流程且需要查询外部信息进行规划推理的场景如理财产品推荐/设备故障排障需要分析用户问题才知道需不需要调用工具进行任务编排判断后续的执行动作应该是什么无法通过画布配置固定流程实现。真实项目中大多以纯问答和 workflow 类实现的业务为主尤其涉及到业务安全性和实时性高的场景通过纯 agent 任务规划实现基本不可行尤其在金融领域大模型监管备案异常严格客户对新技术的需求也相对保守。只有些比较开明对前沿技术有追求的客户会分小部分安全性和实时性要求不高的场景允许我们做纯 agent 的尝试和研究并集成到产品中当用户问题通过意图分流到这些场景中时可以进行交互体验。对于涉及到需使用 Agent 的场景往往不单是调用接口工具那么简单。在 Agent 规划的过程中还需要跟用户做多轮交互以确认工具查询不到的信息然后某些规划步骤的执行可能需要调用另一个 Agent 才能完成。举个做过的燃气公司的故障排障场景简化说明用户只说“燃气无法使用怎么办”那么 Agent 需要先查询接口工具获取用户房产信息通过房产信息查询系统中有没有停气、设备故障等信息如果系统接口查不到问题则需要跟用户交互通过提槽方式确认家中的设备可用状态若用户表示均不可用则按照报警器—燃气表—阀门—燃气设备的顺序进行指引排障具体每类的排障过程会对应 4 个子 Agent因为内部也有比较复杂的流程并基于用户的反馈调整排障策略。该场景就涉及到多智能体的协作。综合来说除了 Agent 技术本身在项目落地过程中更需要设计一套完整的技术解决方案在让客户能够感受到 Agent 赋能的同时解决客户实际相对全面的业务需求。3、优化方案针对上述问题在做具体项目过程中我结合项目需求做了很多技术和工程化相关的优化设计大体内容如图所示图 4交互问答技术全景概览图内容有点多关于纯问答相关的技术如联网搜索问答、DeepSearch暂不展开阐述后面有时间更新本次主体还是聚焦在 Agent 任务规划的优化说明。注因公司规定优化后的完整 prompt 和我写的代码不便提供但至少我可以把遇到的问题和优化思路分享给大家希望对各位有所启发。ReAct 框架升级主体还是基于标准 ReAct 的框架“规划一步执行一步”的方式进行升级支持了 Multi-Agent 的模式。没有采用先 Plan 后执行的方式因为实测 Plan 的不稳定性很高异常处理模块比较难兜底。主要的优化点如下快慢思考模型结合“规划”和“总结回复”配置不同模型执行慢思考模型思考回复出来之前基本规划和总结回复都是通过 1 个快思考模型做。但是实际使用发现最后的总结回复涉及到对工具调用结果的整理、分析和思考推理快思考模型的效果并不好。在慢思考模型出来后我们尝试将这两部分拆开规划用快思考模型例如 deepseek V3最后的回复总结用慢思考模型如 deepseek R1最终的回复效果会比只用 1 个模型好很多。具体实现上可以通过工程化解析快思考模型是否输出最终回复的前缀标签可配如“Finish:”等如果解析到了就中断模型的输出清除这轮模型的回复转而调用慢思考模型去做回复总结。“泛化”工具的定义和使用方式目前研究者对工具的定义大多是作为函数接口或服务使用服务本质上也可以理解为 1 个大“函数”给输入返回输出。但前面提到在真实场景中Agent 在做任务规划时不光是需要通过函数接口工具获取信息同时也需要与用户交互获取信息以决策下一步需要做的事情或者将某个步骤的执行下发给其他 Agent获取其他 Agent 的返回结果后再决策下一步需要做什么。综上我充分利用 Action 定义的 Json 结构将工具定义为 3 种类型1函数类工具传统的接口或服务用于获取工具的执行结果也可以获取问答知识。模型输出对应的接口名称和入参编译器解析执行后返回运行结果。大模型输出的格式Action:[{“tool_name”:“KaTeX parse error: Expected }, got EOF at end of input: …名称},input:{{入参}”:“…”,…}}]。用列表的格式是允许 Action 一次可传入多个没有依赖关系的工具。2交互类工具当 Agent 规划当前需要从用户那里获取信息时返回格式如下Action:[{“tool_name”:“ask_user”,“input”:{“query”:“…”}}]。这里的 tool_name“ask_user”只需设置为 1 个固定字符串用于解析就行不一定要用这个入参就是需要咨询用户的问题等待并获取用户响应后将用户输入放入 Observation 中作为“ask_user”的“output”即可。3Agent 类工具当 Agent 判断某个信息需要其他 Agent 反馈时使用格式如下Action:[{“tool_name”:“${Agent名称}”,“input”:{“query”:“…”,…}}]。这里的 tool_name 就是需要调用的 Agent 名称input 中放入需要其他 Agent 解决的问题同时也可以传入一些背景信息。最后将其他 Agent 最终的总结回复放入当前 Agent 本次的 Observation 中。Multi-Agent 规划执行示例拿燃气故障排障场景给大家一个执行的例子为便于展示对具体输出内容进行了删减大家以理解格式和执行过程为主注“//”后的内容为我写的注释不是模型生成的内容 Question:我家燃气无法使用了怎么办 Thought:...根据业务流程说明需要首先询问用户是否为工商户如果不是工商户才进一步按排障流程执行... Action:[{tool_name: ask_user, input: {query: 您好请问您是否为工商户}}] //等待用户输入 Observation:[{tool_name: ask_user, output: {user_response: 不是}}] Thought:...判断用户不是工商户需要根据用户手机号查询用户的房产信息... //这里手机号是作为外部信息提前传入prompt中的 Action:[{tool_name: ..., input: {user_phone_number: ...}}] //等待编译器执行 Observation:[{tool_name: ..., output: {address:...,...}}] Thought:...根据房产信息中的...字段查询燃气及设备故障信息... Action:[{tool_name: ..., input: {...}}] //等待编译器执行 Observation:[{tool_name: ..., output: {...}}] Thought:...未查询到用户存在停气或设备故障信息需要跟用户确认是否所有燃气设备都无法使用若不是需指出具体哪个设备不可用...//这块有个业务逻辑就是用户家的表不一定是智能表或即使是智能表故障信息也不是实时更新所以系统里没有查到异常不代表真的没有只能跟用户交互去排障 Action:[{tool_name: ask_user, input: {query: ...请问您家中的燃气设备是否全部都无法使用}}] //等待用户输入 Observation:[{tool_name: ask_user, output: {user_response: 是的}}] Thought:用户表示燃气设备全都无法使用接下来需要依次进行报警器排障、燃气表排障、阀门排障、燃气设备排障。 Action:[{tool_name: x_agent, input: {query: 用户家中燃气设备全部无法使用需排查报警器是否有故障}}] //---调度报警器排障Agent--- Thought:... Action:... Observation:... Thought:... Finish:经过排查用户的报警器无异常...//---调度结束返回主Agent Observation:[{tool_name: x_agent, output: {agent_response: 经过排查用户的报警器无异常...}}] Thought:接下来需要进行燃气表排障... Action:[{tool_name: y_agent, input: {query: 用户家中燃气设备全部无法使用需排查燃气表是否有故障}}] //---调度燃气表排障Agent--- Thought:... Action:... Observation:... Thought:... Finish:经过排查用户的燃气表存在...异常需要告知用户执行...操作并询问用户燃气表是否恢复正常//---调度结束返回主Agent Observation:[{tool_name: y_agent, output: {agent_response: 经过排查用户的燃气表存在...异常需要告知用户执行...操作并询问用户燃气表是否恢复正常}}] Thought:当前发现燃气表出现...异常需要告知用户执行...操作并询问用户燃气表是否恢复正常 Action:[{tool_name: ask_user, input: {query: 当前发现燃气表出现...异常请您按执行...操作看燃气表是否恢复正常了呢}}] ...//依次完成对报警器排障、燃气表排障、阀门排障、燃气设备的排障后需询问用户的问题是否已解决 Thought:当前已完成对报警器排障、燃气表排障、阀门排障、燃气设备的排障用户反馈所有燃气设备已恢复正常需询问用户的问题是否已解决 Action:[{tool_name: ask_user, input: {query: 当前燃气设备均已恢复正常请问您的问题是否已解决呢}}] //等待用户输入 Observation:[{tool_name: ask_user, output: {user_response: 是的燃气可以用了感谢}}] Thought:所有任务已执行完毕用户反馈问题已解决...//最终回复中需要总结当前排查过程中出现了哪些问题以及如何解决的这个信息主要是燃气公司要将本次排查过程记录成工单所需final_json.../final_json中的内容可以不给用户展示 Finish:好的有其他问题欢迎咨询final_json{summary: 经过排查...}/final_json异常处理不好讲的太细大体说一些常见的1利用 Constrained Decoding 的技术主流的处理方案有基于 FSM有限状态机或 CFG上下文无关文法的解码方案解决大模型无法稳定输出 JSON 格式的问题。2模型有时会出现“臆想”工具执行结果的情况当模型输出“Observation…”时需要工程化截断并删掉包含“Observation…”及其后的内容。3正则过滤经常出现的错误模式比如结构化数据前后多余的换行空格。4对于函数类工具若模型生成的工具名称或入参出现错误导致解析器调用失败需工程化捕获异常重新请求大模型生成 Action如果超过一定次数均失败这时的兜底处理就取决于产品经理和客户的想法了这块要以客户能接受的方式为主像燃气这边的客户打趣说直接像 deepseek 刚发布时一样告诉用户“系统繁忙请稍后重试”也是可以的总之不能告诉用户是模型错了哈哈。5对于交互类工具如果格式解析有异常因为就是跟用户交互只要能根据关键词比如示例中的“ask_user”判断出是这类工具直接代码重新拼接清空历史保存的错误 Action。6对于 Agent 类工具如果子 Agent 执行中出现异常捕获后也是需要尝试重新调用处理方式与 4类似。7需要做重复规划或循环规划的检测分析最新规划的 Action 结果是否在历史记录中出现过若存在重复规划需要在下次调用大模型时输入冲突提示并重新请求规划如果“无效”规划超过一定次数也是要有兜底策略如参考 4的处理策略或其他方式需要与产品经理和客户沟通。其他技术点探讨前面提到真实场景中往往 Workflow固定流程的查办类业务、纯 Agent无固定流程的复杂业务和纯问答咨询场景都会有那会产生以下几个问题1“多意图”问题用户问题进来首先会进行意图识别若用户一句话同时包含多个意图如 Workflow、Agent 和问答类场景的排列组合应该怎么处理或者用户表述不清应该怎么做分析这个问题不能一上来陷入细节先从大体框架说起图 5不同识别意图情况下的处理逻辑注因为我这边主要是做客服场景为主虽然多意图的处理比较复杂在实际交付项目中多意图在客户生产环境占比本身就不高因为大多用户一般不会一句话提出多个请求模糊的问题相对占比高一点因为有些用户就是讲不清楚需求但这种的处理方式相对简单就是基于识别到的模糊候选意图多问一次关于多意图/模糊意图的识别技术方案暂不展开这个没大家想的那么简单几句话说不完。下面单纯从技术实现的角度探讨下多意图的处理方式广义的“多意图”也包含“意图问答”的情况需要分情况讨论为了表示方便我把 workflow 类的意图用“W”表示Agent 用“A”问答用“Q”a. WQ/AQ这是实际业务中涉及多意图最多的情况一种处理方式就是“问答回复流程首句引导语”但实际项目中通常会采用“W/A优先”的方式即忽略问答部分先帮用户处理业务需求技术实现上也更简单一些客户通常也能接受。b. WW参考图 5通常是按识别到的多业务意图顺序执行未执行的先入栈我们默认栈的大小是 2即最多缓存 2 个意图若栈满则“淘汰”早期的意图。但这块也没那么简单真要做深实际是要考虑图中标黄的“意图筛选排序”的策略即需要考虑意图之间的关联关系如语义顺序业务优先级互斥关系等。“业务优先级”是指用户提到的多个意图在真实业务中某个意图流程必须先于另一个意图办理这里可能是 2 个意图存在依赖关系或者就是业务上通常会先走某个意图流程。举个例子在保险报案场景如果用户说“查查理赔进度我出车祸了要报案”业务上通常都是先处理报案再查用户是不是之前有其他理赔的情况要查询此时就不能依据用户表达的语义顺序执行多意图。“互斥关系”是 2 个意图在业务上不能同时执行需要筛选掉其中 1 个。篇幅关系不展开叙述总之想做好这个是需要深度打磨业务才行的。c. WA这个处理方式很难有统一的方式因为不同领域的客户基于他们的业务属性对这个问题的看法是不一样的。可以采用“WW”的处理方式实际有的客户也会采用“W 优先”舍弃 A客户也能接受而且用户真想用 A 可以多问一次毕竟 A 是不稳定的能让用户少用就少用。d. AA参考“WW”或“WA”的方式都有人能接受实际可与客户沟通看那种方式更贴合业务。2“意图跳转”问题若用户在 Workflow/Agent 的交互流程中未执行完跳转到其他 Workflow、Agent 或问答场景怎么办这里还是分情况讨论a. W-Q一般是在提槽阶段客服请求用户提供某个信息结果用户打个岔问个问题这种可以单独设计个 prompt 做“提槽引导语生成”先给问答回复在末尾拼接提槽引导语拉回主流程。b. A-Q这种一般发生在 Agent 需要使用“交互类工具”时出现用户没有直接提供 Agent 需要的信息而是问了其他咨询的问题这时需要暂存 Agent 的环境在通过知识问答的链路给出回复后Agent 需要获取问答的回复并自行思考拉回策略可以在最初的 Agent prompt 中加入这种情况下的需求描述。c. W/A-W/A发生业务意图跳转时当前意图需要缓存到意图栈中若意图栈已满则需删去栈底流程意图后当前意图再入栈即抛弃早期的业务流程这里也可以配合产品的工程化实现即不同业务可以通过配置由运营决定当前意图流程是否允许跳转到其他意图或跳转后是否需要拉回这样会更灵活。4、总结综上所述目前 Agent 虽然百花齐放但是总体还是处于孵化阶段离真正商用落地还有很大一段距离。因个人能力有限上面的探讨可能也只是冰山一角还有很多地方需要进一步调研探索也欢迎感兴趣的 Agent 研究者在评论区与我交流~最后如果说程序员已经是高薪职业那么干AI的程序员就是高薪中的高薪。现在的市场已经用数据给程序员指明了方向学****AI大模型就是冲刺高薪的最优解看着身边越来越多的同行转型大模型、拿到高薪offer很多人心里都动了心但真正的难题来了零基础小白不知道从哪入门有基础的程序员找不到系统学习路径实战项目练手无门面试不知道考什么别慌今天就给大家整理了一份【2026年最新版】AI大模型免费学习资源包覆盖从入门到实战、从理论到面试、从基础到进阶的全流程所有资料均已整理归档无冗余、无套路免费分享给每一位想抓住AI风口的程序员和小白扫码免费领取全部内容1、大模型系统化学习路线2、大模型学习书籍文档3、AI大模型最新行业报告4、大模型项目实战配套源码5、大模型大厂面试真题四阶段精细化学习规划附时间节点可直接照做结合上述资源给大家整理了一份可直接落地的四阶段学习规划总时长约2个月小白可循序渐进程序员可根据自身基础调整节奏高效掌握大模型核心能力快速实现从“入门”到“能落地、能面试”的跨越。第一阶段10天初阶应用该阶段让大家对大模型 AI有一个最前沿的认识对大模型 AI 的理解超过 95% 的人可以在相关讨论时发表高级、不跟风、又接地气的见解别人只会和 AI 聊天而你能调教 AI并能用代码将大模型和业务衔接。大模型 AI 能干什么大模型是怎样获得「智能」的用好 AI 的核心心法大模型应用业务架构大模型应用技术架构代码示例向 GPT-3.5 灌入新知识提示工程的意义和核心思想Prompt 典型构成指令调优方法论思维链和思维树Prompt 攻击和防范…第二阶段30天高阶应用该阶段我们正式进入大模型 AI 进阶实战学习学会构造私有知识库扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架抓住最新的技术进展适合 Python 和 JavaScript 程序员。为什么要做 RAG搭建一个简单的 ChatPDF检索的基础概念什么是向量表示Embeddings向量数据库与向量检索基于向量检索的 RAG搭建 RAG 系统的扩展知识混合检索与 RAG-Fusion 简介向量模型本地部署…第三阶段30天模型训练恭喜你如果学到这里你基本可以找到一份大模型 AI相关的工作自己也能训练 GPT 了通过微调训练自己的垂直大模型能独立训练开源多模态大模型掌握更多技术方案。到此为止大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗为什么要做 RAG什么是模型什么是模型训练求解器 损失函数简介小实验2手写一个简单的神经网络并训练它什么是训练/预训练/微调/轻量化微调Transformer结构简介轻量化微调实验数据集的构建…第四阶段20天商业闭环对全球大模型从性能、吞吐量、成本等方面有一定的认知可以在云端和本地等多种环境下部署大模型找到适合自己的项目/创业方向做一名被 AI 武装的产品经理。硬件选型带你了解全球大模型使用国产大模型服务搭建 OpenAI 代理热身基于阿里云 PAI 部署 Stable Diffusion在本地计算机运行大模型大模型的私有化部署基于 vLLM 部署大模型案例如何优雅地在阿里云私有部署开源大模型部署一套开源 LLM 项目内容安全互联网信息服务算法备案…扫码免费领取全部内容6、这些资料真的有用吗这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理现任上海殷泊信息科技CEO其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证服务航天科工、国家电网等1000企业以第一作者在IEEE Transactions发表论文50篇获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的技术人员这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】