21.AI运营助手整体架构设计:Multi-Agent + 语义层 + 数据系统
项目 git 地址ai-ops-assistant-lab 一、为什么要单独讲架构在上一篇中我们讲清楚了一个核心认知 AI运营助手 ≠ Chat系统而是一个“数据驱动的决策系统”但如果只停留在概念层会有一个问题❗ 你做了很多模块但它们之间是怎么协作的所以这一篇的目标是 把整个系统“结构化拆开”讲清楚每一层的职责和数据流 二、系统整体架构核心图┌────────────────────┐ │ 用户问题NL │ └────────┬───────────┘ ↓ ┌──────────────────────┐ │ Intent Understanding │ │ Agent │ └────────┬─────────────┘ ↓ ┌──────────────────────┐ │ Metric Agent │ │指标识别层 │ └────────┬─────────────┘ ↓ ┌──────────────────────┐ │ Semantic Layer │ │语义映射系统 │ └────────┬─────────────┘ ↓ ┌──────────────────────┐ │ Query Planner │ └────────┬─────────────┘ ↓ ┌──────────────────────┐ │ SQL Compiler │ └────────┬─────────────┘ ↓ ┌───────────────┐ │ Doris / OLAP │ └──────┬────────┘ ↓ ┌──────────────────────┐ │ Insight Agent │ └────────┬─────────────┘ ↓ ┌──────────────────────┐ │ Report Agent │ └──────────────────────┘ 三、系统设计的核心思想 1️⃣ AI系统不是“模型系统”是“编排系统”很多人误解 AI 系统❌ 以为核心是 LLM但实际上 核心是数据 流程 编排 2️⃣ 三层结构非常重要整个系统可以拆成三层 ① Agent层智能层负责理解问题拆解任务决策路径 例如Intent AgentMetric AgentInsight Agent ② Semantic层语义层负责指标定义业务语义映射数据抽象 核心是把“人话”变成“数据语言” ③ Data层数据层负责Doris查询SQL执行数据返回 四、每一层的职责拆解面试重点 1️⃣ Agent层负责“理解与决策” Intent Agent输入最近7天用户流失情况输出{intent:churn_analysis,time_range:7d} Metric Agent 把业务问题映射为指标{metrics:[churn_rate,active_user]} Insight Agent 负责“解释数据” 2️⃣ Semantic Layer核心亮点 它解决什么问题❗ 没有语义层的问题LLM会直接写SQL字段乱用口径不一致不可维护✅ 有语义层之后 所有问题变成“我想查哪个指标” 示例active_user COUNT(DISTINCT user_id) WHERE last_login NOW() - 7d 核心作用功能作用指标统一避免SQL口径混乱业务抽象屏蔽数据库结构AI约束限制LLM自由发挥 3️⃣ Data LayerDoris 职责执行SQL返回数据保证性能 在系统中的角色 “事实来源” 五、完整数据流必须掌握用户问题 ↓ Intent Agent理解问题 ↓ Metric Agent识别指标 ↓ Semantic Layer业务映射 ↓ Query Planner生成计划 ↓ SQL Compiler生成SQL ↓ Doris执行 ↓ Insight Agent分析 ↓ Report Agent输出 六、技术栈设计工程视角 Python层Camel AIAgentOWLWorkflow 数据层DorisOLAPMySQL元数据Redis缓存 AI层LLMGPT / Claude / 本地模型Prompt工程 中间层Semantic LayerMetric RegistrySQL Compiler 七、Prompt设计关键面试点 Metric Agent Prompt你是数据指标分析器。 请从用户问题中提取指标 - active_user - churn_rate - order_amount 返回JSON结构。 SQL Compiler Prompt你不能直接猜字段只能使用语义层定义的指标生成SQL。 输入metric schema 输出SQL Insight Prompt你是数据分析师请基于查询结果生成业务洞察。 八、为什么这个架构成立 1️⃣ 解耦原则层职责Agent决策Semantic语义Data执行 2️⃣ 可控性原则 SQL不再由LLM自由生成 3️⃣ 可扩展性可以轻松加新指标新数据源新Agent 九、这个架构的本质非常重要 一句话总结 这是一个“语义驱动的数据分析系统”通过 Multi-Agent 编排将自然语言转化为结构化数据决策。 十、总结 AI运营助手的本质不是“让AI写SQL”而是“构建一个AI可理解的数据语义系统”。 下一篇建议很关键如果你继续我建议下一篇写《从0到1搭建AI运营助手——最小可运行版本v1》