多维聚合实战：从SQL GROUP BY到数据立方体的跃迁

张

张建站

2026/6/12 6:21:53

10分钟阅读

1. 项目概述当数据聚合从“加总”升级为“空间导航”你有没有遇到过这样的场景销售报表里区域经理想看华东地区各城市近三个月的客单价趋势财务总监却要对比华北、华南、西南三大区在Q2中高毛利产品线的库存周转率而CEO打开大屏时只关心全国所有渠道类型直营/电商/分销在不同价格带100元、100–500元、500元下的复购率热力图——三个人同一份底层数据却需要完全不同的“切片—钻取—旋转—投影”方式来理解。这正是多维聚合Multi-Dimensional Aggregation的真实战场它早已不是SQL里一个GROUP BY加几个SUM就能应付的简单操作。Part 20 这个标题看似是教程序列中的普通一节实则踩在了数据分析能力跃迁的关键分水岭上从“能算出总数”到“能在N维数据空间中自由导航”。我带过27个企业级BI项目其中19个在第二季度都卡在这个环节——不是不会写代码而是对“维度”“度量”“层级”“上下文过滤”之间的耦合关系缺乏系统性直觉。本篇不讲抽象理论只拆解我在某连锁零售客户现场实操时如何用3种核心操作范式Slice/Dice/Pivot 2类关键陷阱稀疏性误判、层级断裂 1套可验证的测试清单把一份原始交易表含时间、门店、商品、会员、渠道5个主维度销售额、成本、数量、折扣率4个度量真正变成业务方能自主探索的“数据立方体”。你不需要会MDX或OLAP建模只要熟悉Pandas或DAX基础就能跟着复现。尤其适合正在搭建自助分析平台、做宽表治理、或被业务方反复追问“能不能按XX组合再算一遍”的数据工程师、分析师和BI开发。2. 多维聚合的本质不是技术问题而是认知建模问题2.1 维度不是字段而是业务语义的坐标轴很多人一上来就猛敲代码结果跑出一堆“0值”或“空汇总”根本原因在于混淆了“物理字段”和“业务维度”。举个最典型的例子原始表里有一列order_date类型是datetime。新手会直接把它当维度用GROUP BYorder_date——结果生成上万行每日汇总既无法看趋势太碎也无法比季度需二次计算。而真正的维度建模要求你显式定义时间维度表Time Dimension Table包含date_key如20240520、year、quarter、month、week_of_year、is_holiday、season等预计算好的层级字段。为什么因为业务问题天然具有层级结构“上个月销量” → 需要month层级“Q2 vs Q1环比” → 需要quarter层级“春节档期表现” → 需要is_holidayseason组合提示维度表不是冗余而是业务逻辑的固化。我见过最惨的案例是一家教育公司把course_start_time直接用于分组结果因时区转换错误导致全国分校的“开学周”统计全部错位——根源就是没建立独立的、带时区标注的academic_calendar维度表。2.2 度量不是数字而是可聚合的业务事实同样sales_amount表面看是个数字但它的聚合行为必须受业务规则约束。比如计算“单店日均销售额”需先按store_iddate分组求和再对结果求平均 →可加性度量Additive计算“会员复购率”分子是“第二次及以上购买的会员数”分母是“所有购买过的会员数”二者不可直接相加 →半可加性度量Semi-additive必须在特定维度如member_id上先去重再计算计算“库存周转天数” 平均库存 / 日均销货成本其中“平均库存”需用期初期末除以2不能简单SUM →不可加性度量Non-additive必须在最细粒度如每日每仓计算后再向上聚合我在某快消客户做POC时市场部要“各区域新品上市首月动销率”开发直接用SUM(sales_qty)/SUM(stock_qty)结果华东区显示120%——显然错误。排查发现stock_qty是期初库存不应SUM而应取首日值sales_qty是累计值需确保时间窗口严格对齐。最终方案是先按regionproduct_linelaunch_date构建事实快照表再用窗口函数计算首月滚动值。这个教训让我总结出一条铁律任何度量在进入聚合前必须明确回答三个问题它在哪些维度上可加在哪些维度上需保真在哪些维度上需重算2.3 多维聚合的底层引擎从SQL到MOLAP的演进逻辑技术选型不是比谁更炫而是匹配业务SLA。我们团队内部有张决策表已沿用8年场景特征推荐方案关键依据我的实操备注数据量1亿行维度≤8个响应要求3sPandas query优化内存计算快调试直观用pd.Grouper(keydate, freqM)替代手动截取字符串性能提升40%务必用categorical类型编码维度列内存降65%需高频切片钻取用户50人并发20StarRocks / DorisMPP架构原生支持ROLLUP、物化视图、Bitmap索引某客户将500GB订单表建ROLUP表后跨3维度下钻查询从12s→0.8s注意ROLLUP不能覆盖所有组合需用EXPLAIN验证查询是否命中要求Excel直连、拖拽建模、权限细粒度Power BI SSAS TabularDAX引擎对层级、时间智能函数深度优化必须启用Auto Date/Time并自定义日历表DAX中TOTALYTD()比手动写FILTER(ALL(Date), Date[date] MAX(Date[date]))稳定10倍实时性要求秒级维度动态变化Flink CEP Redis HyperLogLog流式预聚合基数估算某直播平台用此方案实现“实时在线观众地域热力图”延迟800ms但要注意HyperLogLog不支持精确去重误差率0.8%需业务接受注意没有“银弹”方案。我曾坚持用Doris给一家传统制造企业做分析平台结果因IT部门无Linux运维能力上线后频繁OOM。最后妥协方案是用Python脚本每天凌晨ETL生成宽表导入MySQL前端用Superset连接——虽然不够酷但稳定运行3年零故障。技术服务于人不是人服务于技术。3. 核心操作范式实战Slice、Dice、Pivot的精准控制术3.1 Slice切片锁定视角排除干扰噪声Slice的本质是施加硬性过滤条件将N维空间压缩为M维子空间MN。但新手常犯两大错误错误1用WHERE代替SLICE逻辑比如要分析“华东区2024年Q2的销售”写成SELECT region, product_category, SUM(sales) FROM fact_sales WHERE region East AND year 2024 AND quarter Q2 GROUP BY region, product_category;表面正确但若某product_category在华东Q2无销售它就不会出现在结果中——而业务方可能正需要看到“哪些品类缺位”。正确做法是先构建完整维度组合再用CASE WHEN标记有效/无效WITH full_grid AS ( SELECT DISTINCT r.region, p.category FROM dim_region r CROSS JOIN dim_product p WHERE r.area East -- Slice在维度表上 ), sales_data AS ( SELECT region, product_category, SUM(sales) as amt FROM fact_sales WHERE year 2024 AND quarter Q2 GROUP BY region, product_category ) SELECT g.region, g.category, COALESCE(s.amt, 0) as sales FROM full_grid g LEFT JOIN sales_data s ON g.region s.region AND g.category s.product_category;这样即使某品类销量为0也会显示为0避免“消失的品类”误导决策。错误2忽略Slice的层级穿透性某汽车客户要“新能源车型在一线城市的销量”city_level维度表有city_name、tier一线/新一线/二线字段。如果只WHEREtier 一线会漏掉深圳属新一线城市但实际按一线政策执行。解决方案在维度表中增加业务标识字段如is_policy_first_tier布尔值并在ETL时由业务方确认。技术永远追不上业务变化但好的维度设计能兜住80%的例外。3.2 Dice切块聚焦子集保留结构完整性Dice是Slice的升级版——它不消除维度而是在指定维度上划定范围形成一个“数据立方体”的子块。典型场景是“对比分析”比如对比A/B两款新品在重点城市的试销表现。关键在于Dice必须保持所有维度的层级结构一致否则聚合结果不可比。我处理过一个经典案例某美妆品牌上线A/B两款精华想看“北上广深杭”五城中各渠道线上自营/天猫/京东/线下专柜的30天复购率。原始数据中city维度只有城市名channel维度有渠道类型但rebuy_rate是半可加度量。错误做法# 错误未对齐时间窗口和去重逻辑 df[df[city].isin([北京,上海,广州,深圳,杭州])] \ .groupby([city,channel])[rebuy_rate].mean() # 直接mean会把不同样本量的复购率简单平均正确路径分三步构建基准事实表确保每条记录代表一个“城市-渠道-会员”的最小业务单元如member_idfirst_purchase_date定义Dice边界用pd.Categorical将city限定为5个目标城市channel限定为4个渠道自动排除其他值分层计算# 步骤1计算每个城市-渠道组合的复购会员数和总购买会员数 base df.groupby([city,channel,member_id]).agg( first_order(order_date, min), order_count(order_id, count) ).reset_index() # 步骤2标记复购下单≥2次且首单在观察期内 base[is_rebuy] (base[order_count] 2) (base[first_order] 2024-04-01) # 步骤3按Dice维度聚合此时维度已对齐 result base.groupby([city,channel]).agg( total_members(member_id, nunique), rebuy_members(is_rebuy, sum) ).assign( rebuy_ratelambda x: x[rebuy_members] / x[total_members] )这样得到的rebuy_rate才是可比的——因为分母是同一维度组合下的真实会员基数而非简单平均。3.3 Pivot旋转重构视角揭示隐藏关联Pivot常被简化为“行列互换”但其真正价值在于将隐含的业务关系显性化。比如销售数据中product_line和customer_segment是两个平行维度但业务方突然问“高端客户买平价产品多还是大众客户买高端产品多”这就需要把customer_segment作为行product_line作为列交叉填充sales_amount——即创建一个客户群×产品线矩阵。难点在于Pivot不是静态表格而是动态业务逻辑的映射。某母婴客户要做“奶粉品类在不同孕期阶段妈妈的购买偏好”gestation_stage维度有孕早期/孕中期/孕晚期/哺乳期product_subcategory有DHA奶粉/钙铁锌/叶酸/益生菌。如果直接pivotdf.pivot_table( valuessales_amount, indexgestation_stage, columnsproduct_subcategory, aggfuncsum )会得到一个稀疏矩阵很多0因为并非所有组合都存在业务意义。更优解是先用业务规则定义“强关联组合”例如孕早期 → 叶酸、DHA奶粉孕中期 → 钙铁锌、DHA奶粉孕晚期 → DHA奶粉、益生菌哺乳期 → DHA奶粉、益生菌然后用pd.crosstab配合normalizeindex计算占比# 构建关联权重表 weight_map { (孕早期, 叶酸): 0.6, (孕早期, DHA奶粉): 0.4, (孕中期, 钙铁锌): 0.5, (孕中期, DHA奶粉): 0.5, # ... 其他组合 } # 计算实际购买占比非0值 actual pd.crosstab( df[gestation_stage], df[product_subcategory], valuesdf[sales_amount], aggfuncsum, normalizeindex ) # 对比业务预期与实际偏差 deviation actual.stack().sub( pd.Series(weight_map).reindex(actual.stack().index, fill_value0) ).unstack().fillna(0)这样输出的deviation表直接告诉市场部“孕晚期妈妈购买益生菌的实际占比32%比预期20%高12个百分点”比单纯看销售总额更有行动指导性。4. 稀疏性与层级断裂多维聚合中最隐蔽的两大陷阱4.1 稀疏性陷阱当“空”不是缺失而是业务真相多维数据天然稀疏——不是所有城市都卖所有产品不是所有会员都参与所有活动。但把稀疏性简单等同于“数据缺失”是致命错误。某跨境电商客户曾抱怨“东南亚站点的GMV在仪表盘上总是0”排查发现其country维度表中越南、泰国、印尼被归入region Southeast Asia但事实表里country字段为空因物流单未回传导致JOIN后整行丢失。根本解法不是补0而是区分三类“空”技术空NULLETL过程丢失需修复管道业务空Not Applicable如“婴儿奶粉”在“老年客户”维度下无意义应标记为N/A而非NULL策略空Intentionally Excluded如公司暂不向缅甸发货country Myanmar在事实表中本就不该出现我们为此设计了稀疏性诊断四步法统计各维度组合的覆盖率SELECT region, country, COUNT(*) FROM fact_sales GROUP BY region, country ORDER BY COUNT(*) ASC LIMIT 10检查维度表完整性SELECT d.country FROM dim_country d LEFT JOIN fact_sales f ON d.country f.country WHERE f.country IS NULL—— 若返回大量结果说明维度表超前于业务验证JOIN逻辑用FULL OUTER JOIN查看哪边丢失数据如dim_country FULL JOIN fact_sales ON ...业务校验拉出覆盖率最低的10个组合找对应业务方确认是“真缺失”还是“假缺失”如越南订单走的是新加坡仓country应记为SG实操心得在StarRocks中用bitmap_union_count函数计算某维度组合的唯一值数比COUNT(DISTINCT)快5倍。某客户用此法10分钟内定位出“中东区”下92%的国家组合无数据证实是市场策略未覆盖而非技术问题。4.2 层级断裂当“年-季-月”不再是一条直线维度层级断裂是最难调试的问题——表面看SQL能跑通结果却违背常识。典型症状“2024年Q1销售额” 1000万“2024年Q2销售额” 1200万但“2024年上半年销售额” 1800万≠2200万“华东区”汇总值 ≠ “上海南京杭州合肥”之和根源几乎全是层级定义不一致。某金融客户出现上述Q1Q2≠上半年问题查出dim_date表中quarter字段Q1Jan-MarQ2Apr-Jun正确half_year字段H1Jan-Jun正确但fiscal_year字段财年从4月开始H1Apr-Sep → 导致“2024年上半年”被解释为2024年4-9月而非自然年1-6月解决方案必须双管齐下技术侧在维度表中强制约束层级关系。用StarRocks的ALTER TABLE dim_date ADD CONSTRAINT chk_quarter CHECK (quarter IN (Q1,Q2,Q3,Q4))并添加fiscal_year_start_month字段统一管理流程侧建立层级血缘文档用表格明确记录维度名层级字段业务含义时间起点是否可加数据来源timeyear自然年1月1日是ERP系统timefiscal_year财年4月1日是财务系统productcategory一级类目—否需业务确认商品管理系统注意层级断裂往往在跨系统集成时爆发。我们曾为某集团整合5个子公司数据发现“员工职级”在A公司是L1-L5B公司是P1-P10C公司用Manager/Senior/Lead文字。最终方案不是强行映射而是新建org_level_standard维度表每个子公司映射到标准层级并在BI层用DAX的USERELATIONSHIP切换关系——牺牲一点灵活性换来全局一致性。5. 实战复现从原始交易表到可交互数据立方体的全流程5.1 数据准备构建健壮的星型模型假设我们拿到一份原始交易表raw_orders1200万行含字段order_id,order_time,store_code,product_id,member_id,sales_amt,cost_amt,discount_rate,channel_type。目标支撑前述零售客户的所有分析需求。步骤1清洗与标准化耗时占比40%但决定成败order_time提取date_key(YYYYMMDD),hour,day_of_week,is_weekend并关联到dim_date含节假日、促销期标记store_code关联dim_store补充region,city,store_tier(旗舰店/标准店/社区店),open_dateproduct_id关联dim_product补充category,sub_category,brand,price_band(经济型/中端/高端),is_new_launch(上市90天)member_id关联dim_member补充age_group,gender,membership_level,first_order_date关键技巧用pandas.cut()对sales_amt分箱生成order_value_segment小单/中单/大单比用SQL CASE更易维护对discount_rate用np.where()标记is_promo_order(折扣15%)避免后续计算重复判断。步骤2构建事实表核心动作不直接用原始表而是创建fact_daily_store_product# 按日期门店商品聚合保留所有度量原始形态 daily_agg raw_orders.assign( date_keylambda x: pd.to_datetime(x[order_time]).dt.strftime(%Y%m%d) ).groupby([date_key, store_code, product_id]).agg( order_count(order_id, count), sales_amt(sales_amt, sum), cost_amt(cost_amt, sum), discount_amt(sales_amt, sum) * raw_orders[discount_rate].mean(), # 此处需修正应先算每单折扣再SUM member_count(member_id, nunique), avg_discount_rate(discount_rate, mean) ).reset_index() # 修正折扣计算必须在明细层 raw_orders[discount_amt] raw_orders[sales_amt] * raw_orders[discount_rate] daily_agg_correct raw_orders.groupby([date_key, store_code, product_id]).agg( order_count(order_id, count), sales_amt(sales_amt, sum), cost_amt(cost_amt, sum), discount_amt(discount_amt, sum), # 正确先算单笔再汇总 member_count(member_id, nunique), avg_discount_rate(discount_rate, mean) )为什么必须这一步因为所有上卷roll-up操作都基于此表。若此处discount_amt计算错误后续所有“折扣率分析”全崩。5.2 多维聚合实现用三种工具验证同一逻辑场景计算“各城市各价格带的月度客单价”维度city(来自dim_store),price_band(来自dim_product),year_month(来自dim_date)度量avg_order_valuesales_amt/order_count半可加需先SUM再除方案APandas适合调试与小规模# 关联所有维度 merged daily_agg_correct.merge(dim_store[[store_code,city]], onstore_code) \ .merge(dim_product[[product_id,price_band]], onproduct_id) \ .merge(dim_date[[date_key,year_month]], ondate_key) # 分组聚合关键先SUM再计算避免平均的平均 result_pandas merged.groupby([city,price_band,year_month]).agg( total_sales(sales_amt, sum), total_orders(order_count, sum) ).assign( avg_order_valuelambda x: x[total_sales] / x[total_orders] ).reset_index()方案BStarRocks生产环境主力-- 创建物化视图加速 CREATE MATERIALIZED VIEW mv_city_price_month AS SELECT s.city, p.price_band, d.year_month, SUM(f.sales_amt) as total_sales, SUM(f.order_count) as total_orders, SUM(f.sales_amt) / SUM(f.order_count) as avg_order_value FROM fact_daily_store_product f JOIN dim_store s ON f.store_code s.store_code JOIN dim_product p ON f.product_id p.product_id JOIN dim_date d ON f.date_key d.date_key GROUP BY s.city, p.price_band, d.year_month; -- 查询时自动命中 SELECT * FROM mv_city_price_month WHERE city IN (上海,北京) AND year_month 202404;方案CPower BI DAX面向业务Avg Order Value DIVIDE( SUM(Fact[sales_amt]), SUM(Fact[order_count]), 0 ) // 创建矩阵可视化行City列Price Band值Avg Order Value // 自动应用筛选器上下文实测对比同一查询上海北京2024年4-5月Pandas本地运行1.2sStarRocks 0.18sPower BI直连StarRocks 0.3s。选择依据很清晰Pandas用于逻辑验证StarRocks承载并发Power BI提供交互。5.3 交互式探索让业务方自己“玩转”数据光有聚合结果不够必须封装成可探索的体验。我们给零售客户交付的不是报表而是一个三维探索沙盒X轴选择任意维度城市/价格带/会员等级Y轴选择另一维度时间/渠道/品类颜色/大小选择度量销售额/客单价/复购率切片器固定第三维度如只看“线上渠道”技术实现要点前端用Apache ECharts其visualMap组件完美支持连续度量着色后端API用FastAPI接收JSON参数{x_dim:city,y_dim:year_month,metric:avg_order_value,filters:{channel:online}}SQL生成器动态拼接def build_query(params): base SELECT {x}, {y}, {metric} FROM fact f JOIN dim_store s ON f.store_codes.store_code # 根据params动态添加JOIN和SELECT return base.format(**params)最关键的安全阀所有查询强制添加LIMIT 10000并用EXPLAIN预估扫描行数超阈值如500万则拒绝执行返回友好提示“当前组合数据量过大建议缩小时间范围或增加筛选条件”。6. 常见问题与排查技巧实录那些文档里不会写的坑6.1 问题速查表10个高频故障与根因定位现象可能根因快速验证方法解决方案聚合结果数值异常偏大度量在JOIN时发生笛卡尔积膨胀SELECT COUNT(*) FROM fact f JOIN dim_store s ON f.store_codes.store_codevsSELECT COUNT(*) FROM fact若前者远大于后者说明store_code有重复检查维度表主键是否唯一用SELECT store_code, COUNT(*) FROM dim_store GROUP BY store_code HAVING COUNT(*) 1某些维度组合无数据维度表与事实表KEY不匹配大小写/空格/编码SELECT DISTINCT s.store_code FROM dim_store s WHERE s.store_code NOT IN (SELECT DISTINCT f.store_code FROM fact f)若返回结果检查字符集在ETL中统一用TRIM(UPPER())清洗KEY字段时间智能函数结果错误日期维度表未标记is_current或is_fiscal_period查看dim_date中2024-05-20对应的is_current_month是否为TRUE若否检查ETL更新逻辑每日凌晨运行UPDATE dim_date SET is_current_month (year_month FORMAT(NOW(), %Y%m))Pivot后出现大量NULL维度值在事实表中存在但在维度表中缺失SELECT f.product_id FROM fact f LEFT JOIN dim_product p ON f.product_idp.product_id WHERE p.product_id IS NULL建立维度表补全作业对事实表中新增product_id自动插入dim_product默认行同比环比计算不准确时间维度层级不一致如用自然年同比但数据按财年分区SELECT MIN(date_key), MAX(date_key) FROM fact与SELECT MIN(date_key), MAX(date_key) FROM dim_date WHERE is_fiscal_year2024对比强制在DAX/SQL中使用同一时间体系禁用混合引用查询响应慢10s缺少物化视图或Bitmap索引EXPLAIN SELECT ...查看是否SCAN全表在StarRocks中SHOW ALTER TABLE ...确认MV状态对高频组合如cityyear_month创建ROLLUP或对product_id建Bitmap索引权限控制失效行级安全RLS策略未覆盖所有JOIN路径在BI工具中用管理员账号执行SELECT * FROM fact f JOIN dim_store s ON f.store_codes.store_code检查是否返回全部数据在StarRocks中为每个角色创建VIEWVIEW中嵌入WHERE s.region CURRENT_ROLE()逻辑导出Excel后格式错乱数字度量含逗号分隔符或科学计数法SELECT sales_amt FROM fact LIMIT 1看返回值是否为1234567.89还是1.23457e06在SQL中用FORMAT(sales_amt, 2)或CAST(sales_amt AS DECIMAL(18,2))移动端图表显示不全ECharts配置未适配小屏打开开发者工具模拟iPhone X检查grid宽度是否溢出设置responsive: true并用window.addEventListener(resize, chart.resize)业务方说“数据不准”度量定义与业务口径不一致如“销售额”是否含税拉出10笔明细订单手工计算SUM(sales_amt)vs 报表值若差额固定检查是否漏减运费在数据字典中标注每个度量的业务定义如sales_amt 订单实付金额含税不含运费6.2 独家避坑技巧来自12个失败项目的血泪总结技巧1永远用“最小粒度”验证聚合逻辑某客户发现“华东区Q2销售额”比各城市之和少200万。排查三天无果最后我导出fact表中所有华东区Q2订单用ExcelSUMIFS按城市求和发现上海多算了——因为store_code有SH001和sh001两个变体大小写不敏感数据库自动合并但维度表只认大写。教训聚合前先抽样1000行用df.duplicated(subset[store_code]).sum()检查KEY质量。技巧2对“时间”维度做双重校验不仅检查date_key还要验证date_key与order_time的映射是否1:1。某项目因服务器时区设为UTCorder_time转date_key时北京时间2024-05-20 00:10被算作2024-05-19导致当日首单丢失。解决方案在ETL中增加校验步骤SELECT DATE(order_time) as date_from_time, date_key, COUNT(*) FROM fact GROUP BY 1,2 HAVING date_from_time ! STR_TO_DATE(date_key, %Y%m%d);此查询必须返回0行否则阻断发布。技巧3为“不可加度量”预留审计追踪字段如“库存周转天数”不能只存最终值。必须在事实表中同时保存avg_inventory,daily_cost_of_goods_sold,calculation_date。某次审计发现周转天数突增追溯发现是avg_inventory计算逻辑变更从期初期末/2改为移动平均但未通知下游。现在规则任何度量变更必须更新metric_version字段并在BI层用SWITCH(TRUE(), [metric_version]v1, [formula_v1], [metric_version]v2, [formula_v2])。技巧4用“反向验证”揪出隐性错误当业务方质疑“为什么A城市客单价比B城市高”时不要急着查SQL先做反向验证从A城市随机抽10单手工计算客单价从B城市抽10单手工计算对比两组样本的product_price_band分布——发现A城市80%订单是高端奶粉B城市70%是经济型结论自然浮现不是计算错误而是产品结构差异。数据问题70%是业务问题。技巧5建立“聚合健康度”每日监控在调度系统中加入检查任务SELECT COUNT(*) FROM fact WHERE date_key 20240520应≈昨日均值±15%SELECT COUNT(DISTINCT store_code) FROM fact WHERE date_key 20240520应≥门店总数95%SELECT MIN(sales_amt), MAX(sales_amt) FROM fact WHERE date_key 20240520应在合理区间如0-50000任一异常自动邮件告警。这套机制让我们在3年中提前拦截了87%的数据质量问题。7. 最后分享一个真实场景如何用多维聚合发现“伪增长”去年帮一家咖啡连锁做Q2复盘表面看