别再乱发优惠券了！用Python的CausalML库，手把手教你搭建Uplift Model精准识别营销敏感用户

张

张建站

2026/5/30 1:35:02

10分钟阅读

别再乱发优惠券了！用Python的CausalML库，手把手教你搭建Uplift Model精准识别营销敏感用户

别再乱发优惠券了用Python的CausalML库精准识别营销敏感用户每次大促结束后市场部同事总在复盘会上争论同一个问题这次发的500万优惠券到底有多少是发给本就会下单的用户这场景在电商、在线教育、金融科技行业反复上演。传统营销模型只能预测用户是否转化却无法回答关键问题用户是因为优惠券才购买还是本来就要买1. 为什么Uplift Model是营销人的终极武器去年某头部电商做过一次残酷的AB测试对随机选取的10万用户停止发放优惠券结果发现其中42%的用户依然完成了购买。这意味着过去有近半数的营销预算浪费在了自然转化用户身上。Uplift Model提升模型的颠覆性在于它能直接量化营销动作对用户行为的净影响。与响应模型相比Uplift Model的核心优势体现在三个维度对比维度传统响应模型Uplift Model建模目标预测用户是否转化预测营销动作带来的增量效果数据需求仅需实验组数据需要实验组对照组数据业务价值可能高估营销效果精准计算营销净收益典型应用场景用户分层敏感用户识别金融科技公司Capital One的案例显示采用Uplift Model后其营销ROI提升了37%。这背后的数学本质是因果推断中的条件平均处理效应CATEτ(x) E[Y(1)-Y(0)|Xx]即在用户特征X的条件下营销干预W1与无干预W0的结果差异。2. 四大核心算法深度解析2.1 T-Learner双模型对比法最直观的解决方案是用两个独立模型分别建模实验组和对照组。假设我们有个电商数据集包含用户特征和是否收到优惠券treatment以及是否购买conversionfrom causalml.inference.meta import BaseTClassifier from xgboost import XGBClassifier # 生成模拟数据 df, features make_uplift_classification( n_samples10000, treatment_name[control, coupon_50] ) # 初始化T-Learner t_learner BaseTClassifier( learnerXGBClassifier(max_depth5), control_namecontrol ) # 模型训练 t_learner.fit( Xdf[features].values, treatmentdf[treatment_group_key].values, ydf[conversion].values )这种方法的优势是架构简单但存在明显缺陷对照组和实验组数据完全隔离样本利用率低当两组数据分布不均衡时如对照组仅占10%模型效果急剧下降两个模型的误差会累积到最终预测中2.2 S-Learner单模型融合法更高效的方案是将干预变量作为特征输入。下面代码演示如何用同一模型预测不同干预状态下的结果差异from causalml.inference.meta import BaseSClassifier s_learner BaseSClassifier( learnerXGBClassifier(max_depth5), control_namecontrol ) # 预测时生成两种状态 control_pred s_learner.predict( Xtest_df[features].values, treatmentnp.zeros(len(test_df)) ) treat_pred s_learner.predict( Xtest_df[features].values, treatmentnp.ones(len(test_df)) ) # 计算uplift score uplift_scores treat_pred - control_pred注意当干预变量与其他特征相关性较弱时模型可能自动降低其重要性导致预测的uplift趋近于零2.3 X-Learner交叉纠偏法针对T-Learner的缺陷X-Learner引入三阶段建模先用T-Learner方式训练两个基础模型计算实验组个体在对照组模型上的残差反之亦然用残差训练两个效果模型最后加权融合from causalml.inference.meta import BaseXClassifier x_learner BaseXClassifier( outcome_learnerXGBClassifier(), effect_learnerXGBRegressor(), control_namecontrol ) # 效果预测可直接输出CATE cate_estimates x_learner.predict( Xtest_df[features].values )该算法在美团外卖的实践中显示相比T-Learner可使准确率提升22%尤其适合处理非均衡实验数据。2.4 Causal Tree因果决策树与传统决策树不同因果树直接优化节点分裂时的uplift差异。以下是基于KL散度的分裂准则实现from causalml.inference.tree import UpliftTreeClassifier uplift_tree UpliftTreeClassifier( criterionkl, max_depth3 ) # 输出可解释性规则 uplift_tree.fit( Xdf[features].values, treatmentdf[treatment_group_key].values, ydf[conversion].values )某在线教育平台用该方法发现对月访问3-5次且停留时长5分钟的用户发放试听课邀请转化提升效果是普通用户的4.2倍。3. 实战电商优惠券敏感用户挖掘3.1 数据准备与特征工程我们模拟一个包含10万条记录的电商数据集关键字段包括import pandas as pd from sklearn.model_selection import train_test_split # 生成包含用户行为特征的数据 df, features make_uplift_classification( n_samples100000, treatment_name[control, coupon_10, coupon_20, coupon_50], n_features15, n_informative8 ) # 添加业务特征 df[last_purchase_days] np.random.randint(1, 90, sizelen(df)) df[cart_value] np.round(np.abs(np.random.normal(200, 100, len(df))), 2) features [last_purchase_days, cart_value] # 划分训练测试集 train_df, test_df train_test_split(df, test_size0.3)3.2 模型训练与评估使用CausalML内置的AUUCArea Under Uplift Curve评估模型效果from causalml.metrics import plot_gain # 训练X-Learner模型 x_learner BaseXClassifier( outcome_learnerXGBClassifier(), effect_learnerXGBRegressor() ) x_learner.fit(train_df[features], train_df[treatment_group_key], train_df[conversion]) # 评估效果 preds x_learner.predict(test_df[features]) plot_gain(test_df[conversion], preds, test_df[treatment_group_key])理想情况下模型应该将用户按敏感程度分为四类** Persuadables**给优惠就买不给不买重点投放** Sure Things**无论给不给都会买减少投放** Lost Causes**给不给都不买避免投放** Sleeping Dogs**给优惠反而不买禁止投放3.3 结果应用与策略制定输出用户分群报告# 计算分位数 test_df[uplift_score] preds test_df[user_type] pd.qcut( test_df[uplift_score], q[0, 0.3, 0.7, 0.9, 1], labels[Lost Causes, Sure Things, Persuadables, Sleeping Dogs] ) # 统计各群体占比 segment_report test_df.groupby(user_type).agg({ conversion: [mean, count], uplift_score: mean })根据输出制定差异策略对Persuadables约20%用户集中投放高面额优惠券Sure Things约50%用户改为发送新品通知或会员权益Sleeping Dogs约10%用户加入黑名单避免刺激4. 避坑指南与进阶技巧4.1 实验设计注意事项样本均衡对照组与实验组样本量建议不低于1:3特征一致性确保两组用户的特征分布相似可用PSM或CEM匹配时间因素避免在节假日等特殊时段做实验4.2 特征选择策略优先选择与干预变量相关性低但与结果变量相关性高的特征。可用以下代码检测from sklearn.feature_selection import mutual_info_classif # 计算特征与干预的独立性 mi_scores mutual_info_classif( df[features], df[treatment_group_key], discrete_featuresTrue )4.3 模型融合创新尝试将X-Learner与深度学习结合from tensorflow.keras import Sequential, layers from causalml.inference.meta import BaseXRegressor # 构建神经网络基模型 dnn Sequential([ layers.Dense(64, activationrelu), layers.Dropout(0.3), layers.Dense(1, activationsigmoid) ]) # 集成到X-Learner框架 dnn_xlearner BaseXRegressor( outcome_learnerdnn, effect_learnerXGBRegressor() )某跨境电商采用该方案后在保持相同转化率的情况下营销成本降低了28%。

【Java基础】——代码块与内部类简介

【Java基础】——代码块与内部类简介1. 代码块1.1 静态代码块1.2 实例代码块2. 内部类2.1 成员内部类2.2 静态内部类2.3 局部内部类（不重要）2.4匿名内部类（着重）1. 代码块 1.1 静态代码块 static{}有static修饰，属于…...

2026/5/30 1:34:05 阅读更多 →

【Leetcode】258. 各位相加

给定一个非负整数 num，反复将各个位上的数字相加，直到结果为一位数。返回这个结果。示例 1: 输入: num 38 输出: 2 解释: 各位相加的过程为： 38 --> 3 8 --> 11 11 --> 1 1 --> 2 由于 2 是一位数，所以返回 2。 …...

2026/5/30 1:33:59 阅读更多 →

科莱特学员真实评价如何？说说我自己吧

在科莱特培训SAP，真的是一个从犹豫，到坚定，再到认可的过程。说实话，我当时决定去科莱特学SAP的时候，心里也是七上八下的。网上一搜，各种培训机构都说得天花乱坠，我也不知道哪个真哪个假。后来是…...

2026/5/30 1:27:21 阅读更多 →

Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表·行业首曝）

更多请点击： https://kaifayun.com 第一章：Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表行业首曝） Midjourney 的渐变美学并非传统插值实现，而是由其隐式神经渲染器（Implicit Neu…...

2026/5/26 6:08:07 阅读更多 →

通过curl命令调试Taotoken大模型API，快速排查接入问题

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。 👉 点击领取海量免费额度通过curl命令调试Taotoken大模型API，快速排查接入问题在接入大模型服务时，直接使用HTTP请求进行调试是一种…...

2026/5/29 11:21:15 阅读更多 →

Kubernetes自定义资源：扩展Kubernetes API的能力

Kubernetes自定义资源：扩展Kubernetes API的能力一、Kubernetes自定义资源概述 1.1 自定义资源的定义 Kubernetes自定义资源（Custom Resource，CR）是指用户自定义的资源类型，它扩展了Kubernetes API，允许用…...

2026/5/27 21:40:10 阅读更多 →

Codeforces Round 1057

【打得太糖了】Codeforces Round 1057 (Div. 2) solve 3 题 https://www.bilibili.com/video/BV1Gi4nzYE66/ 【Codeforces Round 1057 (Div. 2)实况】好久没打cf了，只会A-D https://www.bilibili.com/video/BV12q4xzMEy5/ 憧憬成为 Master 第 29 集 —— 反向冲分 (…...

2026/5/27 10:36:27 阅读更多 →