01因果推断的典型场景
经济学原理表明人们会对激励做出反应,这一原理在金融用户运营中具有广泛应用场景,如程序化广告获客、电销业务优化、用户会员体系提升等。这些场景的核心问题都是“what if”,即如何评估运营动作的效果,而因果推断是解决此类问题的有力工具。
02因果推断面临的挑战
- 数据挑战:转化周期长(如触达3天、活动7天,转化周期达30天)、关键特征未发现(存在未掌握的混杂因素confounders)、随机样本稀少、多种干预叠加(如生日特权、周年庆等)、成熟体系中无偏数据少。
- 业务挑战:运营策略创新快(从积分兑换转向游戏化、社交化)、市场竞争激烈,营销方式从传统触达到新方式(push、公众号等),需建立基于PSM(倾向性得分匹配)的因果样本库应对。
- 因果样本库构建:
- PS阶段:计算倾向性得分(如P(T=1|X=x)),但需解决多种触达方式是否等效、全链路节点选择等问题。
- Matching阶段:通过分桶匹配、阈值设定、样本评估等方法选择合适样本对,需参考腾讯游戏的分布式低复杂度PSM等技术方案。
- 流程:包括PS模型训练、样本选取、干预映射、样本加权、存储监控及模型训练等环节。
03因果推断业务实践
- 常见问题:如何评估福利发放的“反作用”(sleeping dogs)、离线指标上线阈值、用户体验影响等。
- 实验方案:通过实验分组(如40%测试组 vs 40%随机组)评估业务效果,包括delta业务效果、增益上限、反作用评估,并积累样本数据优化模型。
- 混杂因素(confounders):需融合业务系统数据(如核心策略、旅程策略、新用户策略)减少交叉影响,通过特征工程融入其他策略响应模型。
- 技术框架:涵盖广告投放、活跃授信、运营转化、老带新等全链路赋能,目标为降低注册成本、提升次留、授信人数、ROI及用户增长。