总结
介绍
异质性因果效应(HTE)指的是不同个体对相同干预措施的响应差异。例如,给用户发放美妆折扣券,不同用户的反应可能不同。研究目标是从平均处理效应(ATE)转向异质性处理效应(HTE),即估计每个个体在特定干预下的效应。
难点
- 非线性模型的统计检验:处理效应在不同单位可能存在非线性关系,如何捕捉这种差异是一个挑战。
- 应用中的问题:
- 如何根据用户特征决定推送消息的数量。
- 边际效应递减法则:用户粉丝数增加时,不同粉丝数的增量带来的作品生产量是否相同。
- 大部分用户的HTE在0附近聚集,如何识别显著正向的HTE。
- 规模效应的估计:如何估计处理效应的非线性关系,例如使用简单的非线性函数或双重神经网络(DNN)模型。
- 统计检验方法:
- 使用BLP(best linear predictors of the effects on machine learning proxies)和GATES(average effects sorted by impact groups)等方法近似估计HTE的显著性。
- 使用CLAN(average characteristics of most and least impacted units)估计特征对HTE的影响。
应用
- 涨粉和生产:基于DML+DNN模型,可以估计每个作者涨粉的上限,从而最大化未来一周的生产数。
- 推送消息:基于DML+DNN模型,可以预测每个设备在不同推送条数下的反应,优化推送策略。
总结
- DNN+HTE模型可以应用于探索收益天花板的问题,帮助业务规划资源和调整定价策略。
- 通过post analysis,可以使结果更稳健。
- DML模型可以进行跨模型比较,探索一个模型估计的HTE的variation是否足够大,以及特征对HTE的影响是否显著。