行业研究公司研究宏观策略财报招股书会议纪要 seedance2.0 低空经济 DeepSeek AIGC 大模型

2-1 因果推断在游戏中的应用 - 房栋腾讯游戏

文化传媒 2022-06-13 DataFunSummit2022：数据科学在线峰会 Gnomeshgh文J

游戏中的因果推断：挑战与解决方案

游戏场景中的因果推断挑战

用户体验和隐私因素导致缺乏实验数据。
观察数据存在干预偏差，如人工运营或算法选择偏差。
高活跃用户与低活跃用户被过度干预问题突出。

解决方案

利用观测数据进行因果推断，评估干预效果。
使用ATT（干预组平均处理效应）评估干预人群效应。
使用ATE（平均处理效应）评估整体效应，需通过加权方式均衡样本分布。
常用方法包括倾向性得分匹配（PSM）、Inverse-Probability-Treatment-Weighting（IPTW）、Double-Machine-Learning（DML）、Double-Robust-Estimator（DRE）、X-Learner。
双重稳健估计（DRE）在业务中更稳健，可在倾向性分数预测不准时调整。

技术挑战与解决方案

一般因果推断工具集（如微软econml、dowhy、uber causalml）非分布式实现，无法处理大数据量。
多场景数据量巨大，需精细化运营策略。

分布式低复杂度倾向性分数匹配（Hist-PSM）

通过将连续变量转化为直方变量实现匹配，降低内存占用和计算代价。
Hist-PSM步骤：计算倾向性分数、PS分桶、计算个体数量、计算阈值、提取个体、合并数据。
分布式计算架构将匹配任务分解为子任务，提高效率。
Hist-PSM内存占用更小，计算代价更小。
通过平衡性检验，Hist-PSM挑选的对照组在各类混淆变量的分布与干预组近似。

分布式鲁棒双重稳健估计

传统双重稳健估计在二元结果场景存在问题，如大量小于-1或大于1的ATE出现。
Binary双重稳健估计将二元结果问题转化为连续回归问题，使用线性回归模型的预测值逼近分类任务真实标记的对数几率。
仿真检验显示，Binary双重稳健估计相比UBER-X-Learner和传统双重稳健估计，平均偏差降低42.16%和38.54%。
安慰剂检验显示，Binary双重稳健估计比PSM和DRE更加密集地分布在0附近。
缩减样本量仿真检验显示，Binary双重稳健依然表现出良好的ATE估计。

分布式面板双重差分

玩家参与不同活动次数、程度不同，受多种活动同时进行影响，难以区分效果。
构造面板二重差分（PanelDID）模型对各个活动的效果进行归因。
整体分析流程：构造面板数据、构造面板二重差分模型、参数估计、得出结果。
示例显示，可通过模型得出各活动效果（ATE）。

总结与展望

探索更多潜在的业务场景。
优化在未知ground-truth环境下的检验。
标准化分析方法论。

报告封面

点击免费查看完整报告

你可能感兴趣

hot

李东晨 - 因果推断在金融场景中的应用

商贸零售

DataFunSummit2022：智能金融在线峰会2022-11-24

hot

因果推断方法在微视激励和供需场景的应用与前沿方法探索 (2)

商贸零售

DataFunSummit2022：因果推断在线峰会2022-12-16

hot

因果推断在有限资源决策中的应用

商贸零售

DataFunSummit2022：因果推断在线峰会2022-12-16

hot

因果推断在海外游戏增长中的应用

商贸零售

DataFunSummit2022：因果推断在线峰会2022-12-16

hot

序列数据的因果推断在仓储管理的应用

商贸零售

DataFunSummit2023：数据科学在线峰会2023-07-13