登录
注册
个人信息
我的订单
我的报告豆
我的优惠券
我的笔记
我的阅读
我的收藏
我的下载
我的上传
我的订阅
在线客服
退出登录
回到首页
AI
搜索
发现报告
发现数据
发现专题
专题报告
专题百科
研选报告
定制报告
VIP
权益
发现大使
发现一下
行业研究
公司研究
宏观策略
财报
招股书
会议纪要
seedance2.0
低空经济
DeepSeek
AIGC
大模型
当前位置:首页
/
行业研究
/
报告详情
2-1 因果推断在游戏中的应用 - 房栋 腾讯游戏
文化传媒
2022-06-13
DataFunSummit2022:数据科学在线峰会
Gnomeshgh文J
游戏中的因果推断:挑战与解决方案
游戏场景中的因果推断挑战
用户体验和隐私因素导致缺乏实验数据。
观察数据存在干预偏差,如人工运营或算法选择偏差。
高活跃用户与低活跃用户被过度干预问题突出。
解决方案
利用观测数据进行因果推断,评估干预效果。
使用ATT(干预组平均处理效应)评估干预人群效应。
使用ATE(平均处理效应)评估整体效应,需通过加权方式均衡样本分布。
常用方法包括倾向性得分匹配(PSM)、Inverse-Probability-Treatment-Weighting(IPTW)、Double-Machine-Learning(DML)、Double-Robust-Estimator(DRE)、X-Learner。
双重稳健估计(DRE)在业务中更稳健,可在倾向性分数预测不准时调整。
技术挑战与解决方案
一般因果推断工具集(如微软econml、dowhy、uber causalml)非分布式实现,无法处理大数据量。
多场景数据量巨大,需精细化运营策略。
分布式低复杂度倾向性分数匹配(Hist-PSM)
通过将连续变量转化为直方变量实现匹配,降低内存占用和计算代价。
Hist-PSM步骤:计算倾向性分数、PS分桶、计算个体数量、计算阈值、提取个体、合并数据。
分布式计算架构将匹配任务分解为子任务,提高效率。
Hist-PSM内存占用更小,计算代价更小。
通过平衡性检验,Hist-PSM挑选的对照组在各类混淆变量的分布与干预组近似。
分布式鲁棒双重稳健估计
传统双重稳健估计在二元结果场景存在问题,如大量小于-1或大于1的ATE出现。
Binary双重稳健估计将二元结果问题转化为连续回归问题,使用线性回归模型的预测值逼近分类任务真实标记的对数几率。
仿真检验显示,Binary双重稳健估计相比UBER-X-Learner和传统双重稳健估计,平均偏差降低42.16%和38.54%。
安慰剂检验显示,Binary双重稳健估计比PSM和DRE更加密集地分布在0附近。
缩减样本量仿真检验显示,Binary双重稳健依然表现出良好的ATE估计。
分布式面板双重差分
玩家参与不同活动次数、程度不同,受多种活动同时进行影响,难以区分效果。
构造面板二重差分(PanelDID)模型对各个活动的效果进行归因。
整体分析流程:构造面板数据、构造面板二重差分模型、参数估计、得出结果。
示例显示,可通过模型得出各活动效果(ATE)。
总结与展望
探索更多潜在的业务场景。
优化在未知ground-truth环境下的检验。
标准化分析方法论。
你可能感兴趣
李东晨 - 因果推断在金融场景中的应用
商贸零售
DataFunSummit2022:智能金融在线峰会
2022-11-24
因果推断方法在微视激励和供需场景的应用与前沿方法探索 (2)
商贸零售
DataFunSummit2022:因果推断在线峰会
2022-12-16
因果推断在有限资源决策中的应用
商贸零售
DataFunSummit2022:因果推断在线峰会
2022-12-16
因果推断在海外游戏增长中的应用
商贸零售
DataFunSummit2022:因果推断在线峰会
2022-12-16
序列数据的因果推断在仓储管理的应用
商贸零售
DataFunSummit2023:数据科学在线峰会
2023-07-13