登录
注册
个人信息
我的订单
我的报告豆
我的优惠券
我的笔记
我的阅读
我的收藏
我的下载
我的上传
我的订阅
在线客服
退出登录
回到首页
AI
搜索
发现报告
发现数据
发现专题
专题报告
专题百科
研选报告
定制报告
VIP
权益
发现大使
发现一下
行业研究
公司研究
宏观策略
财报
招股书
会议纪要
seedance2.0
低空经济
DeepSeek
AIGC
大模型
当前位置:首页
/
行业研究
/
报告详情
因果推断方法在微视激励和供需场景的应用与前沿方法探索 (2)
文化传媒
2022-12-16
DataFunSummit2022:因果推断在线峰会
土豆不吃泥
总结
01 背景介绍
因果推断与机器学习
因果推断旨在识别变量间的因果关系,分为三个层次:关联、传统机器学习、反事实。
机器学习依赖独立同分布假设,在开放世界(OOD)下表现不佳,易受因果关系、混淆效应等影响。
推荐系统中的Bias
Bias产生原因:观测数据、闭环反馈循环、用户自然响应与策略激励。
常见偏差类型:选择偏差、曝光偏差、一致性偏差、位置偏差、流行偏差。
Debias方法分类:启发式方法、IPS类方法、无偏数据增强方法、理论工具类方法。
Debias综述
启发式方法
核心思想:假设偏置依赖特定因子(如特征、位置)。
典型方法:PAL(位置偏置感知学习)、EXMF(曝光概率建模)。
IPS类方法
核心思想:基于IPS(逆倾向评分)得到无偏估计。
典型方法:IPS-MF(加权消除选择偏差)、DR(双重稳健联合学习)、EIB(贝叶斯估计)。
无偏数据增强
核心思想:引入无偏数据辅助有偏数据的训练。
典型方法:AutoDebias(元学习优化)、KDCRec(知识蒸馏)。
理论工具类方法
核心思想:通过理论工具(信息瓶颈、因果推断)确保优化目标无偏性。
典型方法:DIB(信息瓶颈)、MACR(多任务学习消除流行偏差)。
现有方法挑战
普适性:大多解决特定Bias问题,依赖特定数据、结构或训练方法。
应用性:缺乏大规模工业界应用和讨论。
金融场景特殊性:产品形态复杂,候选物品少,受多种Bias影响大,专业性要求高。
02 自采样纠偏样本层面纠偏框架
SSTE自采样纠偏框架
问题:现有方法依赖特定数据、结构或训练方法,过度纠偏导致效果下降。
解决方案:模型无关的精度-无偏性平衡的自适应Debias框架。
框架组成:自采样模块、自训练模块、自评估模块。
形式化定义:原始训练集、验证集、Label、特征。
自采样模块:基于truncated IPS生成不同偏置程度的数据集。
自训练模块:模型无关的训练架构,参数分为共享和独立两部分。
自评估模块:综合评估不同Bias程度下的模型效果。
离线效果:在Yahoo! R3公开数据集和业务真实数据集上取得最优效果。
线上验证:为期一个月的A/B实验,核心指标显著提升。
分布分析:头部物品流行度降低,中尾部物品流行度提升。
03 代理表征解耦纠偏特征层面纠偏框架
代理表征纠偏框架
主要问题:推荐系统中混杂因素复杂,部分特征明确包含偏置。
解决方案:基于偏置代理解的耦表征纠偏框架。
核心问题:如何借助偏置代理将特征表征解耦为有偏和无偏两部分。
优化思路:
正则约束:引导特征表征与偏置代理表征向不同方向发展。
表征投影:投影纯化Z,消除混淆代理C间接影响。
互信息求解:约束偏置代理表征C和特征表征Z的互信息趋近于0。
离线效果:在Yahoo! R3公开数据集和业务真实数据集上取得最优效果。
表征分析:基于T-SNE的可视化分析,偏置代理P的表征C和其他特征的表征Z不重叠。
线上效果:为期三周的A/B实验,核心指标显著提升。
04 总结与思考
SSTE自采样纠偏方法总结思考
提出了模型无关的自采样、自训练、自评估框架,较好地解决了工业应用无偏性和预测精度平衡问题。
为IPS类方法实际应用时面临的高方差、不准确等客观问题提供了一条新的解决思路。
代理表征解耦纠偏方法
考虑了工业应用中丰富的特征体系和专家知识,提出了基于偏置代理的表征解耦模型无关纠偏框架。
提出了三种落地性强的解耦表征实现方案,和多种有偏表征使用的方式,可根据实际业务效果选择。
未来研究方向
建模:在样本、特征、表征、模型结构、损失函数等层面上更加丰富的解决方案。
评估:如何设计针对偏置的评估度量,如何结合偏置度量更加全面的评估方法的性能。
应用:更加深入的考虑实际工业应用的特点(精度-无偏性平衡,丰富的特征),与多任务等复杂场景结合。
你可能感兴趣
因果推断方法在微视激励和供需场景的应用与前沿方法探索 (1)
商贸零售
DataFunSummit2022:因果推断在线峰会
2022-12-16
李东晨 - 因果推断在金融场景中的应用
商贸零售
DataFunSummit2022:智能金融在线峰会
2022-11-24
因果推断在翼支付智能决策中的探索实践
商贸零售
DataFunSummit2022:因果推断在线峰会
2022-12-16
实用型因果推断方法在互联网中的实践
商贸零售
DataFunSummit2023:数据科学在线峰会
2023-07-13
因果推断在有限资源决策中的应用
商贸零售
DataFunSummit2022:因果推断在线峰会
2022-12-16