登录
注册
回到首页
AI
搜索
发现报告
发现数据
发现专题
研选报告
定制报告
VIP
权益
发现大使
发现一下
行业研究
公司研究
宏观策略
财报
招股书
会议纪要
稀土
低空经济
DeepSeek
AIGC
智能驾驶
大模型
当前位置:首页
/
行业研究
/
报告详情
因果推断方法在微视激励和供需场景的应用与前沿方法探索 (2)
文化传媒
2022-12-16
DataFunSummit2022:因果推断在线峰会
土***
AI智能总结
查看更多
总结
01 背景介绍
因果推断与机器学习
因果推断旨在识别变量间的因果关系,分为三个层次:关联、传统机器学习、反事实。
机器学习依赖独立同分布假设,在开放世界(OOD)下表现不佳,易受因果关系、混淆效应等影响。
推荐系统中的Bias
Bias产生原因:观测数据、闭环反馈循环、用户自然响应与策略激励。
常见偏差类型:选择偏差、曝光偏差、一致性偏差、位置偏差、流行偏差。
Debias方法分类:启发式方法、IPS类方法、无偏数据增强方法、理论工具类方法。
Debias综述
启发式方法
核心思想:假设偏置依赖特定因子(如特征、位置)。
典型方法:PAL(位置偏置感知学习)、EXMF(曝光概率建模)。
IPS类方法
核心思想:基于IPS(逆倾向评分)得到无偏估计。
典型方法:IPS-MF(加权消除选择偏差)、DR(双重稳健联合学习)、EIB(贝叶斯估计)。
无偏数据增强
核心思想:引入无偏数据辅助有偏数据的训练。
典型方法:AutoDebias(元学习优化)、KDCRec(知识蒸馏)。
理论工具类方法
核心思想:通过理论工具(信息瓶颈、因果推断)确保优化目标无偏性。
典型方法:DIB(信息瓶颈)、MACR(多任务学习消除流行偏差)。
现有方法挑战
普适性:大多解决特定Bias问题,依赖特定数据、结构或训练方法。
应用性:缺乏大规模工业界应用和讨论。
金融场景特殊性:产品形态复杂,候选物品少,受多种Bias影响大,专业性要求高。
02 自采样纠偏样本层面纠偏框架
SSTE自采样纠偏框架
问题:现有方法依赖特定数据、结构或训练方法,过度纠偏导致效果下降。
解决方案:模型无关的精度-无偏性平衡的自适应Debias框架。
框架组成:自采样模块、自训练模块、自评估模块。
形式化定义:原始训练集、验证集、Label、特征。
自采样模块:基于truncated IPS生成不同偏置程度的数据集。
自训练模块:模型无关的训练架构,参数分为共享和独立两部分。
自评估模块:综合评估不同Bias程度下的模型效果。
离线效果:在Yahoo! R3公开数据集和业务真实数据集上取得最优效果。
线上验证:为期一个月的A/B实验,核心指标显著提升。
分布分析:头部物品流行度降低,中尾部物品流行度提升。
03 代理表征解耦纠偏特征层面纠偏框架
代理表征纠偏框架
主要问题:推荐系统中混杂因素复杂,部分特征明确包含偏置。
解决方案:基于偏置代理解的耦表征纠偏框架。
核心问题:如何借助偏置代理将特征表征解耦为有偏和无偏两部分。
优化思路:
正则约束:引导特征表征与偏置代理表征向不同方向发展。
表征投影:投影纯化Z,消除混淆代理C间接影响。
互信息求解:约束偏置代理表征C和特征表征Z的互信息趋近于0。
离线效果:在Yahoo! R3公开数据集和业务真实数据集上取得最优效果。
表征分析:基于T-SNE的可视化分析,偏置代理P的表征C和其他特征的表征Z不重叠。
线上效果:为期三周的A/B实验,核心指标显著提升。
04 总结与思考
SSTE自采样纠偏方法总结思考
提出了模型无关的自采样、自训练、自评估框架,较好地解决了工业应用无偏性和预测精度平衡问题。
为IPS类方法实际应用时面临的高方差、不准确等客观问题提供了一条新的解决思路。
代理表征解耦纠偏方法
考虑了工业应用中丰富的特征体系和专家知识,提出了基于偏置代理的表征解耦模型无关纠偏框架。
提出了三种落地性强的解耦表征实现方案,和多种有偏表征使用的方式,可根据实际业务效果选择。
未来研究方向
建模:在样本、特征、表征、模型结构、损失函数等层面上更加丰富的解决方案。
评估:如何设计针对偏置的评估度量,如何结合偏置度量更加全面的评估方法的性能。
应用:更加深入的考虑实际工业应用的特点(精度-无偏性平衡,丰富的特征),与多任务等复杂场景结合。
你可能感兴趣
因果推断方法在微视激励和供需场景的应用与前沿方法探索 (1)
文化传媒
DataFunSummit2022:因果推断在线峰会
2022-12-16
李东晨 - 因果推断在金融场景中的应用
金融
DataFunSummit2022:智能金融在线峰会
2022-11-24
实用型因果推断方法在互联网中的实践
信息技术
DataFunSummit2023:数据科学在线峰会
2023-07-13
因果推断在翼支付智能决策中的探索实践
信息技术
DataFunSummit2022:因果推断在线峰会
2022-12-16
因果推断在有限资源决策中的应用
有色金属
DataFunSummit2022:因果推断在线峰会
2022-12-16