决策通常比预测更具后果性,而无处不在的决策场景包括推荐系统、定价算法和医疗场景等。现有的决策方法主要分为三类:使用模拟器做决策、使用预测做决策和基于历史数据优化决策变量。然而,这些方法都存在局限性,例如模拟器的准确性、预测的独立性假设和决策问题的因果性等。
本文提出了一种可信智能决策的框架,该框架包含四个关键要素:反事实推理、复杂收益、预测公平性和可监管决策。
-
反事实推理:包括策略平均效果评估、策略个体效果预测和策略优化。策略平均效果评估通过评估目标策略在人群中的整体效果来优化决策。策略个体效果预测考虑个体异质性,直接对个体实施差别化干预。策略优化则基于反事实预测模型进行决策优化,以实现更好的决策效果。
-
复杂收益:本文研究了在线零售商平台的商品排名问题,考虑了消费者的多购买行为和注意力跨度等因素。通过采用UCB-like算法平衡探索和利用,提出了Multiple-Purchase-with-Budget UCB (MPB-UCB)算法,在长期总收入上实现了O(√T)的遗憾界。
-
预测公平性:本文探讨了决策系统中的公平性问题,提出了条件公平性作为解决方案。通过学习一个满足条件独立性的预测模型,设计了DCFR算法,在真实世界数据集上取得了优于基线的性能。
-
可监管决策:本文研究了个性化定价的监管问题,提出了两种监管政策:ε-差异公平和μ-比率公平。理论分析表明,更严格的约束会增加消费者剩余,减少生产者剩余,但会降低总剩余。实验结果表明,ε-差异约束在消费者和生产者之间取得了更好的平衡。
总之,本文提出了一种可信智能决策的框架,通过反事实推理、复杂收益、预测公平性和可监管决策四个方面,为智能决策提供了更全面、更可靠的解决方案。