您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [DataFunSummit2023:数据科学在线峰会]:序列数据的因果推断在仓储管理的应用 - 发现报告

序列数据的因果推断在仓储管理的应用

报告封面

因果分析及其在库存控制中的应用 Erli Wang(王尔立)NEC 实验室, 中国 Apr 22, 2023 C本体目录 01 库存控制说明 因果关系有助于库存控制 • 目标 : 在最大化高价值客户需求之间取得良好的平衡实现并最大限度地减少存储、交付和废物成本。 因果关系有助于库存控制 • 原样 : 根据我们的调查 , 许多大公司仍然 , • 需求预测是基于过去的经验 , 而不是数据驱动 , 难以进一步改进。• 库存政策简单采用(s,S)策略,未考虑实际存在的不确定性,如错误的库存水平。 · 因果分析有助于理解业务流程以解释性方式发生的原因。 自动确定关系 “最佳 ” 决策的方法 • 库存控制的关键是将每个状态映射到行动 , 满足 • 路线图: • 方法 2 : 跨不同环境有效管理库存• 方法 - 1 : 改善需求预测 D ;• 在每个环境中重新学习政策代价高昂。• 我们结合因果发现与近期的强化学习进展,以提供高质量的排序策略。• 一个最大的挑战是准确预测需求。 • 我们提供基于Web的服务,实现可解释的预测和多目标干预。B ; 我们的解决方案 : 预览 2背景 : 时间序列、因果关系•时间因果模型的基础•时间序列数据的假设 时间序列介绍 串行数据: 当数据集中的信息依赖于数据集中的其他信息。 •时间序列数据的独特性在于它具有自然的时间信息。 • 因此 , 时间序列分析需要数据•弱静止:期望函数和协方差函数不随时间变化。 · 假设过去存在可预测的模式•自相关:是两个或多个观测值之间的相似性 , 它们之间存在时滞。• 帮助我们识别历史数据中的有用模式 因果模型和理论工具 • SCM(结构因果模型) 是强大的 , 因为它接近数据生成的机制。 常用技术 • 时间表示 : 完整图 , 单位图和汇总图 • 多元时间序列结构学习 • 基于约束 : 依赖于独立性测试和条件独立性测试 , 条件集增加。• 示例 : PCMCI [uai '20] , SVAR - FCI [kdd' 18] , PC + 传输熵(例如 , PCGCE [uai '22])• 基于分数 : 区分不同分数的不同图形(例如 , BIC)• 示例: 动力动力 [AISTATS '20]• 受限模型类: 通过假设特定模型类来确定因果模型。• 示例 : VAR [80s] 、 VAR - LiNGAM [JMLR '10] 、 NBCB [ECML - PKDD' 21]格兰杰因果关系 : 量化一个时间序列的过去有助于预测未来的程度。• 示例: NGC [TPAMI '22] 3. 因果关系有助于需求预测•主要技术挑战•关键算法描述•案例研究 : 需求预测•功能 : 结构学习、关键驱动因素和预测•我们的因果分析平台 “最佳 ” 决策的方法 • 库存控制的关键是将每个状态映射到行动 , 满足 • 路线图: • 方法 2 : 有效管理不同环境中的库存 B ;• 方法 - 1 : 改善需求预测 D ;• 我们提供可解释的预测和多目标干预作为基于 Web 的服务。最大的挑战之一是准确预测需求。 • 在每个环境中重新学习政策代价高昂。• 我们结合因果发现与最新的强化学习进展,以提供高质量的排序策略。 数学框架 • 贝叶斯网络具有丰富的理论功能: 马尔可夫性质、 d - 分离性、路径分析、...我们专注于预测任务。• 一般选项: 基于父、基于马尔可夫毯和基于 O - set 。 单变量时间序列 : 仅用于目标的自相关t 关键算法描述 问题: • 应理解冗余或误导性边缘 参考: - VAR: Lutkepohl H. 多时间序列分析的新介绍. 施普林格出版社,德国柏林, 2007。- VAR-LiNGAM: Hyvärinen A., Zhang K., Shimizu S., and Hoyer PO. 使用非高斯性估计结构向量自回归模型. 机器学习研究杂志, 11: 1709-1731, 2010。- PCMCI+: Runge J. (2020): 在自相关非线性时间序列数据集中发现 contemporaneous 和滞后因果关系. 第36届不确定性会议论文集。人工智能 , UAI 。 2020 案例 1 : 具有真相的结构恢复 · 更多变量 , 更多滞后加权绝对百分比误差• 比较分类边缘的前 1% 、 5% 、... 、 100% 中的系数恢复的准确度。 案例 2 : 消费数据集 • 动态随机一般均衡是研究经济随时间变化的宏观经济模型•美国商业周期中的冲击和摩擦 : 贝叶斯 DSGE 方法 (europa. eu) 'dc': 消费差异 'dinve': 投资差异 'dy':GDP差异 'dw': 工资差异 'labobs': 劳动力供应 'pinfobs': 通胀 'robs': 利率 更多关键功能的测试 平台 : https: / / inguo. info / 4. 因果关系有助于补充战略 •主要技术挑战•情况 1 : 新领域中基于反事实的数据增强•情况 2 : 行动空间大的在线补货策略 “最佳 ” 决策的方法 • 库存控制的关键是将每个状态映射到行动 , 满足 • 路线图:· 方法 - 1 : 改善需求预测D ;• 一个最大的挑战是准确预测需求。 • 我们提供可解释的预测,并通过基于Web的服务实现多目标干预。 • 方法 2 : 有效管理不同环境中的库存 B ;• 在每个环境中重新学习政策代价高昂。• 我们将因果发现与最新的强化学习进展相结合,以提供高质量的排序策略。 情况 1 : 基于反事实的数据增强 问题 : 历史数据经常与不同的场景混合。 在同一域上 , 基于模型的生成器可以实现与无模型方法相当的功能。 然而 ,, 当我们转移到新域时 : - 基于MLP 的生成器恶化显著 ;- 基于因果关系的生成器仅需无模型方法所需样本量的1/10即可实现相似的性能,在新环境中它将重新学习策略。 CART - POLE (umass. edu) Idea • 我们将因果恢复与基于反事实的数据增强相结合 , 以实现顺序跨异构环境的决策 • 优势:非专家数据集可以被利用来解开因果机制,从而在从多个来源收集高质量数据方面实现巨大的成本节约。 Results • 目标 : 从国家到行动的最佳映射(政策) • 我们假设交互骨架保持不变 , 但相互作用的强度在不同的领域是不同的。 • 奖励的定义是 : • 成本 : 额外库存和交付费的持有成本。• 收入 : 根据当前库存的实际订单履行 ; • Training & adaptation:• 每次试验包含多步作为初始数据集,并对20次试验进行随机排序 • 在适应新领域时分配解开领域索引。=income持有成本订购成本 情况 2 : 在线订购策略大动作空间 •问题: • 由于多种商品 , 决策空间太大 • 许多方法假设股票状态将被精确计算。 • 自 1960 年代以来研究全面观察的系统 • Costing损失数十亿美元可口可乐零售研究委员会 (咨询 , 1996 年)• Kang and Gershwin (2005) found51% 的库存准确率在一家全球零售商中 , DeHoratius 和 Raman (2008) 发现准确度来自大型零售商的 37 家零售店的超过 350K 库存记录只有 35% • 多种方法 : 预防 , 纠正和整合 • 集成 : 强大的决策框架 , 以解决记录不准确的存在• 部分可观测马尔可夫决策过程 recently 开始受到关注,但其主要集中在单商品问题上。 . • 我们的解决方案 : 快速重新规划每一步的政策。 Idea • 在线计划员 :• 只计算当前信念的最佳行动 • 信仰树• 步骤 : 动作选择 , 观察选择 , 扩展 , 展开和备份 • 优点:• 当决策空间巨大时 , 快速重新计划 ; • 当需求预测模型发生变化时 , 从头开始计划 Results •Results • 当需求噪声大时, 简单 (s, S) 策略可能失败。• 我们的解决方案可以找到比现有解决方案更为积极的库存控制策略,从而实现更高的利润。 感谢您的观看—2023 年 DataFunSummit谢谢 - 演讲人 : 王尔立 - NEC 中国别研究所 - 研究人员