您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[DataFunSummit2023:数据科学在线峰会]:后士浩-时序预测算法在蔚来汽车的应用探索_opt - 发现报告

后士浩-时序预测算法在蔚来汽车的应用探索_opt

AI智能总结
查看更多
后士浩-时序预测算法在蔚来汽车的应用探索_opt

演讲人:后士浩—蔚来汽车—高级算法工程师 目录Contents 业务背景 总结展望 算法实践 关键挑战 01业务背景 蔚来汽车简介 蔚来汽车成立于2014年11月,是高端智能电动汽车市场的先驱及领跑者。蔚来的使命是创造愉悦的生活方式。蔚来旨在打造一个以智能电动汽车为起点的社区,与用户分享欢乐、共同成长。蔚来的产品组合包括六座智能电动旗舰SUVES8、中大型五座智能电动SUVES7(或EL7)、五座全场景智能电动SUVES6、五座智能电动旗舰轿跑SUVEC7、五座智能电动轿跑SUVEC6、智能电动旗舰轿车ET7及中型智能电动轿车ET5。 时序预测背景 Ø周期:重复的上升、下降过程,从哪来回哪去Ø季节性:固定频率的上升、下降,多为先验因素Ø趋势:长期保持增长或者下降 Ø谱密度:信号由少数主频叠加而成 换电站需求预测 常见任务 Ø按照输入变量数量划分,包括:ü单变量:单个变量ü多变量:至少两个变量Ø按照输出序列长度划分,包括:ü单输出:预测长度等于1ü多输出:预测长度大于1Ø按照输出序列时间跨度划分,包括:ü短期预测ü中期预测ü长期预测 应用场景 Ø新站选址Ø错峰充电Ø电池调度 业务需求Ø短期预测:预测未来24小时的单量 Ø中期预测:预测未来30天的单量Ø长期预测:预测未来12个月的单量 算法任务 Ø多变量—多输出的短期预测Ø多变量—多输出的中期预测Ø多变量—多输出的长期预测 02关键挑战 关键挑战 Ø多序列的复杂季节性ü不同换电站的序列不同 Ø增长与竞争ü电区房用户增长 Ø时间特征的漂移 ü节假日时间不固定 ü预测具有时间先验 03算法实践 机器学习模型 ARIMA LGB Prophet 优点:Ø准确率较高; 优点:Ø简单易行,可解释性强 优点:Ø简单易行,可解释性强 Ø数据量要求低Ø计算速度较快,可以对每个站在线拟合推理 Ø数据量要求低Ø计算速度更快,可以对每个站在线拟合推理 Ø简单易行,可解释性强;Ø支持批量预测,计算速度更快; 缺点:Ø迭代模型等于迭代特征, 缺点:Ø仅支持单变量 缺点:Ø仅支持单变量 Ø无法特征工程Ø准确率低 Ø无法特征工程Ø准确率较低 迭代特征存在瓶颈;Ø对类别特征利用不充分; 适用场景:Ø项目初期冷启动 适用场景:Ø项目初期迭代 适用场景:Ø项目中期迭代 深度学习模型 统一的架构(unifiedarchitecture):所有的CNNs、RNNs和Transformers都是生成模型 ØCRNN模型的编码器和解码器是1D卷积网络和RNN网络 ØInformer模型的编码器和解码器是Transformer网络 Embedding引擎 Token Embedding 如何解决多序列问题? Token常见于自然语言处理,Token就是“词”的数字化表示,此处也需要token表达属性变量。 ValueEmbedding 如何解决竞争与增长问题? 竞争与增长是容易被忽视的相关变量,我们需要从单站维度考虑区域维度。 PositionalEmbedding 如何解决复杂季节性问题? 标记不同序列在不同季节性下的变化位置,这里和transformer的PE方法相同。 TemporalEmbedding 如何解决节假日时间不固定问题? 如何解决时间先验问题? 虽然预测时间数据已知,但是其它相关变量未知,输入数据维度不一致,怎么处理? 卷积模块设计 假设输入序列长度等于L,第i个卷积层的卷积核大小等于2i+1,步长等于1,需要多少卷积层? 卷积模块设计 现在我们已经知道卷积神经网络应该有多少层,那么层与层之间应该怎么连接? ØLGB模型对节假日过拟合,且不利于处理节假日预测;ØInformer模型对长序列的季节性表现不佳,但DCN模型可以通过对齐时变变量,有利于处理节假日预测; 04总结展望 未来计划 更有价值 演讲人:后士浩—蔚来汽车—高级算法工程师