核心观点
本报告旨在提出一个通用的基准测试框架,用于评估填补全球水平面辐射(GHI)数据缺失的方法,并评估一组基线方法的性能。该框架使用真实测量数据生成具有各种数据缺失模式的合成日辐射剖面,然后使用这些合成剖面分别作为参考数据和测试数据的输入,以评估测试方法的性能。
关键数据
- 参考数据库: 16个BSRN站点的1分钟GHI测量数据,时间跨度为2004年至2018年,以及来自Helioclim-3v4和SG2库的卫星数据和太阳位置信息。
- 数据缺失模式: 不同的缺失长度、频率和分布,以及白天和夜晚的缺失模式。
- 测试方法: 5种GHI时间序列填补方法(GF0至GF4)和8种计算每日辐射总和的方法(DSG0至DSG3)。
研究结论
- GHI时间序列填补: 卫星数据方法(GF4)在整体性能方面优于其他方法。对于较小的数据缺失,线性插值方法(GF1)表现最佳;对于较大的数据缺失,卫星数据方法(GF4)表现最佳。
- 每日辐射总和计算: 卫星数据方法(DSG2)在整体性能方面优于其他方法。对于较小的数据缺失,线性插值方法(DSG1)表现最佳;对于较大的数据缺失,卫星数据方法(DSG2)表现最佳。
- 数据缺失长度的影响: 对于小于30分钟的数据缺失,GF1表现最佳;对于较大的数据缺失,GF4表现最佳。然而,当卫星数据不可用时,GF3(基于核回归的方法)在大于2小时的数据缺失情况下表现优于GF1。
- 数据缺失百分比的影响: 对于小于5%的数据缺失,DSG方法的表现良好,RMSE低于1%;对于大于20%的数据缺失,不确定性在2%至4%之间。GF1→d方法在20%以下的数据缺失情况下表现最佳;DSG2和GF4→d方法在20%至50%的数据缺失情况下表现最佳;DSG2方法在大于50%的数据缺失情况下表现最佳。
框架扩展
该框架可以扩展到更大的参考数据库,包括更多地点和更长的时间跨度;集成更多填补方法;进行更多性能测试,例如区分晴朗和多云或阴天。
框架局限性
该框架基于随机生成的数据缺失模式,可能忽略其外部原因(气象参数、维护限制等),从而导致一些不切实际的场景。未来可以考虑基于时间发生和持续时间对每个地点进行纯随机生成数据缺失,以检查结果的连贯性。