您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[华安证券]:“学海拾珠”系列之一百四十九:基于强化学习和障碍函数的自适应风险管理在组合优化中的应用 - 发现报告

“学海拾珠”系列之一百四十九:基于强化学习和障碍函数的自适应风险管理在组合优化中的应用

2023-07-12吴正宇、严佳炜华安证券北***
“学海拾珠”系列之一百四十九:基于强化学习和障碍函数的自适应风险管理在组合优化中的应用

——“学海拾珠”系列之一百四十九 主要观点: 执业证书号:S0010520070001邮箱:yanjw@hazq.com 分析师:吴正宇执业证书号:S0010522090001邮箱:wuzy@hazq.com 回到国内市场,有效平衡收益和风险一直是投资人永恒的目标,当前A股市场风格切换速度较快,如何适应不同的市场环境,做出有效的组合管理决策是十分关键的,本文的研究思路值得借鉴。 ⚫RL和BF相结合的RiPO框架在可接受风险范围内获得高回报 基于RL的交易agent往往只强调追求高收益,无法明确管理投资风险,在市场高度波动时,会造成巨额损失。引入基于BF的风险控制器可以实时监测市场状态,严格执行风险约束条件,动态调整投资组合,避免潜在损失,特别是在下行市场中。 相关报告 1.《前景理论能否解释共同基金的业绩——“学海拾珠”系列之一百四十一》 ⚫DCM和ARS可以动态调整风险约束强度 不变且严格的风险管理会导致市场上行时错失很多盈利机会。在基于BF的风险控制器中引入DCM和ARS两个自适应机制将灵活地调节风险约束强度以满足不同的市场风格和投资者风险偏好,动态平衡了RiPO的盈利能力和风险管理水平。 2.《ChatGPT交易策略15个月收益500%+——“学海拾珠”系列之一百四十二》 3.《模糊因子与资产配置——“学海拾珠”系列之一百四十三》 ⚫实证结果证实了RiPO在管理下行风险上的优势 4.《动量、反转和基金经理过度自信——“学海拾珠”系列之一百四十四》 使用标普500指数前10大成分股的数据在两种不同市场风格中进行回测:与9种基准方法相比,上行市场中,RiPO可以在相对较低的风险水平下获得最高收益;而在下行市场中,可以显著降低下行风险,避免巨额损失。特别地,RiPO在风险和收益方面都优于不包含风险控制器的RL算法。 5.《股票因子个性化:基于股票嵌入的因子优化——“学海拾珠”系列之一百四十五》 6.《盈余公告披露的现象、方法和目的——“学海拾珠”系列之一百四十六》 ⚫风险提示 文献结论基于历史数据与海外文献进行总结;不构成任何投资建议。 7.《基金抛售资产时的选择性偏差——“学海拾珠”系列之一百四十七》 8.《投资者情绪能预测规模溢价吗?——“学海拾珠”系列之一百四十八》 正文目录 1引言.......................................................................................................................................................................................................42预备知识...............................................................................................................................................................................................52.1组合优化............................................................................................................................................................................................................52.2障碍函数(BF).............................................................................................................................................................................................63问题描述...............................................................................................................................................................................................63.1部分可观测马尔可夫决策过程...................................................................................................................................................................63.2观测与动作........................................................................................................................................................................................................74方法论...................................................................................................................................................................................................84.1整体框架............................................................................................................................................................................................................84.2基于障碍函数的强化学习的风险管理.....................................................................................................................................................94.3动态贡献机制................................................................................................................................................................................................104.4自适应风险策略...........................................................................................................................................................................................115实证分析.............................................................................................................................................................................................115.1实验设置.........................................................................................................................................................................................................115.2业绩比较与分析...........................................................................................................................................................................................126结论.....................................................................................................................................................................................................15风险提示:.............................................................................................................................................................................................15 图表目录 图表1RIPO框架概况...............................................................................................................................................................................................9图表2数据集的描述..............................................................................................................................................................................................11图表3两种市场风格的业绩比较.......................................................................................................................................................................12图表4MS-2数据集中投资组合价值比较....................