您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[华安证券]:“学海拾珠”系列之一百九十:基于改进的CTGAN-Plus-Features的资产配置优化方法 - 发现报告

“学海拾珠”系列之一百九十:基于改进的CTGAN-Plus-Features的资产配置优化方法

2024-05-29骆昱杉、严佳炜华安证券D***
“学海拾珠”系列之一百九十:基于改进的CTGAN-Plus-Features的资产配置优化方法

——“学海拾珠”系列之一百九十 主要观点: ⚫融合CvaR约束与特征信息的投资组合问题 分析师:严佳炜执业证书号:S0010520070001邮箱:yanjw@hazq.com 考虑到大多数投资组合更注重避免损失而不是波动,文章选择条件风险价值(CVaR)作为合适的风险度量,并将非线性优化问题进行离散化与线性化。同时,文章根据特征与经济环境的相似性对收益序列赋予相应的重要性,以此将特征信息添加到优化问题中。 ⚫使用改进的CTGAN模型生成合成数据 文章旨在通过CTGAN生成能够感知市场环境的合成数据,具体步骤包括对原始数据集利用PCA进行正交化处理,并通过聚类方法生成离散向量,然后使用主成分与离散向量训练CTGAN以生成合成样本。最后,利用存储的特征向量将合成数据集反向投影到原始空间中,得到最终的合成数据集。这一过程为优化问题提供了足量数据,并确保了合成数据通过适应不同市场环境以更好地捕捉历史数据的基本特征。 1.《基于复合模型构造行业ETF组合——“学 海 拾 珠”系 列 之 一 百 八 十九》 ⚫案例分析表明CTGAN-方法的有效性 文章选取十种资产进行回测,结果显示,CTGAN生成的数据能很好地捕捉历史数据的基本特征,并且将合成数据与基于CVaR的优化框架结合使用时,可生成样本外性能令人满意的投资组合。 2.《行业羊群行为与动量策略——“学海拾珠”系列之一百八十八》 3.《强制分红与公司投资:基于多国数据分析——“学海拾珠”系列之一百八十七》 ⚫文献来源 核心内容摘选自José-Manuel Peña, Fernando Suárez, Omar Larre,Domingo Ramírez, ArturoCifuentes于2024年2月22日在QuantitativeFinance上的文章《A Modified CTGAN-Plus-Features Based Method forOptimal AssetAllocation》 4.《基金中的“伪择时”现象——“学海拾珠”系列之一百八十六》 5.《DiffsFormer:基于扩散模型的因子增强框架——“学海拾珠”系列之一百八十五》 ⚫风险提示 6.《深度投资组合管理中的对比学习和奖励平滑——“学海拾珠”系列之一百八十四》 文献结论基于历史数据与海外文献进行总结;不构成任何投资建议。 7.《基金业绩基准之外的共同持股意味着什么?——“学海拾珠”系列之一百八十三》 8.《基于网络和机器学习的因子、资产和混合配置——“学海拾珠”系列之一百八十二》 正文目录 1引言.......................................................................................................................................................................................................42问题描述..............................................................................................................................................................................................62.1离散化与线性化...........................................................................................................................................................................73合成数据生成......................................................................................................................................................................................83.1条件表格生成对抗网络(CTGAN).........................................................................................................................................93.2一种改进的CTGAN-PLUS-FEATURES方法................................................................................................................................94应用案例............................................................................................................................................................................................104.1特征选取......................................................................................................................................................................................114.2合成数据生成过程(SDGP)的验证......................................................................................................................................124.3策略测试......................................................................................................................................................................................154.4性能指标......................................................................................................................................................................................174.5性能比较......................................................................................................................................................................................184.6关于结果与潜在统计偏差的讨论............................................................................................................................................20 图表目录 图表1文章框架...........................................................................................................................................................................................................4图表2合成数据生成模式.........................................................................................................................................................................................9图表3改进的CTGAN-PLUS-FEATURES的数据生成过程.........................................................................................................................10图表4资产配置示例中使用的指数...................................................................................................................................................................11图表5资产分配示例中使用的特征...................................................................................................................................................................11图表6合成数据与原始数据的成对比较(收益).......................................................................................................................................12图表7合成数据与原始数据的成对比较(特征).......................................................................................................................................13图表8KOLMOGOROV-SMIRNOV检验:原始与合成的收益率和利率分布的比较..............................................................................13图表9原始数据与合成数据的相关矩阵之间的相似性比较.....................................................................................................................14图表10按类别划分的合成数据与原始数据的各维度KS检验均值的