您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[光大证券]:机器学习系列报告之一:机器学习,开拓金融量化新前沿 - 发现报告
当前位置:首页/其他报告/报告详情/

机器学习系列报告之一:机器学习,开拓金融量化新前沿

2019-01-15刘均伟光大证券绝***
机器学习系列报告之一:机器学习,开拓金融量化新前沿

敬请参阅最后一页特别声明 -1- 证券研究报告 2019年1月15日 金融工程 机器学习:开拓金融量化新前沿 ——机器学习系列报告之一 金融工程深度 机器学习如今无时无刻不在影响着世界,越来越多的工具和产品被发明出来以替代以往需要大量人工操作的作业,有些甚至是行业专家才能完成的工作。在棋类运动上,深蓝(DeepBlue)、AlphaGo等程序已经陆续战胜了人类顶尖棋手,而在金融领域,世界上第一个人工智能ETF也在2017年诞生。虽然该ETF目前的表现较为一般,但却足够促使我们思考一个问题:机器学习或者人工智能是否会深刻地影响到金融领域?如果是的话,我们又该如何探索机器学习在金融领域的应用方式。  金融领域尚是机器学习下一片蓝海。21世纪开始,尤其是最近10年,虽然机器学习的研究与应用成果在自然科学领域有了突飞猛进的进步,但在金融领域的应用却受到了挑战。基于对海外主流投行在机器学习应用情况的数量,我们认为机器学习在金融服务方面已经崭露头角,而在金融投资领域则有待观察。  量化投资结合机器学习的趋势不可阻挡。量化投资是机器学习天然的应用场景,我们从整体环境的改变,机器学习实现难度的降低,传统量化遇到的瓶颈这三个角度论证了量化投资为何要研究机器学习。在这三个方面相互作用下,机器学习在未来量化研究中的作用将越来越大,如何找到机器学习合适的运用方式就成了当前量化研究领域最有前景的研究方向之一。  金融领域下机器学习的正确用法仍需探索。许多在看似直观的应用方式下直接套用机器学习算法的做法往往并不能达到预期的效果。在金融投资领域下运用机器学习的方式可能需要更进一步的探索与尝试。我们认为可以尝试的方向包括但不限于数据处理,“白箱“化处理,过拟合程度的估计等等。我们构造三个简单的示例,在第一个示例中我们验证了可以将交易数据结构化为更适合机器学习算法的结构,成交量或成交额等分K线比传统时间等分K线有更适合的统计特征,用它们作为输入数据可以得到更好更稳定的结果;第二个示例展示通过研究算法下不同输入特征的特征重要性,可以更好地理解在算法之后是什么因素在真正起到预测作用;最后一个示例中我们通过构建生成数据研究RSRS择时策略的路径依赖程度,并一定程度上测试了我们所使用的开平仓阈值参数值是否为最优选择。  风险提示:测试结果均基于模型和历史数据,模型存在失效的风险。 分析师 刘均伟 (执业证书编号:S0930517040001) 021-52523679 liujunwei@ebscn.com 联系人 胡骥聪 021-52523683 hujicong@ebscn.com 2019-01-15 金融工程 敬请参阅最后一页特别声明 -2- 证券研究报告 目 录 1、 金融是机器学习下一个主战场 ................................................................................................... 5 1.1、 自然科学领域:大放异彩 ........................................................................................................................ 5 1.2、 金融领域:服务崭露头角、投资有待观察 .............................................................................................. 6 2、 探索金融领域下机器学习的正确用法 ...................................................................................... 11 2.1、 量化投资为什么要研究机器学习 ........................................................................................................... 11 2.2、 示例一:将数据处理成更合适的结构 .................................................................................................... 12 2.3、 示例二:利用特征重要性打开“黑箱” ..................................................................................................... 15 2.4、 示例三:利用生成数据了解过拟程度 .................................................................................................... 18 3、 风险提示 ................................................................................................................................. 21 2019-01-15 金融工程 敬请参阅最后一页特别声明 -3- 证券研究报告 图目录 图1:机器学习算法发展........................................................................................................................................... 5 图2:各大投行发展机器学习研究团队 ..................................................................................................................... 7 图3:AI Powered Equity ETF(AIEQ)与标普500指数走势比较 ............................................................................ 8 图4:海外利用机器学习算法预测股票价格的论文 .................................................................................................. 9 图5:机器学习在金融投资领域接受度较低 ........................................................................................................... 10 图6:时间等分K线收益率分布 ............................................................................................................................. 14 图7:Tick等分K线收益率分布 ............................................................................................................................. 14 图8:成交量等分K线收益率分布 ......................................................................................................................... 14 图9:成交额等分K线收益率分布 ......................................................................................................................... 14 图10:在随机森林算法下不同输入特征在预测EBQC(光大综合质量)因子收益方向上的特征重要性 ............... 18 图11:沪深300生成数据曲线示例 ........................................................................................................................ 19 图12:生成曲线(1)上测试原有参数下的RSRS策略 ......................................................................................... 20 图13:生成曲线(2)上测试原有参数下的RSRS策略 ......................................................................................... 20 图14:RSRS策略在实际沪深300曲线上的历史回测效果 ..................................................................................... 20 图15:不同参数S的平均排名 ............................................................................................................................... 21 2019-01-15 金融工程 敬请参阅最后一页特别声明 -4- 证券研究报告 表目录 表1:AI Powered Equity ETF(AIEQ)与标普500指数统计数据 ............................................................................ 8 表2:机器学习基金失败的7大原因 ...................................................................................................................... 11 表3:多种K线切片采样方式 ................................................................................................................................ 13 表4:不同K线切片方式下收益率数据的正态性 ................................................................................................... 14 表5:模型在各个股票上预测准确率统计 ........................................................