您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[安信证券]:金融工程主题报告:机器学习与量化投资:综述与反思,扬帆正当时 - 发现报告
当前位置:首页/其他报告/报告详情/

金融工程主题报告:机器学习与量化投资:综述与反思,扬帆正当时

2018-02-07杨勇安信证券向***
金融工程主题报告:机器学习与量化投资:综述与反思,扬帆正当时

1 本报告版权属于安信证券股份有限公司。 各项声明请参见报告尾页。 ■导读: 机器学习和人工智能在量化投资的应用有很长的历史 机器学习在九十年代初的热潮中已经被大量运用于量化投资中。尽管受限于当时的计算能力和算法,但是由于在算法交易和CTA等领域中机器学习提供了一些更好的解决方案,机器学习在这些领域的应用一直延续到今天。 机器学习在量化投资中应用的九个思考 本报告是系列报告的第一篇,简略介绍了机器学习运用到二级市场投资过程中的一些常见问题。这些问题覆盖了策略研发常见错误,策略归因,策略失效判断,机器学习平台的建立,交易系统和机器学习平台的对接以及机器学习对冲基金的团队架构。后续系列报告将会详细围绕这些问题展开。 适当使用下的机器学习策略 本报告中使用了两个策略作为例子。其中股指短线策略的夏普3.55,年化收益80.36%。商品长周期策略夏普1.06,年化收益8.61%。 ■风险提示: 机器学习量化策略的结果是对历史经验的总结,存在失效的可能。 Tabl e_Title 2018年02月07日 机器学习与量化投资:综述与反思,扬帆正当时 Tabl e_Bas eI nfo 金融工程主题报告 证券研究报告 杨勇 分析师 SAC执业证书编号:S1450518010002 yangyong1@essence.com.cn 周袤 分析师 SAC执业证书编号:S1450517120007 zhoumao@essence.com.cn Tab le_Report 相关报告 平安大华沪深300 ETF上市 2018-01-27 黑科技应用之如何看待“新周期”之辩 2018-01-19 FOF和资产配臵周报:富国中证10年期国债ETF开始募集 2018-01-15 FOF和资产配臵周报:广发上证10年期国债ETF开始募集 2017-12-23 FOF和资产配臵周报:广发中证10年期国开债LOF上市 2017-12-17 2 金融工程主题报告 本报告版权属于安信证券股份有限公司。 各项声明请参见报告尾页。 内容目录 1. 机器学习简介 .......................................................................................................................... 4 1.1. 机器学习的基本流程...................................................................................................... 4 1.1.1. 决定数据源,数据采集 ......................................................................................... 4 1.1.2. 数据预处理 ........................................................................................................... 4 1.1.2.1. 数据清洗 ........................................................................................................... 4 1.1.2.2. 数据转换 ........................................................................................................... 4 1.1.2.3. 将数据分为训练集,验证集和测试集 ................................................................ 4 1.1.3. 基于训练集和验证集建立模型 .............................................................................. 5 1.1.4. 在测试集上检验模型效果,如果效果不好,回到第(2,3)步,否则去第(5)步 ........................................................................................................................................ 5 1.1.5. 部署至实际系统.................................................................................................... 5 1.2. 机器学习应用场景 ......................................................................................................... 5 1.3. 机器学习在量化投资中的应用 ....................................................................................... 7 1.3.1. 历史 ...................................................................................................................... 7 1.3.2. 人工智能复兴的原因 ............................................................................................ 7 1.3.3. 关于本系列研报.................................................................................................... 7 2. 机器学习九个思考 .................................................................................................................. 7 2.1. 机器学习从线性到非线性 .............................................................................................. 9 2.2. 预测周期:从低频到高频 ............................................................................................ 10 2.3. 从单次分析到推进分析 ................................................................................................ 11 2.4. 预测目标:从收益到其他 ............................................................................................ 12 2.5. 从分类到回归 .............................................................................................................. 12 2.6. 预测值相关 .................................................................................................................. 13 2.7. 如何让机器学习不那么黑箱(非线性的预测体系需要非线性的归因方式) ................ 14 2.8. 如何判断策略失效 ....................................................................................................... 15 2.9. 机器学习杂谈 .............................................................................................................. 16 3. 监督式学习简介 .................................................................................................................... 16 3.1. 线性模型 ...................................................................................................................... 16 3.2. Kernel Smoothing ........................................................................................................ 16 3.3. 树状模型:Bagging 和 Boosting ............................................................................... 18 3.4. 支持向量机 .................................................................................................................. 18 3.5. 深度学习:CNN, DNN 和 LSTM ............................................................................... 19 图表目录 图1:机器学习基本流程图 ......................................................................................................... 5 图2:神经网络识别数字 ............................................................................................................. 6 图3:自然语言处理示意图 ......................................................................................................... 6 图4:标准神经网络回归-净值...........