您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[华泰期货]:量化策略专题报告:AI辅助投研系列(一),基于知识库的研报分析 - 发现报告
当前位置:首页/其他报告/报告详情/

量化策略专题报告:AI辅助投研系列(一),基于知识库的研报分析

2025-03-14高天越、李光庭、李逸资、黄煦然华泰期货起***
量化策略专题报告:AI辅助投研系列(一),基于知识库的研报分析

期货研究报告量化专题报告20250314 AI辅助投研系列(一):基于知识量库化专的题报研告丨报20分25析314 研究院量化组 研究员 高天越 075523887993 gaotianyuehtfccom从业资格号:F3055799投资咨询号:Z0016156 李光庭 075523887993 liguangtinghtfccom从业资格号:F03108562投资咨询号:Z0021506 李逸资 075523887993 liyizihtfccom 从业资格号:F03105861投资咨询号:Z0021365 联系人 黄煦然 075523887993 huangxuranhtfccom 从业资格号:F03130959 投资咨询业务资格: 证监许可【2011】1289号 摘要 每日进行信息收集、行情深挖以及市场跟踪,都是投研人员的必要工作。大模型的世,让研究行业变得更智能、更便捷、更高效,其版本的持续迭代、功能的不断更新,展现应用的无限潜力。若投研人员能充分发挥大模型在投研工作中的效用,将更能凸显自身的价值。本报告将从案头文字工作、持仓数据跟踪、观点跟踪这三个维度,阐述如何运用大模型,使投研工作更加高效便捷,拓展研究深度与广度。 第一篇聚焦于知识库在案头文字工作上的的运用 知识库搭建:借助imacopilot智能平台,研究人员可快速构建知识库。该知识库不仅为投研人员保障了数据来源,还提供了个性化访问知识和数据的方法。 海量信息归纳:利用搭建好的知识库,研究人员可以将海量信息一键打包,或按需求归纳总结。 深度信息挖掘:根据知识库,大模型可以深挖潜在信息,帮助投研人员更好地分析行情,甚至发现新的市场观点。 研究逻辑提取:借助模型的“智能体”,结合历史行情总结市场规律,生成投资策略建议的观点报告。 目录 摘要1 前言:大模型投研领域的效率革命4 知识库:投研案头文字工作的优化利器4 便捷构建专属知识库,重塑投研数据基石4 大模型应用:海量信息归纳6 大模型应用:深度信息挖掘9 大模型应用:研究逻辑提取14 总结20 免责声明22 图表 图1:个人知识库建立示例单位:无5 图2:知识库二维码单位:无5 图3IMACOPILOT模型归纳时的思考过程单位:无6 图4IMACOPILOT模型对铁矿石所有研报信息的归纳总结单位:无8 图5:IMACOPILOT模型信息提取示例单位:无10 图6:IMACOPILOT模型信息挖掘示例单位:无12 图7案例二(混元模型)单位:无13 图8:案例二(DEEPSEEKR1模型)单位:无14 图9:模型思考过程单位:无15 图10:模型对纯碱市场的投资策略建议单位:无16 图11:IMACOPILOT模型图表分析窗口单位:无18 图12:图示例单位:无18 图13:IMACOPILOT模型基于图表分析的策略建议单位:无19 前言:大模型投研领域的效率革命 在这个信息爆炸的时代,知识不再只是界限,而是连接的桥梁。随着AI的世,信息的智能使用成为了当今社会的新特征。利用AI,革新工作模式必然会给投研人员带来更强的竞争力。 在传统投研模式下,研究人员宛如在信息迷宫中摸索的行者,处理大量复杂的文字资料、跟踪瞬息万变的市场数据、及报告撰写,这些任务不仅容易效率低下,还极大地限制了投研工作的深度与广度。可见传统的研究模式在效率和精准度上逐渐难以满足实际需求。因此,大语言模型的横空世,恰似一道划破黑夜的曙光,以其自动化和智能化的独特优势,给投研工作注入全新的活力与效率。 本报告聚焦于大模型在期货投研中的应用,深入探讨其在优化案头文字工作、助力信息提取挖掘、深度研究与报告生成、实现持仓数据跟踪以及期货价格走势观点跟踪等多方面的作用。通过实际案例分析和验证,全面展示大模型在期货各投研环节的优势与潜力,推动投研领域在人工智能技术助力下不断创新发展。 知识库:投研案头文字工作的优化利器 众所周知,研究员都需要有自己的知识库(资料库),作为投研工作的信息源和研究依据。以往构建一个行之有效的知识库难度较大,是一项颇为复杂且对编程能力要求颇高的工作。研究人员不仅需要将大量文本数据嵌入模型,还需整合大模型API以便后续调用,整个过程复杂且耗时。如今,像imacopilot这样的智能平台带来了全新的方案:它提供了简便的个人知识库创建功能,极大地简化了知识库的搭建流程。本文将以imacopilot为例展开大语言模型于投研领域的应用。 便捷构建专属知识库,重塑投研数据基石 搭建专属知识库,研究人员只需在Imacopilot的“个人知识库”平台上上传本地文件,或通过对话框联网搜索并添加网站,就能快速搭建专属的信息库。如下图所示,在Imacopilot平台上,我们上传了431个黑色建材组期货商品的日报和周报。两分钟内即可上传完成。上传结束后,成功创建了“黑色建材组研报”的知识库。 随后投研人员可基于知识库利用大模型进行提问。模型强大的信息处理能力和问答环境,助力研究者高效查询复杂的数据集,不仅降低了技术门槛,还保证了数据的可靠性和可追溯性,为后续研究分析奠定了坚实基础。 图1:个人知识库建立示例单位:无 图2:知识库二维码单位:无 数据来源:Imacopilot华泰期货研究院 大模型应用:海量信息归纳 上述,我们见证了搭建“黑色建材组”专属知识库的简单快捷。该知识库的资料涵盖了钢铁、焦煤、锰矿与硅锰等多个关键期货市场领域。其中的研报详细呈现了各市场的历史变迁、当下的供需格局、价格波动的驱动因素,同时还包含了策略建议与风险预警等丰富信息。该知识库总共包含了431个黑色建材组商品期货的研报,覆盖了2024 年全年至2025年年初的信息。将近一年多的研报数量,信息海洋内容繁杂又庞大,倘若运用传统的人工处理模式梳理,无疑是一项耗时又艰巨的任务。 在Imacopilot平台上,研报归纳总结的流程得以显著简化。例如,根据知识库,我们要求模型梳理2024年全年关于铁矿石的所有相关信息,并把指令发送给模型。随后可以看到下图模型的思考过程。 图3Imacopilot模型归纳时的思考过程单位:无 数据来源:Imacopilot华泰期货研究院 从思考过程可以看,模型首先快速地从431个报告中筛选61篇与铁矿石相关的报告。接着,模型对筛选的报告进行逐篇研读,并重点聚焦于供应、需求、库存、价格走势以及策略建议等核心内容。 更为关键的是,模型并非简单地罗列信息,从归纳结果可以看,它还特别注重了不同时间节点的趋势变化。例如,年初如何上行,年末又为何回落。也就是说模型对不同时间的数据进行了对比,还尝试挖掘数据背后的逻辑关系,展现了其高度智能性。这种对市场趋势的把握,是投研人员制定合理投资策略的重要依据。 下图为模型基于知识库内容对2024年所有铁矿石研报的归纳总结。此归纳把信息按照供需、库存、价格、市场逻辑、投资策略的类别进行分类,每个区分下又分为多维度的小类,最后还对全年信息进行了总结。这种层次分明的架构恰似为投研人员搭建起一座井然有序的信息大厦,能让其快速定位所需内容,犹如一个睿智的信息检索系 统。 相比于多篇研报中拼凑信息,大模型担当了“救星”般的角色。若不通过大模型的帮助,我们无法如此快速的从341篇报告中,一次性整理所有关于铁矿石的信息。 图4Imacopilot模型对铁矿石所有研报信息的归纳总结单位:无 数据来源:Imacopilot华泰期货研究院 借此,投研人员可善用知识库“一键总结”的功能,将更多精力投入到市场趋势的深度分析、投资策略优化等更具价值的工作中。 大模型应用:深度信息挖掘 大模型凭借快速且精准的文本处理实力,能够从繁杂的大量文本中抽丝剥茧,提炼关键信息。重要的是,模型的问答环境恰似为投研人员提供了量身打造的专属信息助手,可依据其具体需求,迅速且高效地输极具针对性的信息内容。 应用一: 最常见的应用,是对原文信息的提取。例如,我们向模型下达指令:基于知识库,要 求了解最近双焦的价格。下图为模型的提取结果。可以看到模型将双焦现货和期货的具体价格从431个文档中定位并提,甚至还提供了库存、基差状态和核心矛盾等附加信息,最后还对短期状况加以总结。借此,投研人员可对双焦价格近况一目了然。 图5:Imacopilot模型信息提取示例单位:无 数据来源:Imacopilot华泰期货研究院 应用二: 应用二则是信息挖掘。我们发现模型除了提取已有信息,还能够进一步挖掘潜在的信息内容。 案例一:例如,我们可以要求模型基于知识库里最新两个月钢材的市场情绪信息,来预测下一个月的市场情绪。下图为模型的推算结果。我们发现模型首先根据知识库中的研报内容对近两个月(1月至2月初)的市场情绪进行了梳理。模型从供需、成本、政策等综合角度对市场情绪进行了评估。且模型将市场情绪的变化趋势,清晰地呈 现:从悲观转移为谨慎乐观。逻辑清晰且原因充分。随后,模型根据已发生的市场状况作为依据,对未来进行了预测。它结合了已有政策、未来月份的季节性特征等因素,对后续市场情绪做了智能性的判断:情绪表现从谨慎到回暖。模型在最后甚至还提了投研人员值得关注的主力合约,挖掘了潜在的投资机会。 图6:Imacopilot模型信息挖掘示例单位:无 数据来源:Imacopilot华泰期货研究院 案例二:我们还可以要求模型利用知识库中24年所有的日报周报,挖掘某些市场规 律。这些规律有很大的概率会反应到下一年中。例如,我们要求模型分析:基于24年,钢材市场的需求有什么季节性的特征。下图为分别使用混元和DeepSeekR1模型的分析结果。 图7案例二(混元模型)单位:无 数据来源:Imacopilot华泰期货研究院 图8:案例二(DeepSeekR1模型)单位:无 数据来源:Imacopilot华泰期货研究院 我们可以看到,模型找到了131个能够用于挖掘规律信息的报告,并总结了钢材 市场需求端明显的季节性特征。这些24年的季节性特征,很大概率映射到下一年中。同理,我们可以利用ImaCopilot语言模型,去挖掘和研究更多的市场细节与规律。这无疑为投研带来了新型利器,为信息整理,市场预期带来了创新空间。 大模型应用:研究逻辑提取 上述我们看到大模型对未来预测的赋能,在实际应用中,大模型同样能为投研人员的深度研究提供有力支撑。以期货研究为例,目前市面上的报告常常遵循这样的结构:开篇阐述商品基本面现状,接着对当下市场态势及市场情绪展开评估,最后给相应策略建议。鉴于大模型具备的“智能体”特性,我们对其进行检验,当输入同样的市场信息,大模型是否能给与研报一致的市场评估及投资建议。 应用一: 投研人员的研究核心往往是找到合理的投资策略。此处我们检验,若给模型提供当下市场行情的文字信息和数据,基于对知识库里历史研报的分析,模型能否对当下市场行情带来合理的投资策略。 我们将2025年2月9号这周关于纯碱市场的供需、库存、产量等基本面的文字信息数 据输入给模型,下达指令,要求模型针对2月9号这周的基本面信息提供具体的投资 策略。最后将模型提供的策略与2月9号纯碱市场的周报里的策略进行比对。 下图为模型的思考过程,模型找到知识库里的80篇研报作为资料参考。 图9:模型思考过程单位:无 数据来源:Imacopilot华泰期货研究院 我们看到,模型首先分析用户提供的信息,总结当前纯碱“现货市场疲软、供应稳定、需求下降、库存增加”等市场现状。然后模型开始回顾知识库的历史信息,寻找可 用于参考的资料,试图挖掘旧市场可用于映射于新市场的规律。模型发现,“24年报告多次提到,当纯碱供应增加、需求疲软、库存累计时,价格通常承压下行。”结合历史情况,模型对当前(25年)市场状况展开了分析。 下图为模型输的策略建议。 图10:模型对纯碱市场的投资策略建议单位:无 数据来源:Imacopilot华泰期货研究院 本案例,模型对比历史同期信息,分析市场现状:例如“库存环比增加,超去年同期水平,显示市场消化能力不足”。另