通用大语言模型产品难以生成高质量个性化定期报告 伴随大模型能力提升,大模型的多模态数据整合与结构化处理能力,显著提升了金融资讯服务中研究报告的撰写速度和数据处理效率,但是由于无法获取结构化金融数据、全网搜索新闻搜索范围难以精确锁定、定制化图表生成困难等问题,通用大语言模型产品难以生成个性化高质量投研报告,需要我们结合大语言模型进行更复杂的自动化生成投研报告的方案设计。 自动化写投研定期报告的整体框架和步骤 为了实现个性化报告自动化撰写的任务,我们设计了一套自动化实现流程,以高质量数据、高质量新闻、高质量观点为基础,并在提示词中按照个性化需求设定文本的撰写逻辑和格式,结合大语言模型的逻辑推理和文本分析能力,结合python中的word和PPT排版模块,可以输出相对可靠并且信息来源可控的个性化定期投研报告。我们在数据输入格式、提示词工程等方面均进行深入研究,确保生成更高质量的报告。按照我们设定的自动生成报告的流程,该方案适合内容结构相对固定的报告。 使用DeepSeek进行文本写作的案例展示 按照文本类型,我们分别列举了数据点评、新闻热点点评等案例,展示了大模型生成文本的效果。在实现对格式化数据进行客观描述及点评时,为了确保撰写的报告内容准确,我们在数据处理、提示词设计等方面进行了探究,确保大模型能够准确读取数据、并且能够按照我们的个性化要求输出结果。而对于新闻等文本,我们通过RAG(检索增强)的方式进行信息提取,让大模型从海量新闻中获取相关新闻,再进一步加工成报告需要的文本格式。 在办公自动化领域,文档的处理和排版往往需要耗费大量时间和精力。Python代码提供了一个高效的自动化解决方案,能够自动完成WordPPT文档的生成和排版工作,支持文本段落的样式设置、表格插入文档、图表导出到WordPPT文档中。如果有公司内部规定的模板,也可以直接基于公司模板生成内容。这种自动化方案极大地提高了办公效率,特别适用于需要定期生成制式报告、处理大量文档或进行数据可视化展示的场景。通过编程的方式确保了文档的一致性和专业性,使得文档处理工作从繁琐的手动操作转变为简单的程序执行。我们分别展示了Word版本报告及PPT版本报告的案例。 风险提示 大模型生成的内容具有一定的随机性,相同的提示词可能会输出不同的内容;大模型生成点评的效果依赖于输入的素材的内容和质量,如果未提供高质量的输入素材,撰写的内容可能出现质量参差不齐的情况;大模型生成点评的效果也依赖于提示词的设计,如果使用了不同的提示词,生成的点评内容会不相同;大模型掌握的金融专业知识有限,可能出现点评逻辑错误的风险;大模型生成的个性化投研报告仅供参考;大模型生成文本仅作为辅助工具使用,不能代替审核机制。 内容目录 一、通用大语言模型产品难以生成高质量个性化定期报告4 11大模型能力提升,智能投研产品不断涌现4 12通用大模型平台难以生成高质量个性化定期报告4 二、自动化撰写个性化投研定期报告的整体框架和步骤6 21大语言模型选择6 21自动化生成报告的整体框架7 22信息来源拆解7 23适用场景分析8 三、使用DeepSeek进行文本写作的案例展示8 31数据点评类文本8 32新闻热点点评类文本9 33观点类文本11 34其他文本生成12 四、最终效果展示:python自动完成office排版12 五、总结与展望14 六、风险提示15 图表目录 图表1:DeepSeek生成市场宏观报告5 图表2:WindAlice的资金流向短文生成6 图表3:DeepSeek在大模型领域的卓越领导者地位6 图表4:DeepSeekR1在幻觉测评中表现优异6 图表5:个性化定期报告自动撰写流程7 图表6:自动投研报告信息来源分析8 图表7:市场点评文本撰写案例8 图表8:基金业绩周度点评示例9 图表9:定期报告中新闻热点点评撰写流程10 图表10:新闻热点点评类文本生成示例10 图表11:从研报中获取观点文本11 图表12:黄金市场观点整理示例12 图表13:Python自动排版生成的word周报文档示例13 图表14:Python自动排版生成的word周报文档示例13 图表15:Python自动排版生成的PPT周报文档示例14 一、通用大语言模型产品难以生成高质量个性化定期报告 11大模型能力提升,智能投研产品不断涌现 伴随大模型能力提升,其功能逐渐从从单纯参数扩张转向深度推理、多模态融合与行业定制化,同时国产化进程和评测治理体系的完善为其可持续发展奠定了基础。大模型的多模态数据整合与结构化处理能力,显著提升了金融资讯服务中研究报告的撰写速度和数据处理效率。例如,智能投研助手可实时抓取全球财经资讯、企业财报、舆情数据等多源异构信息,并自动完成数据清洗、关联分析和趋势预测,将传统人工整理信息的耗时显著缩短,通过自然语言交互快速提取关键数据点,帮助研究员完成从“信息检索”到“结论生成”的范式跃迁。 而智能投研产品方面,以东方财富的妙想投研助理为例,其依托大模型构建的动态知识引擎,实现市场指标秒级生成,并通过“一稿多版”按要求输出研究报告,自动抽取监管文件、研报、会议纪要等非结构化数据,构建可交互的行业知识图谱。WindAlice、AlphaEngine等多个平台也有类似的产品。但这类产品撰写的报告效果是否真的符合要求还有待商榷。 12通用大模型平台难以生成高质量个性化定期报告1)数据源质量与覆盖度的局限性 通用大模型通常基于全网公开数据训练,多数的模型产品也能实现联网搜索抓取最新信息。但部分通用模型产品无法限定资讯来源,可能会包括论坛、社交媒体等低可信度的来源,研报、公告等专业文本又难以直接接入,这导致大部分通用大模型产品很难满足金融领域报告撰写的可信度要求。 此外,通用大模型也对金融专有名词的理解存在偏差,譬如“中信一级行业分类”等概念,大模型很难识别出一级行业包含具体哪些种类,进而可能在总结时出现错误;对新闻类型 (如政策解读、市场分析、突发事件)的识别能力也较弱,网页检索时可能会错误抓取与主题无关的新闻或企业动态,影响其最终总结的结论。 2)全网搜索新闻搜索范围难以精确锁定 通用模型在调用搜索引擎时,难以精确限定新闻的时间范围。例如下图中,我们要求“分析2025年4月25日宏观经济数据”,模型虽然能按要求搜索4月25日的信息,但误将午盘点评当作全天收盘点评,导致市场描述出错。 大模型还可能会对时间指令产生误解。若我们只用“本月”、“本年”等词表示时间,模型可能检索出以往的过时信息作为来源,只因为文本中有同样的时间指代词。 图表1:DeepSeek生成市场宏观报告 来源:DeepSeek网页,国金证券研究所 3)结构化数据交互任务难以实现 大模型完全基于语义推理,缺乏对结构化数据的理解与计算能力,在我们要求大模型在原始数据上计算差值、涨跌幅等指标时就可能得到错误回答;而数据又是金融报告中的重要组成部分。同时,在生成图文结合的报告、或结合图表与正文进行分析时,也可能出现单位误读(如将“亿元”错判为“百万”)、表格跨页关联断裂等问题。因此,与结构化数据的交互也是任何金融大模型产品需要突破的一点,也是现有大模型产品需要补足的一点。 4)定制化图表生成困难 通用大模型产品无法直接生成图表,而部分金融领域大模型产品(如WindAlice)即使能够生成图表,但在图表生成方面往往遵循预设的模板和规则,也难以满足用户多样化的个性化需求。例如,用户可能需要创建具有特定数据可视化效果的图表,如多层次的饼图、动态交互的折线图或是融合多种数据维度的复合图表等,但金融领域大模型产品可能无法提供足够的灵活性来调整图表的样式、颜色、数据轴等细节元素。另外,在专业领域报告中,如金融投资报告中的资金流向热力图,金融领域大模型产品可能缺乏相应的生成能力,导致用户在撰写报告时无法有效地利用图表来直观呈现关键数据和分析结果,进而影响报告的专业性和说服力。 图表2:WindAlice的资金流向短文生成 来源:,Wind,国金证券研究所 二、自动化撰写个性化投研定期报告的整体框架和步骤 21大语言模型选择 为了完成自动化撰写报告的任务,我们选择了由杭州深度求索人工智能基础技术研究有限公司开发的DeepSeek模型作为工具。DeepSeek具有推理能力强、模型价格低等优势。 而为了实现自动化的效果,我们使用了通过python调用DeepSeek的API接口的形式进行模型使用。调用DeepSeek的API接口可以通过DeepSeek官网API开放平台查询调用函数模板,申请ApiKey进行调用,也可以通过火山引擎、硅基流动等平台进行使用。 我们可以根据需要完成的文本内容的不同,选择DeepSeekV3DeepSeekR1模型。 截至2025年3月,按照SuperCLUE(中文通用大模型综合性测评基准)的测评结果,由深度求索公司开发的DeepSeek已是全球大语言模型领域中的卓越领导者,并且在SuperCLUE中文事实性幻觉测评排行榜(4月14日)中,DeepSeekR1获得最高得分,事实性幻觉能力上最强。 图表3:DeepSeek在大模型领域的卓越领导者地位图表4:DeepSeekR1在幻觉测评中表现优异 来源:SuperCLUE,国金证券研究所来源:SuperCLUE,国金证券研究所 21自动化生成报告的整体框架 我们设计了以下流程实现个性化报告自动化撰写的任务。 图表5:个性化定期报告自动撰写流程 来源:国金证券研究所 我们将整个处理流程梳理为以下四个步骤。 1)任务拆解。我们将定期报告中可能涉及的任务总结为5类,包括:市场数据点评、热点新闻点评、观点输出、固定格式输出、图表输出。绝大多数定期报告中的章节或段落撰 写都可以归类为以上任务之一。因此,我们首先要将定期报告拆分成多个组成部分,并匹配每个组成部分所属的任务类型,确定需求便于使用标准化流程生成内容。 2)提示词设计。我们根据不同的任务,结合报告的个性化撰写需求,按照一定的分析框架,设计不同的提示词,以实现更加准确更加个性化的分析结果。 3)内容分类生成。我们针对不同任务类型设计了相应的处理流程,譬如处理市场数据点评类任务时,我们首先根据需求提取对应的数据表格,并将数据表格转为文本输入大模型,设计提示词让大模型生成点评;新闻点评、观点输出这类任务则需要基于新闻、研报等语料构建知识库进行RAG,让大模型根据检索结果进行点评、整理。 虽然不同类型的任务处理流程不同,但整体上都会用到相同的“工具”,包括结构化数据提取、文本资料准备、知识库构建与提示词工程。 4)自动排版。我们实现了自动化输出Word、PPT、Excel等各类型文件的解决方案,并可套用指定的报告模板,包括图表配色、文字与段落格式等都能进行定制化生成,实现绘图、报告撰写与排版的全自动化流程。 22信息来源拆解 我们已从流程的角度介绍了使用DeepSeek生成个性化定期报告方案的整体框架,而从内容视角上,我们从信息来源角度拆解了自动生成报告的方案,如下图所示。 从内容来源来看,我们使用专业可靠的数据(Wind、iFinD等数据)、可靠的财经新闻(财联社新闻等)、可靠的观点(研报观点),并在提示词中按照个性化需求设定文本的撰写逻辑和格式,结合大语言模型的逻辑推理和文本分析能力,结合RAG技术,可以获得相对可靠并且信息来源可控的个性化定期投研报告。 图表6:自动投研报告信息来源分析 来源:国金证券研究所 23适用场景分析 按照我们设定的自动生成报告的流程,该方案适合内容结构相对固定的制式报告,例如投研定期报告。 对于每一个类型的报告,我们需要单独设计提示词、单独准备数据、个性化图表绘制,而且文字图表排版顺序相对固定。因此该流程适用于内容结构相对固定的报告,无需每次更改提示词,不需要修改数据,不需要调整排版格式。 三、使用DeepSeek进行文本写作的案例展示 31数据点评类文本 周报、月报等定期报告