维持增持评级,维持目标价72.39元。维持公司2023-2024(新增2025)年EPS预测分别为1.21/1.54/2.06元,维持目标价为72.39元。 恒生电子基于大模型推出智能投研产品。智能投研包括三个产品,第一个是CHAT,通过CHAT可以问到各种各样的数据。第二个产品是ChatMiner,是一个指定文档的挖掘器。第三个产品WarrenQ,是一个一站式的数智化投研端。 恒生电子推出金融智能助手光子。光子在产品侧定位为金融智能助手,位于金融行业大模型LightGPT之上。光子包含了投顾、运营、合规、交易等场景下的应用。未来光子有望成为金融行业B端服务的入口。 推出金融行业大模型LightGPT,9月30号开放试用。恒生专门为金融行业打造的大模型的能力,已经提升到可用的程度,9月30号会开放试用接口。到年底会把推理性能进一步优化,把逻辑能力也进一步的升级,使得它和光子配套能够统一构成一个AI直通应用的体系。 风险提示:合同落地不及预期风险,竞争加剧风险 1.恒生电子基于大模型推出新产品 1.1.推出新一代智能投研产品WarrenQ 恒生电子基于大模型推出智能投研产品,包含了三个子产品。 第一个叫CHAT,通过CHAT可以问到各种各样的数据。它就像是一个金融资讯数据的情报员,使用方可以问F9、问行情、问研报、公告资讯、问观点提取等等,它底层的关键性技术用到了搜索加上大模型,通过这样的技术来去调用整个恒生聚源的金融资讯数据库,从而能够实现语控万数。 第二款产品叫ChatMiner,是一个指定文档的挖掘器。比如用户自己有一篇文档,上传以后可以针对这一篇文档去提问,ChatMiner就可以根据这篇文章里面提到的内容去对问题予以回答。底层的关键技术是向量数据库加上大模型。 第三个产品WarrenQ,是一个一站式的数智化投研端。WarrenQ里面有非常多的场景、功能,大模型的产品ChatMiner也在里面,再到阅读器、云笔记、原文引文和溯源、演算板、其中的估值模型,以及在线分享脑图等等都已经在投研场景上去实现全面的打通,所以它是一个all in one的一站式投研平台。 举一个例子,假设使用方是一个研究员,想针对一个主题去进行信息搜集和检索,可以先问CHAT最近跟这个大模型相关的有哪一些厂商的新动态,可能回复一大段新闻事件集锦。假设对中间的一条比较感兴趣,就可以去追溯原文,去查看新闻或是研报里面详细的内容。如果看到其中的干货想把它留存下来,在下一次写报告的时候,跟领导汇报、跟同事分享的时候,可以一键拖拽到笔记里,中间的数据可以在演算板里对数据进行制图制表。对于涉及到上市公司估值的内容,产品内置了在线估值模型,可以方便对其中关键假设指标进行动态调整。最后把所有已经被研究小组内化的信息,在一个在线协作的脑图上汇总,进行组内的分享和汇报。 恒生电子制定了大模型时代的数字化产品框架。 最底层是数据层。它跟传统数据层有一定区别,比如恒生帮金融机构去建一个数智化的平台,底层可能很多是一些公开数据再加上机构自有知识库。现在金融机构的自有知识库会加上金融的基础语料、微调场景的语料,再加上公开的大模型语料,一起构成大模型时代的数字化产品底层。 第二层是模型层。恒生电子在做产品的过程中,试用了很多种,包括LLaMa、Bloom、清华等等大模型。在这个基础开源模型上,将准备好的数据和语料结合在一起,然后可以做金融数据集的训练,也可以做有监督微调,调完了以后就会得到一个金融版大模型。有了这个大模型以后,再加工成产品。 第三层是插件层。与通用版的大模型不同,插件层在金融垂直领域非常重要。因为绝大多数的金融场景,不是仅仅输出一篇文字就够了,而是在绝大多数情况下要引用数据,并且对数据的及时性要求很高。比如当天的市场点评里面的数据不能是三个月前GPT训练所用的数据,一定要是实时的数据。 图1:恒生电子制定大模型时代数字化产品框架 插件层可以解决数据即时性的问题。第一列是NL2SQL。比如用CHAT去查恒生电子的行情,它在用这个大模型的接口返回一段话的同时,调了NL2SQL接口,到数据源库里面去把恒生电子的行情的时间序列给查出来,变成一个K线图返回,用户就可以看到最及时、最更新的行情;第二个搜索接口也很重要。第一个NL2SQL更多是解决的时间序列格式的数据即时查询性的问题,搜索接口解决的是文本类的数据,因为第一个接口没办法获取最新消息、事件、新闻研报公告。 ChatGPT底层的技术就是向量数据库,它涉及到私域的大量文档怎样去进行向量化、做相似性的查询和存储。这个插件层很重要,它是金融领域要做垂域产品非常重要的支撑性力量。结合恒生电子训练出来的金融大模型一起,向上可以去做各种各样的应用,包括智能投研、智能投顾、财富管理等服务。 1.2.推出金融智能助手:光子 光子在产品侧定位为金融智能助手,位于金融行业大模型LightGPT之上。光子包含了投顾、运营、合规、交易等场景下的应用。 举例说明投顾场景下的应用。首先投顾在指令窗口查询客户标签,光子会根据客户历史会话记录及客户行为数据,自动生成实时的客户标签,帮助投顾精准洞察客户需求。在投顾和客户会话过程中,比如客户咨询恒生电子股票行情,光子可以立即分析出客户的意图,是想了解恒生电子行情走势,咨询投资建议。根据客户意图,光子自动检索出相关的股票行情及研报信息,自动生成简洁明了的财报解读及投资观点。当客户抱怨持仓产品亏损,光子实时监测到客户的情绪变化,打上情绪标签,提醒投顾注意,并自动生成安抚话术和行动建议,投顾可以按照光子的提示一键发送给客户,安抚客户情绪,并引导客户进行下一步操作。 光子可以用来进行投顾报告的创作。在投顾报告的创作中,像生成质检、定制、创意和营销这些操作,都是相对常规的服务。由于金融行业投顾报告的专业性,特别是对数字的敏感性,内容的核对将是报告被广泛认可的最关键因素。而在光子的连接下,可以通过引用的外部资料和现有系统中的数据和数据分析结果来进行验证。 图2:恒生电子推出金融智能助手——光子 1.3.构建金融行业大模型LightGPT 现有的大模型存在不足,无法满足金融行业特定领域的需求。 第一个方面是模型本身的质量。在金融行业中,对回答的内容和服务质量有着非常高的要求。金融领域有严格要求,因为细微的错误都可能被放大,产生严重后果。所以在投研投顾、合规运营等场景中,都有着很严肃的要求,这些要求无法通过通用大模型和仅仅用公开数据的训练就能达到。 第二个是监管要求。作为一个强监管的行业,金融行业在监管要求中对数据流动和身份有明确的限制。关于身份方面,客户有一些是持牌经营,需要对身份进行严格验证。因此,在监管方面,现有的通用大模型可能达不到金融行业的要求。 第三个是大模型本身。数据流动受到限制,不能仅凭通用大模型给出似是而非的结论。有些情况下,需要用自己的数据进行校正甚至只使用大模型的结果做一个引子,作为参考,最后真正使用的还是自己的数据。 图3:通用大模型无法满足金融行业应用需求 这就导致许多机构在使用大模型时明确要求私有部署,至少在行业内要求可信的范围内进行部署。这种部署方式带来一个问题,如果模型的参数体量不够大,可能会导致质量较差;而如果参数规模很大,那么部署所需的推理算力也会增加,对算力的成本要求也比较高。 如何在符合严格监管要求的前提下降低成本,同时满足行业本身对质量的高要求,这几个问题都是现有通用大模型难以解决的。基于这些问题,恒生提供的解决方案并不是指在当前的百模大战或千模大战中构建101个或1001个模型,而是针对这些痛点,为行业提供一种有针对性、能够克服这些问题的大模型。 要想建设一个好的金融大模型,取决于以下四个因素。 第一个因素是数据。由于金融行业对专业化的要求非常高,因此数据必须反映行业的专业化,这是与通用大模型之间拉开差距的地方。 恒生电子的数据来源包括聚源过去20年积累的数据。这些数据包括恒生从金融的教材、百科、政府报告、法律条规、法规条例等等中得到的,还包括一些经过精细调整的数据集。 第二个要素是基础大模型,它需要有专业的提升空间。基础大模型的选择也是非常要值得注意的,要考虑它是否是一个良好的起点,能够在面向专业领域时提供更好的提升空间。恒生电子注意到Bloomberg在训练金融大模型时采用了什么样的底座,包括最近的Falcon大模型,同时也在寻求与国内大模型提供者的合作。 在算法方面,要去学习和采纳先进的算法,包括参数冻结、领域相关的指令、精调技术,以及与强化学习相关的专门算法。恒生电子团队拥有一定的人才储备,包括国家级的博士后工作站和十多位博士,在外部也有一些合作资源。尤其在学术界,与复旦大学、浙江大学、中国科学院和中国科技大学都有合作。 最后,还有算力的因素。恒生电子一方面与互联网厂商、云厂商在算力方面有一些合作,另一方面也投入了一些自有的算力来支持这项工作。涉及到的领域包括面向投研、投顾、客服、运营、风控等各种场景。 图4:金融大模型成功需要具备四个因素 恒生电子的大模型起名LightGPT,其中Light是包括恒生的技术底座、平台和新技术的统一品牌,它具有光和清亮的含义。而GPT就是light加GPT,代表恒生电子技术堆栈中面向AI的大语言模型。 要使专业模型更专业、更了解金融领域,有几个关键因素是非常必要的。 首先是语料的积累。实际上任何一个有了底座的大模型,在这上面继续做预训练的时候,都离不开几种类型的数据。第一种类型叫做语种强化数据。可能这个模型的通用能力比较强,但在中文能力方面不够。因此,需要使用中文的强化语料把它的短板补上。此外,它可能在通用领域表现较强,但是在金融这个专门的领域里不够强,这时,需要使用领域强化数据把这一部分补上。 另一方面,它可能具有通用能力,但与一些应用程序对接时,与这些应用程序相关的代码接口、调用元数据等方面还不够强。这个时候,可以在这个地方去形成应用强化数据。 语种强化数据也好,领域强化数据也好,应用强化数据也好,最后关键还是在他们的配比,只有合理的配比才能够在最后达到训练好的结果。如果是不合理的配比,即使有数据,但是最佳的效用还是没有发挥出来。 其次是要让大模型的训练更高效稳定。首先,要增强基座的中文特性,例如如何扩充金融专业词汇,并提高中文编码效率。其次,采用参数冻结等方式,步步为营,把底座做稳,再往前走。需要使用金融领域的语料进行继续预训练,经过数据清洗后,筛选出质量较高的超过2000亿TOKEN的领域数据进行训练。 接下来是指令微调。针对金融领域的特定80个任务,经过恒生电子的精心定义,需要对其进行全参数的精调,以获得更好的结果。 此外,还采用了强化学习,以提升安全合规性,让最后的效果可控可用。在这方面,恒生采用了一些新的算法。 从部署方式上来看,支持私有化云部署,并且可以灵活地对API进行调用。由于许多金融机构期望私有部署,特别是在仅进行推理时,这个推理的环境希望它做到轻量化。目前恒生的模型可以只要一机两卡就可以达到经过推理端不断调优达到的结果,这个结果也不是那么容易的。 关于部署方式,可以更清楚地了解在某个领域部署相应内容。恒生有一个基础形态的大模型,可以在行业或公有云上使用。根据机构的特殊需求,可以对其进行进一步的精调定制。结合机构自身的私有域任务的相关数据,恒生电子对模型进行精调,形成推理模型。在这个推理模型下,还需要配套地处理文本、知识库和知识图谱等数据资源。整个部署都是私有的,即从推理开始,都是在私有运行环境,但私有运行环境里的这些东西都不需要出公司的安全域,所以它在里边是安全的。 有了以上这些能力,在对接上,光子就可以打通到应用,可以满足机构的个性化的需求。也就是说可以对机构进行推理的输出,进行精调的输出,然后再通过光子对接到应用。 恒生电子的大模型到9月30号就可以开放试用,年底会进一步优化。 恒生专门为金融行业打造的大模型的能力,已经提升到可用的程度,9月30号会开放试用接口。到年底会把推理性能进一步