您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国泰君安证券]:2024年金融科技行业年度策略:AIGC东风起,助力金融科技高质量发展 - 发现报告

2024年金融科技行业年度策略:AIGC东风起,助力金融科技高质量发展

金融2023-11-22孙坤、李艺轩、刘欣琦国泰君安证券王***
AI智能总结
查看更多
2024年金融科技行业年度策略:AIGC东风起,助力金融科技高质量发展

0       请参阅附注免责声明1 请参阅附注免责声明2 请参阅附注免责声明3 AIGC(ArtificialIntelligenceGeneratedContent)即生成式人工智能,根据《生成式人工智能服务管理暂行办法》,生成式人工智能技术是指具有文本、图片、音频、视频等内容生成能力的模型及相关技术。 图1:AIGC是指具有文本、图片、音频、视频等内容生成能力的模型及相关技术 图片生成:由Midjourney生成的《太空歌剧院》 文本生成:和Chatgpt对话 请参阅附注免责声明4 视频生成:WonderStudio,一款AIGC视频生成软件音频生成:DeepMusic提供的智能编曲 表1:AIGC带来金融科技行业需求和供给的深刻变革 细分行业 需求变化 供给变化 金融信息服务 驱动客户寻求更精准全面的信息以及更深度的逻辑分析内容,预计客户对于智能投研和投顾产品的需求将有较大提升; 助力金融信息服务商提升自身产品研发能力,创设更多智能投研投顾产品 第三方支付 小微商户原本因为成本和时效的原因,广告营销的需求被抑制,随着AIGC的赋能,广告营销的需求预计将明显提升 智能风控(支付端)、智能客服、代码生成等方面均可 应用,降低成本提升效率 消费金融 无 通过智能风控(信贷端)、智能催收、智能营销、智能客服等多个环节提升效率 请参阅附注免责声明5 请参阅附注免责声明6 根据《金融信息服务管理规定》和《外国机构在中国境内提供金融信息服务管理规定》等规定,金融信息服务,是指向从事金融分析、金融交易、金融决策或者其他金融活动的用户提供可能影响金融市场的信息和/或者金融数据的服务。 图2:金融信息服务产业链 行业上游 行业中游 行业下游 行情 传输 数据 传输 金融软件与信息服务 提供商 数据清洗、加工、 分析 金融数 据终端 平台 各类数据信息的推送、 呈现 金融数据终端 用户 资讯 传输 财经资讯 资讯提供商 金融数据 数据提供商 证券交易行情 证券交易所 数据来源:国泰君安证券研究 请参阅附注免责声明7 智能投顾和投研产品的需求将大幅提升 我们预计AIGC技术浪潮将驱动客户寻求更精准全面的信息以及更深度的逻辑分析内容,未来客户对于智能投顾和投研产品和服务的需求将快速提升 图3:投资决策活动的核心在于信息的获取、逻辑的构建和对交易因素的把握 数据来源:国泰君安证券研究 请参阅附注免责声明8 表2:AIGC技术极大地提升了智能投研的工作范围和能力,助力投研人员极大提升工作效率和投研体验。 数据来源:国泰君安证券研究 请参阅附注免责声明9 表3:AIGC技术为智能投顾带来了更强大的数据处理和分析能力,提供了更加个性化和智能化的投资建议 能力提升领域 具体影响路径 数据来源:国泰君安证券研究 请参阅附注免责声明10 AIGC的快速发展能够同时赋能金融信息服务商的生产要素积累和生产效率提升,进而助力打造更强的研发能力,预计未来金融信息服务商能够创设更多智能投研和投顾产品。 图4:生成式AI将提升金融信息服务商的研发能力 生成式AI助力金融信息服务商进行产品研发 更充沛的生产要素更高的生产效率 生成 式AI 自动生成代码等,自动处理各类数据, 成为新生产要素 加快要素积累 赋能组织管理决策, 提高研发和经营效率 研发人员数据 数据来源:国泰君安证券研究 请参阅附注免责声明11 表4:垂直金融型大模型和通用大模型在不同表现指标上各有优劣 垂直金融行业大模型和通用大模型在算法训练和使用成本、更新迭代速度方面有不同表现。 + + 数据来源:国泰君安证券研究请参阅附注免责声明12 金融信息服务领域具有独特的数据、规则和市场特征。垂直金融型大模型通过深入学习金融领域的特定数据和知识,能够更好地理解 金融领域的语境和行业规则,进行复杂决策,而通用大模型在金融行业宽广有余,纵深不足,无法充分理解金融领域的复杂问题。 图5:通用大模型和垂直金融大模型在金融信息服务领域应用结果的差异 •可以处理冲突的知识进行复杂决策 • 垂直金融大模型 •因为立场是一贯的,无法针对特定 情景进行调整 • 通用大模型 数据来源:国泰君安证券研究 请参阅附注免责声明13 表5:金融信息服务商AIGC技术在财富管理机构落地的可能路径 除了在智能投研上的运用外,我们预计垂直金融行业大模型在智能投顾上的落地也大概率从机构起步。机构客户所关注的功能是特定且有限的,场景相对比较狭小,数据和训练结果相对可控。加之B端场景的使用者,即机构专业投顾人员,有足够的知识与经验对AIGC的生成内容作出判断,可以对缺乏准确性的内容进行人工把关和修改,监管难度和安全合规风险都相对较小。因此,AIGC有望面向B端财富管理机构落地先行,赋能机构或投顾等渠道方,进而间接服务C端客户。 路径一:将大模型的能力直接应用于机构的客户端APP,完全面向用户。路径二:在应用层下的API层提供类似于OpenAI模型的API调用服务,以适应不同场景并降低交易成本。路径三:本地化部署,针对细分金融领域开发小型模型,考虑到机构的本地化需求和成本控制,帮助解决内部问题。路径四:采用联合训练模式与财富管理机构合作,机构提供数据用于模型训练,金融信息服务商提供算法和计算资源,训练出包含客户专业知识的模型,以适配客户内部环境。 数据来源:国泰君安证券研究 请参阅附注免责声明14 伴随数据规模的增长和数据质量的提升,大模型的性能提高。2020年1月OpenAI在论文《ScalingLawsforNeuralLanguage 图6:随着数据规模指数增长,模型在测试集上验证的损失线性下降 Models》中提出了大型语言模型(LLM)的缩放定律,OpenAI指出,随着数据规模的指数增长,模型在测试集上验证的损失是线性下降的,即模型的性能是线性提升的。 请参阅附注免责声明15 在数据规模外,训练数据的质量也是模型训练与调优的关键因素。以GPT家族的进化史为例,从GPT-1到GPT-4,模型的整体架构相似,而训练数据的规模与质量有很大不同。GPT-1使用的训练数据是4.8GB未经过滤的数据,GPT-2使用了40GB经人类过滤的数据,GPT-3更是从45TB的原始数据中清洗出了570GB的高质量海量训练数据,ChatGPT/GPT-4也是使用了高质量人工标注数据与人类对齐。 图7:每一版本GPT进化的模型架构基本相似,而数据的规模与质量不断提高 数据来源: 请参阅附注免责声明16 随着算法增强与创新,AI大模型所需的算力就越少。2020年,麻省理工学院计算机科学与人工智能实验室(CSAIL)的科学家证明了改进 算法在提高计算硬件性能方面的重要性。对于大型计算问题,43%的算法系列的同比改进等于或大于备受推崇的摩尔定律带来的收益。 图8:每一版本GPT进化的模型架构相似,而数据的规模与质量不断提高 OpenAI2020年的一篇报告指出,2012年到2019年,神经网络架构从头开始训练到AlexNet级别性能所需的算力下降了44倍。结果表明,随着算法改进,算法效率提高,AI模型使用相同的计算能力可以完成更多任务, 带来更多收益。人工智能的算法效率可以定义为减少训练算法完成某项任务所需的算力,如果算法需要尽可能少的资源(即几乎不需要任何计算时间和内存)来解决特定问题,则该算法是高效的。算法越高效,软件要做的工作就越少,所需的算力越少。 数据来源: 请参阅附注免责声明17 目前算力重要性在垂直金融行业大模型有所降低。首先,垂直金融行业大模型的的算力需求要远低于通用大模型的算力需求。虽然自2022年8月起,美国政府限制英伟达向中国出口A100和H100芯片,但是国内公司仍然可以选择购买性能略逊的A800和H800芯片进行训练,或者购买华为昇腾芯片等国产替代品,再或者可以从阿里云等第三方租借算力资源。 图9:当前华为昇腾910B芯片的新能已经基本做到可对标英伟达A800 请参阅附注免责声明18 数据优势主要有两个构成因素:1)丰富的业务场景2)数据的治理能力,前者决定了初始语料的多寡,后者决定了多少语料可以 被提取成可供模型训练的高质量数据。 表6:做好垂直金融行业需要广泛的数据来源和积累 请参阅附注免责声明19 良好的数据治理能力可以最大化利用丰富业务场景积累的原始数据,更好积攒训练数据,提高大模型性能。 表7:将初始语料转换为可供训练的数据所需要的步骤流程 请参阅附注免责声明20 人才是人工智能产业的核心竞争力,算法的领先离不开优秀人才团队的贡献,需要庞大的队伍投入不断突破算法的极限,优秀的管理机制是吸引高端人才、建设优秀人才团队的关键。 图10:ChatGPT研发团队中博士学历员工占比高达37% 30% 33% 博士研究生37% 硕士研究生 本科/学士 0%10%20%30%40% 数据来源:智谱研究,国泰君安证券研究 请参阅附注免责声明21 根据麦肯锡在《全球资管行业数字化转型战略蓝图与实践》报告中预计,到2025年中国资管行业AUM有望达到196万亿人民币。在渗透率预计上,我们以金融信息服务业极为成熟的美国市场为参照,其2022年的付费渗透率为0.07% 图11:当前美国B端金融信息服务渗透率目前0.07%左右 假设在2025年中国付费渗透率提升到0.01%的水平,即为美国当前水平的七分之一,测算可得到2025年中国空间为196亿元人民币。 25.00 20.00 15.00 10.00 5.00 0.00 20122013201420152016201720182019202020212022 0.10% 0.09% 0.08% 0.07% 0.06% 0.05% 0.04% 0.03% 0.02% 0.01% 0.00% 美国B端金融信息服务总规模(IBISworld)十亿美元B端金融信息服务行业渗透率(右) 请参阅附注免责声明22 数据来源:ICI、IBISWORLD、国泰君安证券研究 根据《九方财富招股说明书》中弗若斯特沙利文的测算,2022年我国金融软件信息服务市场规模为82亿元,再根据2022年中国居民部门 0.0400% 0.0342% 0.0350% 0.0300% 0.0250% 0.0221% 0.0200% 0.0150% 0.0150% 0.0108% 0.0100% 0.0070% 0.0038% 0.0050%0.0022%0.0020% 0.0023% 0.0027% 0.0033%0.0034% 0.0000% 2017 2018 2019 2020 2021 2022 智能投顾渗透率:中国 智能投顾渗透率:美国 图13:中美C端金融信息服务(智能投顾)渗透率比较 金融资产规模为243万亿元,可得我国2022年C端金融信息服务渗透率为0.0034%;而美国同期的C端金融信息服务(智能投顾渗透率为)0.0342%,相差近十倍。麦肯锡在《金融业白皮书:2023年3月后疫情时代财富管理重启增长》预测到2025年中国居民金融资产规模有望达到315万亿人民币,假设在2025E我国渗透率提升至美国当前水平的20%,则2025E行业市场规模有望达215.21亿元。 图12:中国C端金融信息软件服务市场规模(亿元人民币) 90 80 70 60 82 74 54 50 40 30 20 10 0 41 32 34 20172018201920202021 2022 数据来源:弗若斯特沙利文,国泰君安证券研究 请参阅附注免责声明23 数据来源:Statista,麦肯锡财富数据库,美联储理事会,国泰君安证券研究 图14:同花顺与东方财富APP的MAU大幅领先于同类产品 4000.00 同花顺、东方财富、恒生电子较早深耕数据业务,在金融行业高质量训练数