AI智能总结
请参阅附注免责声明1 请参阅附注免责声明2 请参阅附注免责声明3 • • 表1:支付牌照相关政策图1:支付牌照数量 时间 政策 2015年8月 央行注销3张支付牌照,结束了第三方支付牌照“只发不撤”的历史。 2016年10月 央行对非银行支付机构实施风险专项整治工作 2021年10月 《中国人民银行关于加强支付受理终端及相关业务管理的通知》(259号文件) 2023年12月 《非银行支付机构监督管理条例》 300 250 200 150 100 101 197 250 269269267 247238237233 224 201 186 50 0 2011201220132014201520162017201820192020202120222023 请参阅附注免责声明4 25 23 20 19 15 13 10 9 9 5 4 3 2 1 0 2015年 2016年 2017年 2018年 2019年 2020年 2021年 2022年 2023年 图2:支付牌照注销数量增加 请参阅附注免责声明5 • 图3:各家支付公司平均收单净费率均出现提升 0.160% 0.150% 0.140% 0.130% 0.120% 0.110% 0.100% 20192020202120222023H1 拉卡拉新大陆新国都移卡乐刷 请参阅附注免责声明6 • 0.160% 0.139% 0.140% 0.124% 0.129% 0.120% 0.112% 0.100% 0.080% 0.060% 0.040% 0.020% 0.000% 拉卡拉 新大陆 新国都 移卡乐刷 图5:拉卡拉收单净费率处于较低水平 • 30000 25000 20000 拉卡拉 15000 新大陆 新国都 10000 移卡乐刷 5000 0 2020H12020H22021H12021H22022H12022H22023H1 图4:拉卡拉公司流水领先于同业(单位:亿元) 请参阅附注免责声明7 • 表2:收入增量测算(单位:亿元)表3:净利润增量测算(单位:亿元) 请参阅附注免责声明8 请参阅附注免责声明9 图6:金融信息服务产业链 行业上游 行业中游 行业下游 行情 传输 数据 传输 金融软件与信息服务 提供商 数据清洗、加工、 分析 金融数据终端 平台 各类数据信息的推送、 呈现 金融数 据终端 用户 资讯 传输 财经资讯 资讯提供商 金融数据 数据提供商 证券交易行情 证券交易所 数据来源:国泰君安证券研究 请参阅附注免责声明10 图7:投资决策活动的核心在于信息的获取、逻辑的构建和对交易因素的把握 数据来源:国泰君安证券研究 请参阅附注免责声明11 表4:垂直金融型大模型和通用大模型在不同表现指标上各有优劣 垂直金融行业大模型和通用大模型在算法训练和使用成本、更新迭代速度方面有不同表现。 + + 数据来源:国泰君安证券研究 请参阅附注免责声明12 • •Gemini1.5Pro 表5:垂直金融型大模型和通用大模型的典型代表 ChatGPT4.0 OpenAI ChatGPT1750BTBPBChatGPT LLaMa2 MetaAI LLaMa27B13B70B45TB AI AI Gemini1.5Pro Google DeepMind Gemini1.5Pro175B100tokens kimi Kimi20004-5TB200GPT-4Turbo20Claude312 3tokens 2605TB BloombergeGPT Bloomberge BloombergGPT5007000NLPBQL HithinkGPT HithinkGPT7B13B30B70B130B2token Benchmark 7B13B34B66B104B1.2 请参阅附注免责声明13 数据来源:国泰君安证券研究 请参阅附注免责声明14 请参阅附注免责声明15 表6:金融客户关心的问题可以分为信息获取和逻辑判断两类 功能 信息获取 逻辑判断 选基金 1)今年哪些基金净值增长最大?2)近7年最大回撤<10%的基金 1)最好的前十名AI概念基金 选股票 1)选出净利润增长90%的公司2)上海市值大于100亿的公司 1)推荐能上涨的十只股票2)从XX、XX、XX三只股票中选出最好的一个 诊股票 1)XX股票主力持仓成本 1)XX股票基本面分析2)XX股票k线形态分析 看大盘 2)复盘一下今天的涨跌停情况 1)今天的超短情绪氛围怎么样2)中长期大盘怎么走 挑板块 2)今天涨停家数最多的行业 1)今天热门的板块有哪些2)医疗板块未来有投资价值吗 看宏观 1)中国最新的CPI数据2)上海人均GDP 1)猪肉价格走势分析 读新闻 1)医疗反腐的最新消息是什么 1)公司回购对市场有什么影响2)贵州茅台最近有什么利好 学投资 1)什么是费用比率 1)股票被套了之后怎么解套2)怎么判断板块的持续性 表7:金融客户关心的信息获取方面问题的得分及测试情况分析 金融垂直大模型在信息的获取方面优势明显,主因公司深耕金融行业积累了海量的金融相关信息和数据。 产品 选基金 选股票 诊股票 看大盘 挑板块 看宏观 读新闻 学投资 总分 测试情况分析 kimi 6 10 5 8 8 20 10 10 77 对于一般数据的搜索能力较强,但对于主力持仓成本这种无法直接获得的数据无法得到,且其基于数据筛选出的个体数量较少 通义千问 6 15 8 3 3 13 3 10 61 具有一定的搜寻基本数据的能力,但是存在数据不全以及样本过少的问题 文心一言 6 7 5 10 8 20 10 8 74 在数据获取方面的表现优秀,对于一般数据的搜索能力比较优秀,但是搜寻出来的样本过少,且无法对筛选出的数据进行排序和综合分析 同花顺HithinkGPT 18 18 10 5 10 16 10 8 95 在数据获取方面的表现最优,数据全面且更新速度快,难以获得的数据也可以准确筛选出,基本可获得测试期间最新的数据内容 东方财富妙想 0 20 5 10 8 8 3 10 64 在数据获取方面的表现较优,基于数据筛选出的数量多且内容全面,尚不支持基金功能造成总分略低,预计后期会基于自身基金数据补充相关功能 注:根据不同产品对上述问题的回答进行评分,分数为0——10分。可以对问题进行回复的答案为5分以上,再根据回答内容的完整度细分;无法对问题进行回答,但是提供了解决思路的答复为3——5分;既没有对问题进行回答,也没有提供解决思路的答复为0。其中东方财富不支持基金功能,因此其“选基金”部分的得分为0;东方财富将“医疗反腐”设置为敏感词汇,因此查询不到相关信息。 请参阅附注免责声明16 数据来源:国泰君安证券研究 表8:金融客户关心的逻辑判断方面问题的得分及测试情况分析 逻辑判断方面,各个大模型各有千秋,金融大模型对客户问题的回答更为丰富和详细。 产品 选基金 选股票 诊股票 看大盘 挑板块 看宏观 读新闻 学投资 总分 测试情况分析 kimi 3 16 16 13 16 8 18 20 110 kimi的逻辑判断能力是通用大模型类中表现最好的,其在选股票和看大盘方面的能力远强于其他通用大模型类产品 通义千问 13 13 14 8 13 10 20 20 101 通义千问在选基金和看大盘方面比较短板,其他方面的能力表现出色 文心一言 3 11 14 15 18 10 18 20 109 文心一言在挑板块、看大盘方面的逻辑判断能力突出,但是其在选择股票和基金方面的逻辑判断能力存在不足 同花顺HithinkGPT 10 18 13 18 20 10 18 20 127 对于逻辑判断方面问题的分析,同花顺与东方财富妙想之间的差异不大,都会针对问题进行环绕式的全面回答,不仅提供AI分析以后的结果,还会提供详细的数据,便于询问者直观看到不同个体之间数据之间的差异大小 东方财富妙想 0 20 20 20 18 10 20 20 128 根据综合分数评价,东方财富在逻辑判断方面的表现最优。其针对逻辑判断问题的输出结果内容详细,很多结果包含了文字、数据以及图形三部分组成,既报告了AI的结论,也便于询问者根据数据的具体信息进行自己的主观判断 注:根据不同产品对上述问题的回答进行评分,分数为0——10分。可以对问题进行回复的答案为5分以上,再根据回答内容的完整度细分;无法对问题进行回答,但是提供了解决思路的答复为3——5分;既没有对问题进行回答,也没有提供解决思路的答复为0。其中东方财富不支持基金功能,因此其“选基金”部分的得分为0。 请参阅附注免责声明17 数据来源:国泰君安证券研究 • 表9:金融大模型的金融数据更丰富 大模型 金融数据分析 kimi 月之暗面的Kimi支持200万字的无损上下文输入,金融数据搜索能力和金融逻辑分析能力在通用大模型中较强,但在金融数据方面积累不足。 通义千问 通义千问参数量在千亿级,数据量超过3万亿tokens。但在金融数据方面积累不足,金融数据搜寻能力有所欠缺,金融逻辑判断能力中等。 文心一言 文心一言参数量为260亿,数据量为5TB。受制于金融数据积累不足,对金融数据的搜集能力较为优秀但搜寻样本过低且无法进行分析,金融逻辑分析能力有短板。 同花顺HithinkGPT 同花顺利用自身过去十几年的数据积累以及市场上公开的金融数据,预训练金融语料达到万亿级tokens。此外还拥有一套自动化的流程,用于数据获取、清洗以及数据质量的验证,每月可新增数千亿tokens优质预训练数据以及数十万条优质微调数据,确保数据的实时性和准确性。 东方财富妙想 妙想金融大模型储备了超4万亿高质量可用数据,其中金融语料达12000亿,涵盖行情、财务、资金、百科、资讯公告、研报、问董秘等数十个维度、上万种数据品类;且每月高质量数据几千亿token稳定增长,为金融专属任务性能优化提供了优质数据资产。 请参阅附注免责声明18 数据来源:国泰君安证券研究 数据优势主要有两个构成因素:1)丰富的业务场景2)数据的治理能力,前者决定了初始语料的多寡,后者决定了多少语料可以 表10:做好垂直金融行业需要广泛的数据来源和积累 被提取成可供模型训练的高质量数据。 数据类别 具体内容 请参阅附注免责声明19 表11:将初始语料转换为可供训练的数据所需要的步骤流程 良好的数据治理能力可以最大化利用丰富业务场景积累的原始数据,更好积攒训练数据,提高大模型性能。 步骤 具体操作 请参阅附注免责声明20 同花顺、东方财富、恒生电子较早深耕数据业务,在金融行业高质量训练数据上有深厚积累,具备较为强的数据治理能力。同花顺 图8:同花顺与东方财富APP的MAU大幅领先于同类产品 4000.00 在2009年成立iFind事业部;东方财富在2013年上线Choice数据产品;恒生电子于2010年收购聚源数据公司。时至今日上述公司拥有庞大的海量数据库,具有多元及多样化的金融数据资产,其中公司数据来源既有互联网的结构化数据和非结构化数据,也有来自政府、科研院所、宏观经济研究机构和专业行业数据公司等相关单位、公司的公开和授权的数据。另外,同花顺和东方财富在C端金融信息服务市场具有广泛的活跃用户,在金融语料的获取能力方面领先于同行。 3500.00 3000.00 2500.00 2000.00 1500.00 1000.00 500.00 0.00 2022.01 2022.02 2022.03 2022.042022.05 2022.06 2022.07 2022.082022.092022.102022.112022.12 同花顺东方财富大智慧泓乐财富通国泰君安君弘平安证券e海通财小方广发证券易淘金蜻蜓点金 数据来源:易观千帆,