AI智能总结
DeepSeek-V3重磅发布,国产大模型渐入佳境 近期,深度求索(DeepSeek)正式推出全新系列模型DeepSeek-V3,并同步开源,引起业界广泛关注。DeepSeek-V3是一款基于混合专家(MoE)架构和多头潜在注意力(MLA)技术的大语言模型,同时引入无辅助损失策略, 大幅增强了负载均衡和模型稳定性,在训练效率和推理速度上实现了突破性提升,模型在14.8万亿优质token上进行预训练,并经过精细化的微调和强化学习,展现出卓越能力。 在性能测试上,DeepSeek-V3在知识理解、数学推理、逻辑分析、代码生成等领域表现出色,特别是在高级数学任务MATH500和AIME 2024中远超同类开源模型。其在MMLU-Pro综合评测中取得了75.9%的准确率,在代码生成(Codeforces)和软件工程测试(SWE-bench Verified)中也接近闭源模型的水平。DeepSeek-V3模型训练成本低,性价比极高。DeepSeek-V3的发布标志着国产大模型技术进入全新高度,为AI技术发展注入强劲动力。 季报基金经理言行一致分析 我们基于季报中的文本,从行业概念和风格两个维度对基金经理的言行一致性进行研究。 对于行业概念:首先,我们借助DeepSeek-V3大语言模型提取出基金经理看好或不看好的行业概念。然后,根据相近季报中披露的重仓股信息,判断出底层资产对中信行业指数的匹配度,根据匹配度计算出行业概念的持仓。随后,我们根据持仓情况判断出基金经理的言行一致性。具体而言,若基金经理看好某行业概念,则必须要在下个季度中有所持仓且仓位变化比例不能低于某个具体阈值才能言行一致,否则言行不一致;若基金经理不看好某行业概念,则必须要在下个季度中空仓且仓位变化比例不能高于某个具体阈值才能言行一致,反之言行不一致。 在风格维度的研究中,我们将风格划分为大盘、小盘、成长、价值、均衡、红利和微盘等7个大类,同样通过 DeepSeek-V3大语言模型提取其看好/不看好的风格类别。然后,根据相近季报中披露的重仓股信息,判断出底层资产对万得风格指数的匹配度,根据匹配度计算出风格的持仓。随后,我们根据持仓情况判断出基金经理的言行一致性。我们针对市值估值风格以及红利和微盘风格设计了不同的算法来判断言行一致性。具体而言,对于看好的市值和估值风格,我们需要其在当期季报持仓大于其他风格之和或者在未来一个季度里加仓大于其他风格之和为言行一致,否则言行不一致。对于看好的红利或微盘,需要在当期持仓高于其他风格且持仓变化不能低于某个阈值为言行一致,否则言行不一致。对于不看好的风格同理。最终判断上,如结果全为言行一致/言行不一致为言行一致/言行不一致,其他情况为部分一致,如果没有提取出看好的行业概念或风格,则为无法判断。 我们基于上述方法分析了2019Q4至2024Q3的季报文本,对基金的言行一致性进行了判别,这表明虽然言行不一致的基金经理更倾向于根据市场变化灵活调整策略,但是置信度高的基金经理的Alpha风险更低,风控成本更小。 纪要基金经理言行一致分析 在具体案例上,我们分别选择了不同的基金经理的调研纪要,从行业和风格角度进行了具体的分析说明,使用上述方法论对基金经理的言行一致性做出了判别。 风险提示 1、大语言模型输出结果具有一定随机性的风险; 2、模型迭代升级、新功能开发可能会导致结论不同的风险; 3、人工智能模型得出的结论仅供参考,可能出现错误答案的风险; 4、调研纪要文本和季报质量影响最终输出结果的风险。 一、DeepSeek-V3重磅发布,国产大模型渐入佳境 1.1深度求索公司再创AI技术新高:DeepSeek-V3的创新与突破 2024年12月26日,人工智能公司深度求索(DeepSeek)正式推出全新系列模型DeepSeek-V3,并同步开源。该版本的发布在业内引起了广泛关注。DeepSeek是一家致力于开发先进的大语言模型及相关技术的创新型科技公司,曾先后发布了DeepSeek Coder和Mixture-of-Experts(MoE)模型,为行业带来了显著的技术突破,是全球科技创新的领军者之一。 DeepSeek-V3的发布标志着公司在大语言模型领域的又一次技术创新。该模型基于混合专家(Mixture-of-Experts,MoE)架构和多头潜在注意力(MLA)技术,能够高效处理大规模数据,并且可以最优利用计算资源。在此基础上,DeepSeek-V3还采用了无辅助损失(auxiliary-loss-free)策略,解决了负载均衡的问题,大大加强了模型的稳定性。 DeepSeek-V3训练数据量巨大,预训练阶段使用了14.8万亿个多样且优质的token,经过精心设计的监督微调和强化学习,模型能力得以进一步提升。尽管拥有如此强大的性能,DeepSeek-V3仅消耗了2.788M H800 GPU小时进行完整训练,且在过程中未出现无法恢复的损失波动或回滚操作,显著优化了推理速度。 图表1:DeepSeek-V3基本架构图 1.2DeepSeek-V3在多项测试中表现优异 在性能评测上,DeepSeek-V3在MMLU-Pro、GPQA-Diamond、MATH 500、AIME 2024、Codeforces和SWE-bench Verified等多个基准测试中表现卓越,尤其是在高级数学推理测试(如MATH 500和AIME 2024)中,模型表现非常突出,大幅领先其他模型。同时,在MMLU-Pro的综合知识评测中,DeepSeek-V3取得了75.9%的准确率。此外,该模型在代码生成和软件工程任务(如Codeforces和SWE-bench Verified)中也展现出极高的竞争力 , 不仅超越同类开源模型 , 还接近闭源模型的表现 。 评测结果充分展示了DeepSeek-V3在知识理解、逻辑推理、数学能力、代码生成、软件工程等多方面的卓越能力。 图表2:DeepSeek-V3及相关模型的基准测试表现对比 1.3DeepSeek-V3模型训练成本低,性价比极高 DeepSeek-V3通过对算法、框架和硬件的优化协同设计,大幅降低了训练成本。在预训练阶段,训练每万亿个token仅需180K H800 GPU小时,使得整个过程能够在不到两个月的时间内顺利完成。当前,模型API服务定价也将调整为每百万输入tokens 0.5元(缓存命中)/ 2元(缓存未命中),每百万输出tokens8元。模型在MMLU Rudex基准下的ZeroEval评分中位于领先水平,展现了卓越的推理能力与跨领域适配性。此外,其成本远低于绝大多数顶尖通用大模型,体现出了极高的性价比。 图表3:DeepSeek-V3性价比优于常见大模型 二、基金经理言行一致的研究意义 2.1基金经理言行一致的研究意义 一般地,基金、证券、咨询、基金销售等专业机构都会对基金经理进行调研,以期获得对基金经理的了解和评估。此外,基金经理在定期发布的季报中也会披露基金运作回顾及未来市场展望等内容。通过深入解析研报和纪要中的相关内容可以了解基金经理对未来行业和风格的研判,为投资决策提供有力支持,具有重要意义。然而,随着今年来行业和风格轮动速度的加快,基金经理常常会出现言行不一致的现象,使得FOF基金经理的投研活动变得更加复杂且充满挑战。 2.2如何进行基金经理言行一致的研究? 为了判断基金经理言行是否一致,我们将基金经理在纪要和季报中的言论与其持仓数据之间进行对比。如果基金经理表现出对某一行业或风格有所看好,然而在持仓中并未体现出相应的布局,那么这种言行不一致的行为就可能引发投资者的质疑,基金经理的可信度也会受到影响。反之,如果基金经理的言论与持仓情况一致,可以加深投资者的信任。 通过言行的对比,我们可以有效判断基金经理在投资操作中是否保持了言行一致, 从而帮助投资者更好地理解基金经理的投资逻辑。我们使用基金经理的调研纪要以及基金经理在季报中的市场运作回顾和后市展望部分来了解基金经理的言论,通过基金经理的行业和风格持仓情况来观察其实际的行为,通过二者之间的比较来判断基金经理的言行一致程度。 然而,基金经理的持仓信息通常仅仅在季报、年报或者中报中才进行披露,频率较低且时效性较弱。如果使用传统的线性回归方法,难免因为多重共线性而有较大误差。在本篇报告中,我们创造性的使用DeepSeek-V3大模型提取出基金经理言论中看好/不看好的行业概念及风格,然后根据基金经理在附近日期披露的重仓股信息进行综合判断。 图表4:基金经理言行一致的判别流程 接下来,我们将从行业和风格两个维度对基金经理进行言行一致分析。 三、基金经理季报行业观点的言行一致分析 3.1DeepSeek-V3提取看好/不看好的行业 在表达看好/不看好的行业时,不同基金经理在季报或纪要中的描述往往存在较大差异。 有些行业较为宽泛,比如“消费”,有的较为具体,比如“光伏”。为应对在匹配上的难题,我们将中信产业板块指数、中信一级行业指数、中信二级行业指数和中信三级行业指数纳入行业池(二级和三级行业指数剔除了包含“其他”字样的行业),从宽泛到具体以提升匹配的准确性和覆盖度。我们首先根据特定规则,让DeepSeek-V3大模型提取出看好的行业概念,再让其根据该行业概念在行业池中匹配出最为相似的行业作为最终的看好/不看好的行业。此外,在提取时规定看好/不看好的行业不能超过3个。具体规则如下: 图表5:DeepSeek-V3提取看好行业的规则 图表6:DeepSeek-V3提取不看好行业的规则 3.2DeepSeek-V3提取看好/不看好行业概念实例 下表展示了DeepSeek-V3模型提取看好/不看好行业概念的样例,在季报文本中,基金经理明确提到了看好大消费产业链及银行等核心资产,这表明DeepSeek-V3提取看好行业概念时的准确性。 图表7:DeepSeek提取看好行业概念 在下面的季报文本中,基金经理主要复盘了过去的行业和风格表现以及基金组合运作的模式,并阐述了选择底层个股的方法论,未阐释出明确的不看好的行业。因此,大模型亦没有给出不看好的行业概念,并在原因列说明“文本中未给出相应依据”。 图表8:DeepSeek提取不看好行业概念 3.3行业言行一致判断流程 在具体的言行一致判别上,我们首先在T季度提取基金经理看好或不看好的行业概念后,考察在T+1时刻的行业持仓进行验证。 对于看好的行业言行一致的判断: 若看好的行业概念为“无”,则判断结果为无法判断。 如果在T+1时刻有持仓(持仓比例大于0),且在T+1时刻相对于T时刻没有大幅减仓,则是言行一致的,反之说明言行不一致。 当基金经理对所有看好的行业概念都为言行一致时,判断结果为言行一致;如果基金经理对所有看好的行业概念都为言行不一致时,判断结果为言行不一致,如果既有言行一致和言行不一致,则判断结果为部分一致。 对于不看好的行业言行一致的判断: 若不看好的行业概念为“无”,则判断结果为言行一致。 如果在T+1时刻没有持仓,且在T+1时刻相对于T时刻没有大幅加仓,则是言行一致的,反之说明言行不一致。 当基金经理对所有不看好的行业概念都为言行一致时,判断结果为言行一致;如果基金经理对所有不看好的行业概念都为言行不一致时,判断结果为言行不一致,如果既有言行一致和言行不一致,则判断结果为部分一致。 图表9:行业言行一致判断流程图 四、基金经理季报风格观点的言行一致分析 4.1 DeepSeek-V3提取看好/不看好的风格 我们将重点关注大盘、小盘、成长、价值、红利和微盘等风格。我们让DeepSeek-V3提取看好/不看好的风格时,要求大模型仅对明确含有风格字样的内容进行分析,比如价值有时也会被描述为低估值,红利为高股息,大小盘可能被称为大小市值等。此外, 在提取时规定看好/不看好的风格不能超过3个。具体规则如下: 图表10:DeepSeek-V3提取看好风格的规则 图表11:D