近期国产大模型在技术和应用层面均取得显著进展,无需担忧与海外头部厂商的性能差距,应对国内大模型保持积极乐观态度。
-
应用进展:
- 字节豆包情感大模型上线,实时通话功能支持唱歌、英语陪练、模仿秀等多种人格,体现了情感大模型的应用潜力。
-
模型技术进展:
- MiniMax-01:456B参数,已上线海螺AI,比肩GPT-4o和3.5 Sonnet,主打线性注意力机制,支持400w token长文本,适用于AI内容消费产品。
- DeepSeek-R1:660B参数,已上线,比肩OpenAI o1,采用后训练强化学习+CoT推理,训练细节开源,并开源蒸馏功能。
- Kimi 1.5:多模态思考模型,长思考性能比肩OpenAI o1,短思考性能超越GPT-4o和Claude 3.5 Sonnet,采用强化学习+CoT推理路线。
-
研究结论:
- 三大模型更新均有论文支持,开源&共创风气回归。
- 智谱被BIS列入清单,证明其模型第一梯队能力。
建议关注:
- 算力侧:浪潮信息、中科曙光、国产芯片系。
- 开发侧:汉得信息、慧博云通、法本信息。
- 数据侧:海天瑞声。
- 终端侧:字节玩具系、国光电器。