行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

国产模型技术应用均进展迅速无须担心和海外差距拉大0121

2025-01-21 未知机构葛大师

近期国产大模型在技术和应用层面均取得显著进展，无需担忧与海外头部厂商的性能差距，应对国内大模型保持积极乐观态度。

应用进展：
- 字节豆包情感大模型上线，实时通话功能支持唱歌、英语陪练、模仿秀等多种人格，体现了情感大模型的应用潜力。
模型技术进展：
- MiniMax-01：456B参数，已上线海螺AI，比肩GPT-4o和3.5 Sonnet，主打线性注意力机制，支持400w token长文本，适用于AI内容消费产品。
- DeepSeek-R1：660B参数，已上线，比肩OpenAI o1，采用后训练强化学习+CoT推理，训练细节开源，并开源蒸馏功能。
- Kimi 1.5：多模态思考模型，长思考性能比肩OpenAI o1，短思考性能超越GPT-4o和Claude 3.5 Sonnet，采用强化学习+CoT推理路线。
研究结论：
- 三大模型更新均有论文支持，开源&共创风气回归。
- 智谱被BIS列入清单，证明其模型第一梯队能力。

建议关注：

算力侧：浪潮信息、中科曙光、国产芯片系。
开发侧：汉得信息、慧博云通、法本信息。
数据侧：海天瑞声。
终端侧：字节玩具系、国光电器。

近期国产大模型神仙打架，让我们看到不管是训练、推理的底层技术，还是交互、陪伴的AI应用，均有重大进展，无须担心和海外头部厂商模型性能拉大，应对国内大模型保持充分积极乐观。 1）应用：字节豆包情感大模型上线，实时通话功能中支持唱歌、英语陪练、模仿秀等多种人格。语音模型不难，但是加入情感不容易。国产模型技术&应用均进展迅速，无须担心和海外差距拉大（0121 近期国产大模型神仙打架，让我们看到不管是训练、推理的底层技术，还是交互、陪伴的AI应用，均有重大进展，无须担心和海外头部厂商模型性能拉大，应对国内大模型保持充分积极乐观。 1）应用：字节豆包情感大模型上线，实时通话功能中支持唱歌、英语陪练、模仿秀等多种人格。语音模型不难，但是加入情感不容易。情感大模型上线豆包是验证的第一步，后续AI玩具更值得期待。 2）模型：#1：MiniMax-01语言、视觉模型（456B参数，已上线海螺AI），比肩4o和3.5 Sonnet 。主打线性意注力（GPT-4o也在用，避免KV Cache平方级别增长），并实现了400w token长长长文本。为什么做这么长文本？这就要结合MiniMax主打的AI内容消费产品星野/Talkie，需要长期记忆用户聊过的所有内容。这种长文本做AI玩具也是必要的，不知道未来MiniMax是否跟进。 #2：DeepSeek-R1正式发布（660B参数，已上线），比肩OpenAI o1。主打o1的后训练强化学习+CoT推理，很好的复刻了o1路线，并且训练细节全部开源。 # 3：Kimi 1.5多模态思考模型发布（在Kimi中灰度上线），长思考性能比肩OpenAI o1，短思考性能大幅超越了GPT-4o和Claude 3.5 Sonnet。同样是对o1强化学习+CoT推理路线的复刻，今年后续还会继续完善更多模态、更多领域和更强的通用能力，突破RL在代码、数学等领域的限制。以上三大家模型更新，均有paper，开源&共创风气再次回归。 3）智谱被BIS列入清单，直接“盖章”证明了其模型第一梯队能力。建议关注：算力侧，浪潮信息、中科曙光、国产芯片系；开发侧，汉得信息、慧博云通、法本信息；数据侧：海天瑞声；终端侧，字节玩具系、国光电器。

点击免费查看完整报告

国产模型技术应用均进展迅速无须担心和海外差距拉大0121

你可能感兴趣

传媒互联网周报：英伟达业绩超预期，国产AI模型和应用迭代迅速

计算机应用行业：国产EDA与海外差距在哪儿？

快手可灵进展积极千问模型下载量稳居开源第一坚定看好2026年国产模型及应用投

鸿富瀚预期差再提示国产液冷标的专注冷板和电子散热进展迅速获得阿里及Mat

核心主业稳中向上，AI应用和数据运营业务进展迅速

电子元器件行业：周报：国产3D闪存和DRAM均取得进展

海外科技行业2026年第2期：国产大模型登陆港股，AI技术迭代与应用多点突破

人工智能行业专题（11）：探究模型能力与应用的进展和边界

传媒行业周观察：OpenAI发布Sora2和Sora APP，AI视频模型迎里程碑进展；看好AI应用方向

SORA模型的技术路线和应用场景专家交流纪要