您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [未知机构]:国产模型技术应用均进展迅速无须担心和海外差距拉大0121 - 发现报告

国产模型技术应用均进展迅速无须担心和海外差距拉大0121

2025-01-21 未知机构 葛大师
报告封面

近期国产大模型神仙打架,让我们看到不管是训练、推理的底层技术,还是交互、陪伴的AI应用,均有重大进展,无须担心和海外头部厂商模型性能拉大,应对国内大模型保持充分积极乐观。 1)应用:字节豆包情感大模型上线,实时通话功能中支持唱歌、英语陪练、模仿秀等多种人格。 语音模型不难,但是加入情感不容易。 国产模型技术&应用均进展迅速,无须担心和海外差距拉大(0121 近期国产大模型神仙打架,让我们看到不管是训练、推理的底层技术,还是交互、陪伴的AI应用,均有重大进展,无须担心和海外头部厂商模型性能拉大,应对国内大模型保持充分积极乐观。 1)应用:字节豆包情感大模型上线,实时通话功能中支持唱歌、英语陪练、模仿秀等多种人格。 语音模型不难,但是加入情感不容易。 情感大模型上线豆包是验证的第一步,后续AI玩具更值得期待。 2)模型:#1:MiniMax-01语言、视觉模型(456B参数,已上线海螺AI),比肩4o和3.5 Sonnet 。 主打线性意注力(GPT-4o也在用,避免KV Cache平方级别增长),并实现了400w token长长长文本。 为什么做这么长文本? 这就要结合MiniMax主打的AI内容消费产品星野/Talkie,需要长期记忆用户聊过的所有内容。 这种长文本做AI玩具也是必要的,不知道未来MiniMax是否跟进。 #2:DeepSeek-R1正式发布(660B参数,已上线),比肩OpenAI o1。 主打o1的后训练强化学习+CoT推理,很好的复刻了o1路线,并且训练细节全部开源。 # 3:Kimi 1.5多模态思考模型发布(在Kimi中灰度上线),长思考性能比肩OpenAI o1,短思考性能大幅超越了GPT-4o和Claude 3.5 Sonnet。 同样是对o1强化学习+CoT推理路线的复刻,今年后续还会继续完善更多模态、更多领域和更强的通用能力,突破RL在代码、数学等领域的限制。 以上三大家模型更新,均有paper,开源&共创风气再次回归。 3)智谱被BIS列入清单,直接“盖章”证明了其模型第一梯队能力。 建议关注:算力侧,浪潮信息、中科曙光、国产芯片系;开发侧,汉得信息、慧博云通、法本信息;数据侧:海天瑞声;终端侧,字节玩具系、国光电器。