您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国泰君安证券]:国君传媒|豆包实时语音大模型上线,AI交互水平再升级 - 发现报告

国君传媒|豆包实时语音大模型上线,AI交互水平再升级

国君传媒|豆包实时语音大模型上线,AI交互水平再升级

事件:1月20日,豆包实时语音大模型正式推出,并在豆包APP全量开放。 该模型可理解输入语言情绪、实时联网,在输出时具备强大声音控制能力,且高度近似人类、有超低延迟、可随时打断。其真人级语音对话能力具体表现在以下方面:1)拟人化的情感承接,能够理解用户的内容及情绪,并用恰当的语气做出回应;2)强大的声音控制和丰富的情感演绎能力,能够遵循丰富的复杂指令,配合不同的音色、情绪及状态输出,可以讲故事、讲方言和口音、甚至唱歌;3)智商与表现力之间的平衡,该模型的表现力高度接近真人,包括类人的语气词、停顿思考等,模型也有实时联网功能,使其能够根据问题,动态获取最新信息,对时效问题给到精准、及时的回应;4)丝滑的交互体验和超低延迟,实现在更低系统时延情况下的生成准确性、自然度,并且具有敏锐的语音打断与用户对话判停能力。 豆包实时语音大模型的整体满意度较GPT-4o有明显优势,特别是在语音语气自然度和情绪饱满度方面远高于后者。豆包团队围绕拟人度、有用性、情商、通话稳定性、对话流畅度等多个维度选取数十名外部测试者进行考评,豆包实时语音大模型整体满意度(以5分为满分)得分为4.36,GPT-4o为3.18,超过半数的测试者对豆包模型表现打出满分,且豆包模型在情绪理解和情感表达方面优势明显,尤其在“一听就是AI与否”的评测中被认为AI的概率极低。 我们认为,增加了情感的语音交互将显著有利于AI的软硬件应用,能够降低使用门槛、改进效率、提升体验,包括如下应用场景:1)情感陪伴与智慧教育应用;2)AI陪伴硬件如AI玩具、AI宠物,可帮助硬件生产商与IP方扩大需求;3)AI眼镜、AI耳机、AI音箱等生活效率产品将受益于交互方式的改进。 风险提示:AI应用落地进度不及预期,商业化进展不及预期,相关公司主营业务业绩压力。 文章来源 本文摘自:2025年1月20日发布的《豆包实时语音大模型上线,AI交互水平再升级》 更多国君研究和服务 亦可联系对口销售获取 重要提醒 本订阅号所载内容仅面向国泰君安证券研究服务签约客户。因本资料暂时无法设置访问限制,根据《证券期货投资者适当性管理办法》的要求,若您并非国泰君安证券研究服务签约客户,为保证服务质量、控制投资风险,还请取消关注,请勿订阅、接收或使用本订阅号中的任何信息。我们对由此给您造成的不便表示诚挚歉意,非常感谢您的理解与配合!如有任何疑问,敬请按照文末联系方式与我们联系。 法律声明