AI智能总结
摘要 豆包实时语音大模型于1月20日正式推出,并在豆包APP中全面开放。该模型实现了端到端的语音对话,主要面向中文场景,具备低时延、可随时打断等特性,且在语音表现力、控制力和情绪承接方面表现优异。相比传统级联模式和GPT-4o,豆包模型在语音语气自然度和情绪饱满度上具有明显优势,用户满意度更高。技术方面,豆包实时语音大模型通过预训练、Scaling和强化学习等技术,实现了语音与文本的深度融合,具备多模态输入和输出能力。未来,随着视频、语音、图像等功能的加入,模型训练和推理所需的算力将进一步提升,云端AI算力需求也将持续增长。 该模型的推出有望推动AI手机、AI眼镜等端侧产品的发展,并加速AI助手、情感陪护等应用的智能化进程。 豆包实时语音大模型的推出有望在春节期间推动豆包APP的用户增长,并进一步改善字节旗下应用的体验。此外,该模型的进展也将带动国内算力产业链的增长,并推动情感陪伴类应用和AI玩具等智能终端的创新落地。因此豆包语音大模型相关产业链也受到了金融市场的关注。我们使用“产业链Agent”工具梳理出“豆包语音大模型”概念的相关产业链上下游,并整理出相关概念股名单。同时,我们基于量价数据构造了领涨因子与尖峰右偏因子,在以上概念股池中筛选出因子得分前五的股票作为“豆包语音大模型”概念增强组合。 风险提示 大语言模型输出结果具有一定随机性的风险,模型迭代升级、新功能开发可能会导致结论不同。新闻可能包含误导性的信息,语料质量对结果正确性存在负面影响的风险。人工智能模型得出的结论仅供参考,可能出现错误答案的风险。 “豆包语音大模型”热点解析 字节推出豆包语音大模型,哪些投资机会? 1月20日,字节跳动正式推出豆包实时语音大模型,并在豆包APP中全面开放。该模型实现了端到端的语音对话,主要面向中文场景,具备低时延、可随时打断等特性,且在语音表现力、控制力和情绪承接方面表现优异。相比传统级联模式和GPT-4o,豆包模型在语音语气自然度和情绪饱满度上具有明显优势,用户满意度更高。 技术方面,豆包实时语音大模型通过预训练、Scaling和强化学习等技术,实现了语音与文本的深度融合,具备多模态输入和输出能力。未来,随着视频、语音、图像等功能的加入,模型训练和推理所需的算力将进一步提升,云端AI算力需求也将持续增长。该模型的推出有望推动AI手机、AI眼镜等端侧产品的发展,并加速AI助手、情感陪护等应用的智能化进程。 豆包实时语音大模型的推出有望在春节期间推动豆包APP的用户增长,并进一步改善字节旗下应用的体验。此外,该模型的进展也将带动国内算力产业链的增长,并推动情感陪伴类应用和AI玩具等智能终端的创新落地。因此,豆包语音大模型相关产业链也受到了金融市场的关注。本文从模型的角度出发,给出“豆包语音大模型”产业链图谱结果,并提供概念股相关标的结果。最终,我们得到“豆包语音大模型”概念的增强组合包括:乐鑫科技、晶晨股份、天孚通信、甬矽电子、胜宏科技。 “豆包语音大模型”产业链图谱生成 国金金融工程团队将大语言模型应用到产业链梳理任务上来,设计出专门生成产业链图谱并提供相关股票池的“产业链Agent”工具。它利用大语言模型突出的生成能力与分析能力,同时基于RAG方法在海量新闻、研报等文本构成的本地知识库中自动检索相关信息,基于大模型的理解与推理能力从中挖掘产业链信息,并确保最终结果的合理性、时效性与专业性。 图表1:“豆包语音大模型”产业链图谱 “豆包语音大模型”相关投资标的 基于以上图谱结果,模型给出概念相关股票池结果。 图表2:“豆包语音大模型”相关标的 我们基于量价数据构造了领涨因子与尖峰右偏因子,并在以上概念股池中筛选出因子得分前五的股票作为最终组合,详细方法请参考《Beta猎手系列之十二:RAG-ChatGPT提前布局热点概念领涨股》。“豆包语音大模型”概念最终筛选得到的组合:乐鑫科技、晶晨股份、天孚通信、甬矽电子、胜宏科技。 风险提示 1、大语言模型输出结果具有一定随机性的风险,模型迭代升级、新功能开发可能会导致结论不同。 2、新闻可能包含误导性的信息,语料质量对结果正确性存在负面影响的风险。 3、人工智能模型得出的结论仅供参考,可能出现错误答案的风险。