行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

惊艳字节发布OmniHuman1仅需一张照片和音频即可生成超长时间稳定视

2025-02-06 未知机构冷水河

字节跳动智能创作数字人团队发布了OmniHuman-1模型，能够生成高度真实和生动的人类运动视频，支持多种模态，并显著改善了手势生成，超越现有音频条件人类视频生成方法。该模型仅需一张照片和音频即可生成与音频匹配的动作视频，包括演讲、唱歌、乐器演奏及移动，且生成视频相对稳定且时间较长。该技术方案已落地即梦AI，相关功能将于近期开启测试。

利好数字人+影视动画相关产业，原有视频模型的生成稳定性和多模态问题得到解决，或迎来技术革命。此外，借助即梦和抖音平台，C端多模态爆款产品或功能有望落地，视频模型生成能力或成为短视频平台的重要竞争力。

建议关注：博纳影业、中广天择、视觉中国、天娱数科、华策影视、捷成股份、上海电影、蓝色光标、易点天下。

字节跳动智能创作数字人团队今日发的OmniHuman模型，能够生成高度真实和生动的人类运动视频，同时支持多种模态，相比过去视频生成模型，显著改善了手势生成，显著超越现有的音频条件人类视频生成方法。人物可以在视频中生成和音频匹配的动作，包括演讲、唱歌、乐器演奏以及移动，且生成视频相对稳惊艳‼字节发布OmniHuman-1：仅需一张照片和音频即可生成超长时间稳定视频【天风传媒&海外|AI应用大时代】字节跳动智能创作数字人团队今日发的OmniHuman模型，能够生成高度真实和生动的人类运动视频，同时支持多种模态，相比过去视频生成模型，显著改善了手势生成，显著超越现有的音频条件人类视频生成方法。人物可以在视频中生成和音频匹配的动作，包括演讲、唱歌、乐器演奏以及移动，且生成视频相对稳定且时间较长。该技术方案已落地即梦AI，相关功能将于近期开启测试。利好数字人+影视动画相关‼原有视频模型的生成稳定性和多模态问题解决，数字人和影视相关产业或迎来全新技术革命，此外我们认为，借助即梦和抖音平台，C端多模态爆款产品或功能有望落地，视频模型生成能力或成为短视频平台的重要竞争力‼ 建议关注：【博纳影业】【中广天择】【视觉中国】【天娱数科】【华策影视】【捷成股份】【上海电影】【蓝色光标】【易点天下】

点击免费查看完整报告

惊艳字节发布OmniHuman1仅需一张照片和音频即可生成超长时间稳定视

你可能感兴趣