您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [未知机构]:惊艳字节发布OmniHuman1仅需一张照片和音频即可生成超长时间稳定视 - 发现报告

惊艳字节发布OmniHuman1仅需一张照片和音频即可生成超长时间稳定视

2025-02-06 未知机构 冷水河
报告封面

字节跳动智能创作数字人团队今日发的OmniHuman模型,能够生成高度真实和生动的人类运动视频,同时支持多种模态,相比过去视频生成模型,显著改善了手势生成,显著超越现有的音频条件人类视频生成方法。 人物可以在视频中生成和音频匹配的动作,包括演讲、唱歌、乐器演奏以及移动,且生成视频相对稳 惊艳‼字节发布OmniHuman-1:仅需一张照片和音频即可生成超长时间稳定视频【天风传媒&海外|AI应用大时代】 字节跳动智能创作数字人团队今日发的OmniHuman模型,能够生成高度真实和生动的人类运动视频,同时支持多种模态,相比过去视频生成模型,显著改善了手势生成,显著超越现有的音频条件人类视频生成方法。 人物可以在视频中生成和音频匹配的动作,包括演讲、唱歌、乐器演奏以及移动,且生成视频相对稳定且时间较长。 该技术方案已落地即梦AI,相关功能将于近期开启测试。 利好数字人+影视动画相关‼原有视频模型的生成稳定性和多模态问题解决,数字人和影视相关产业或迎来全新技术革命,此外我们认为,借助即梦和抖音平台,C端多模态爆款产品或功能有望落地,视频模型生成能力或成为短视频平台的重要竞争力‼ 建议关注:【博纳影业】【中广天择】【视觉中国】【天娱数科】【华策影视】【捷成股份】【上海电影】【蓝色光标】【易点天下】