字节跳动智能创作数字人团队发布了OmniHuman-1模型,能够生成高度真实和生动的人类运动视频,支持多种模态,并显著改善了手势生成,超越现有音频条件人类视频生成方法。该模型仅需一张照片和音频即可生成与音频匹配的动作视频,包括演讲、唱歌、乐器演奏及移动,且生成视频相对稳定且时间较长。该技术方案已落地即梦AI,相关功能将于近期开启测试。
利好数字人+影视动画相关产业,原有视频模型的生成稳定性和多模态问题得到解决,或迎来技术革命。此外,借助即梦和抖音平台,C端多模态爆款产品或功能有望落地,视频模型生成能力或成为短视频平台的重要竞争力。
建议关注:博纳影业、中广天择、视觉中国、天娱数科、华策影视、捷成股份、上海电影、蓝色光标、易点天下。