字节Seedance2.0发布,“杀死比赛”级产品惊艳亮相 字节Seedance2.0发布,“杀死比赛”级产品惊艳亮相。进入2026年以来,视频模型领域频繁发布更新,而近期发布的字节即梦Seedance 2.0一经亮相,就成为个中翘楚:它支持图像、视频、音频、文本四种模态输入,指令理解准确性、物理规律合理性、元素一致性水平都有所提升,而更重要的是,通过多模态输入以及参考资料的多样化,Seedance 2.0可以实现精准复刻运镜与动作,镜头连贯性更强,从而带来更高的模型可控性。 增持(维持) 对产业的意义?可控性显著提升有望带来视频生成产业工业化的飞跃!“抽卡”是AI漫剧行业的传统痛点,为AIGC行业带来了额外的成本负担。根据短剧自习室中对巨日禄科技的CEO斯宇的报道介绍,由于AI生成的视频画面具备一定随机性,因此每次生成的内容未必满意,用户需要同一提示词使用多次,才能得到满意的结果,业内俗称“抽卡”,单个镜头的抽卡次数可以高达7次之多。这一机制使得生成一次画面需要支付多次成本,为AIGC行业带来了额外的成本负担。Seedance 2.0模型更高的可控性有助于减少抽卡成本,从而降低漫剧行业的制作成本和制作周期。 作者 分析师孙行臻执业证书编号:S0680526010001邮箱:sunxingzhen1@gszq.com 分析师陈泽青执业证书编号:S0680523100001邮箱:chenzeqing3655@gszq.com 我们对采用Seedance 2.0模型后能够节省的视频生成成本进行了敏感度测算:通过计算可知,即使是在抽卡频率仅降低至原本的75%的保守假设下,采用字节Seedance 2.0已经能(相比同业模型)降低总生成成本约5%。若是在中性假设下,假设Seedance 2.0可以使抽卡频率降低至原本的50%,则可以令模型每秒生成成本相比同业降低37%。 相关研究 1、《计算机:牛市先锋,优选炒股软件》2026-02-082、《计算机:2026年度策略:锚定AI未来,共启科技新篇》2026-01-293、《计算机:算力&存力依旧》2025-12-20 投资建议: AI漫剧:万兴科技、快手、阜博集团、新国都等;多模态:当虹科技、虹软科技等;字节链:寒武纪、润泽科技等。 风险提示:AI技术迭代不及预期的风险,AIGC产业落地不及预期的风险,宏观经济波动的风险。 内容目录 1.字节Seedance 2.0发布,“杀死比赛”级产品惊艳亮相...................................................................................31.1多模态能力:全面升级,支持文本、图片、视频、音频四种模态输入...................................................31.2模型基础能力:指令理解准确性、物理规律合理性、元素一致性水平有所提升.....................................41.3模型可控性:多模态输入带来高难度的运镜、动作、创意模板精准复刻...............................................52.可控性显著提升有望带来视频生成产业工业化的飞跃....................................................................................73.投资建议.......................................................................................................................................................9风险提示.........................................................................................................................................................10 图表目录 图表1:2026年部分AI视频模型更新记录......................................................................................................3图表2:Seedance 2.0可参考资料参数预览.....................................................................................................4图表3:Seedance 2.0官网案例:物理规律合理性增强....................................................................................4图表4:Seedance 2.0官网案例:画面一致性增强...........................................................................................5图表5:Seedance 2.0官网案例:视频参考精准复刻运镜与动作......................................................................5图表6:字节即梦积分定价..............................................................................................................................7图表7:可灵积分官方定价..............................................................................................................................8图表8:字节Seedance 2.0每秒定价...............................................................................................................8图表9:可灵O1每秒官方定价........................................................................................................................8图表10:字节Seedance2.0与可灵O1每秒生成成本对比...............................................................................9图表11:字节Seedance 2.0在降低不同抽卡频率假设下对成本节约的敏感度测算..........................................9 1.字节Seedance 2.0发布,“杀死比赛”级产品惊艳亮相 视频生成模型密集迭代发布,行业走向多模态输入+全能参考时代。自2026年1月以来,爱诗科技和谷歌先后发布了世界模型PixVerse R1、Genie 3;生数科技以“为剧而生”为旗,发布Vidu Q3,支持生成16s声画同出的视频;再到快手的Kling 3.0、字节跳动的Seedance 2.0,先后脚发布,都奔着多模态输入输出和全能参考而去。 字节Seedance 2.0发布,大幅提升视频模型可控性,效果惊人。近日,字节官方在即梦中更新发布了Seedance 2.0版本,Seedance 2.0现在支持图像、视频、音频、文本四种模态输入,表达方式更丰富,生成也更可控。用户可以用一张图定下画面风格,用一个视频指定角色的动作和镜头的变化,再用几秒音频带起节奏氛围……搭配提示词,让创作过程变得更自然、更高效,也更像真正的“导演”。 下面简单介绍Seedance 2.0本次更新的亮点所在: 1.1多模态能力:全面升级,支持文本、图片、视频、音频四种模态输入 多模态能力全面升级,视频创作进入“自由组合”时代。Seedance2.0支持上传文本、图片、视频、音频,这些素材都可以被用作使用对象或参考对象。用户可以参考任何内容的动作、特效、形式、运镜、人物、场景、声音,只要提示词以自然语言方式写得清楚,模型都能理解。多模态参考能力(可参考万物)+强创意生成+指令响应精准(理解力很棒),为Seedance的生成能力带来了优越的可控性。 1.2模型基础能力:指令理解准确性、物理规律合理性、元素一致性水平有所提升 基础能力增强,物理规律合理性、指令理解准确性等能力有所提升。Seedance 2.0在基础层面显著增强,物理规律更合理、动作表现更自然流畅、指令理解更精准、风格保持更稳定,不仅能稳定完成复杂动作、连续运动等高难度生成任务,也让整体视频效果更真实、更顺滑,是一次底层能力的全面进化。根据字节即梦官方文档案例显示,Seedance2.0现在可以生成现实感极强的画面(例如女孩晒衣服案例),或者在复杂文字指令下视频生成有比较好的跟随表现(比如蒙娜丽莎偷喝可乐案例)。 视频画面一致性全面提升。视频生成模型实际应用中,一致性的问题是传统用户痛点:画面里人物前后长得不一样、商品细节丢了、小字模糊、场景跳变、镜头风格无法统一……这些在创作中常见的一致性问题,现在在Seedance2.0中都能被解决。从人脸到服装,再到字体细节,整体一致性更稳、更准。例如字节即梦官网中提供的案例,可以在保持运镜和转场效果不变的情况下,将画面中的女孩换成花旦,镜头中人物各个角度都匹配一致。 资料来源:字节即梦官方文档,国盛证券研究所 1.3模型可控性:多模态输入带来高难度的运镜、动作、创意模板精准复刻 上传参考视频,即可精准复刻运镜与动作,镜头连贯性更强。以前想让模型模仿电影里的走位、运镜或者复杂动作,要么写一堆细节提示词,要么干脆做不到。而现在,只需要上传一段参考视频,就可以做到,并且具备更强的镜头连贯性(一镜到底效果)。 资料来源:字节即梦官方文档,国盛证券研究所 以类似的范式,Seedance 2.0还能实现创意转场和剪辑的精准复刻。不止能生图写故事,Seedance 2.0还支持“照着模仿”——创意转场、广告成片、电影片段、复杂剪辑,只要用户有参考图或视频,模型就能识别动作节奏、镜头语言、视觉结构,并精准复刻出来。不懂专业术语也没关系,只要用户写清楚想参考的部分,比如“参考@视频1的节奏和运镜,@图1的角色造型”,模型就能高质量生成。 除此之外,Seedance 2.0还实现了更精准、更真实的音色匹配,并可以支持音乐卡点,提升了视频输出的整体效果。 我们认为,Seedance 2.0在基础能力(生成质量)和可控性两个方面双重进步,使得视频模型实用性和使用效率得到显著提升,有望加速整个AIGC产业化的快速落地。 2.可控性显著提升有望带来视频生成产业工业化的飞跃 “抽卡”是AI漫剧行业的传统痛点,为AIGC行业带来了额外的成本负担。根据短剧自习室中对巨日禄科技的CEO斯宇的报道介绍,“像这个镜头,导演抽了七次,七次成本大概在七八块钱到十块钱,基本上这个镜头就搞定了。我们一分钟的画面可能就是20到30个分镜,每个分镜是2秒到4秒。”由于AI生成的视频画面具备一定随机性,因此每次生成的