您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [未知机构]:国产视频模型测评20260209 - 发现报告

国产视频模型测评20260209

2026-02-09 未知机构
报告封面

2026年02月10日10:22 关键词 可林字节视频生成AI慢剧真人演绎多模态输入赛博朋克花瓣运镜渗透率市场空间测评动画风格指令遵循动画城市夜景霓虹灯牌飞行汽车雨的声音BCM皮肤纹理 全文摘要 近期,AI视频生成模型领域取得了显著进展,新版本模型“可林”与“CDS2.0”在文本、视频、智能跟进及工作流方面实现了功能升级,展现出在实测场景中的高效与潜力。这些模型在空间与竞争格局中预示着AI在视频生成领域的广阔前景与市场需求。团队分析师分享了测评内容,通过对比字节和快手的动物态生成视频,以及在动画与真人风格、光影表现、动作控制等方面的测试结果,突显了模型之间的差异与优势。 国产视频模型测评-20260209_导读 2026年02月10日10:22 关键词 可林字节视频生成AI慢剧真人演绎多模态输入赛博朋克花瓣运镜渗透率市场空间测评动画风格指令遵循动画城市夜景霓虹灯牌飞行汽车雨的声音BCM皮肤纹理 全文摘要 近期,AI视频生成模型领域取得了显著进展,新版本模型“可林”与“CDS2.0”在文本、视频、智能跟进及工作流方面实现了功能升级,展现出在实测场景中的高效与潜力。这些模型在空间与竞争格局中预示着AI在视频生成领域的广阔前景与市场需求。团队分析师分享了测评内容,通过对比字节和快手的动物态生成视频,以及在动画与真人风格、光影表现、动作控制等方面的测试结果,突显了模型之间的差异与优势。整体而言,AI视频生成市场正快速发展,竞争格局日益明朗,预示着AI在创作领域降低门槛、开拓新市场机遇的无限可能。 章节速览 00:00 AI视频生成技术新进展与市场分析 近期字节和快手发布AI视频生成新版本,市场关注度高。分享团队研究成果,包括产品迭代对比、功能升级分析,以及对视频模型空间和竞争格局的展望,通过实测场景和视频演示,探讨技术演进与应用前景。 01:36新一代AI视频生成技术突破与测评 新一代AI模型实现了视频输入和多模态输出的能力,相较于上一代有显著提升。测试包括动画风格和真人表现,旨在评估生成内容的真实性和表现力。AI技术正逐步渗透到真人演绎场景,如真人短剧和电影,市场潜力巨大。测评结果展示了技术进步,但仍需提升真人视频的逼真度。 04:51动画风格与技术效果评估 对话围绕动画风格模拟及光效真实性的评估展开,对比了CDS2.0与可伶3.0在日系动画风格呈现、光效及指令遵循方面的能力。讨论中还涉及了PPT演示技术问题的解决过程,确保了后续内容的顺利展示。 06:20新海城风格动画与赛博朋克夜景对比分析 讨论了两个模型生成的新海城风格动画效果,对比了字节和快手在画风、光影表现、花瓣细节及运镜设计上的差异。前者色调柔和明快,花瓣自然真实但运镜单调;后者风格厚涂,光影丰富,镜头设计多元。随后提及赛博朋克动画城市夜景的霓虹灯牌,未深入展开对比。 08:31斯大伯朋克风格场景还原与镜头切换分析 对话中讨论了两个场景的制作,左边场景以斯大伯朋克风格为主,成功还原了霓虹灯、飞行汽车等元素,镜头从水面倒影缓缓上升,展现了丰富的视觉效果和真实的雨声、飞行声,完成度高。右边场景虽有三个镜头切换,画面丰富,但元素略显单调,缺少左侧场景的细节和丰富性。整体评价,两边作品在风格和镜头运用上各有特色,表现优秀。 对话围绕动画与真人表现力展开,强调了动画作品在元素丰富性和镜头运用上的优势,以及真人表演在表情真实度上的长处,特别是细腻的微表情刻画。 11:49 AI生成电影镜头技术对比分析 对话围绕AI生成电影镜头技术展开,比较了自写模型与快手模型在表现人物情感及细节上的差异。自写模型侧重面部特写,情感表现逼真;快手模型则在表情丰富度、皮肤细节刻画及镜头切换流畅性上表现更优。 13:15视频生成质量与细节表现对比分析 对话主要围绕视频生成的质量和细节表现展开,包括人物一致性、镜头抖动感、雨天环境的真实感、表情紧张度及奔跑速度等要素。参与者对生成视频的真人感和细节处理给予肯定,同时指出表情紧张度和奔跑速度有待提升。对比了快手视频在表情慌张、雨天细节和镜头抖动幅度上的优势,旨在测试视频输入能力。 15:06真人视频转迪士尼风格动画效果评测 用户尝试将电影片段转换为迪士尼风格动画,使用可林和C单词两个平台。可林虽成功输出,但效果僵硬,背景音乐未更换,整体表现一般;C单词则完全失败,长时间未完成生成。视频转视频功能在可林上略胜一筹。 16:22口型同步技术在视频生成中的应用与效果对比 通过对比字节和快手生成的视频,讨论了口型同步技术在不同平台上的表现。左边视频虽满足基本要求,但口型变化略显单调;而右边视频口型更加丰富,配合手势和镜头变化,展现了更细致的生成能力。这表明在日常短视频制作或低要求剧情生成中,字节视频已能满足需求,而快手在细节处理上更具优势。 18:10 CDS与可林视频生成模型对比分析 对话讨论了CDS与可林两款视频生成模型的主要差异,包括故事表达与专业内容生产侧重、视频清晰度(720P vs1080P)、细节处理能力以及价格策略。CDS适用于要求不高的内容,而可林则适合追求电影质感的专业制作,价格方面,可林生成5秒720P视频需4元,而CDS仅需2.3元,但在1080P高清需求下,可林更具优势。此外,谷歌的4K视频生成模型定价更高,反映了不同清晰度与目标用户群体的市场定位差异。 20:55国内外视频生成模型对比与市场分析 对比了国内外多个视频生成模型的定价与效果,指出阿里万象2.6生成效果卡通,细节缺失;minimax海子龙2.3视频真实但无音频;谷歌与openID模型各有优劣,其中openID风格偏向游戏化。定价方面,国内模型价格相近,约0.4美金/5秒,而海外模型如谷歌的4K版本价格更高。最后提及主流视频模型及初创公司的ARR与估值数据。 23:37 AI视频模型市场早期蓝海分析 对话分析了当前AI视频模型市场处于早期发展阶段,尽管几家AR视频模型公司如可林CC和黑镇raz等的AR快速增长,但整体市场规模仅约10亿美元,远小于文本模型和传统视频行业。预计未来市场空间将随AI在各垂直场景渗透率提升而扩大。 25:31 AI技术在视频创作领域的渗透与挑战 讨论了AI在视频创作领域的应用现状,包括在社交视频和动漫领域的渗透,以及在真人短剧和电影领域的技术挑战。强调了AI视频模型的市场潜力和供给创造需求的逻辑,同时指出中美在视频AI领域的竞争态势和多模态数据的重要性。 29:09视频模型行业将呈现多元化竞争格局 随着视频模型技术的不断进步,行业预计将从当前的普遍提升阶段转向细分市场发展,形成各具特色和优势的多元化竞争格局。高端、中端、低端模型将分别瞄准不同用户群体,价格、性能、速度等综合因素将决定市场占有率。 31:39 AI在视频制作市场的渗透与增长 对话探讨了中国视频制作市场的规模及AI技术的应用现状。指出中国视频市场约200亿美金,全球达1600亿美金,AI目前主要应用于慢剧和部分广告片制作,触达用户量逐渐扩大。慢剧播放量显著增长,AI在视频制作中的应用成本和市场机会随之增加。未来,AI有望进一步渗透至真人风格内容制作,带来市场提升。 33:31 AI视频模型发展现状与未来趋势 对话探讨了AI视频模型相较于文本模型的发展滞后性,预测了未来技术发展方向,包括生成时长延长、逻辑一致 性提升等。提及了产业链上中下游的机遇与挑战,以及2026年技术展望,如自回归路线探索、世界模型联动等。建议关注快手、小米等公司,以及AI内容生成领域的投资机会,强调AIGC创作门槛下降带来的市场机遇。 发言总结 发言人1 首先对投资者参与电话会议表示感谢,并介绍了东吴传媒互联网团队在AI视频生成技术领域的研究成果,重点对比了可林3.0和CDS2.0两款模型的功能升级与性能差异,特别是它们的多模态输入和动物态输出能力,以及在真实性和流畅度上的实测表现。他指出,尽管AI视频生成技术市场尚处于早期阶段,但随着技术进步和应用场景的拓展,该领域展现出巨大增长潜力。虽然当前市场参与者众多,但尚未形成一家独大的局面,预计未来将呈现多个模型并存的市场格局。此外,他还讨论了AI在动漫、真人短剧等内容创作中的应用,并对技术发展趋势和潜在投资机会进行了展望。 发言人2 讨论了PPT动态化的过程及其背后的原因,强调了模型在有限参数内进行角色扮演的特性。他预见未来可能出现专业风格或动画风格更为突出的细分视频模型,认为这是一个长期且有潜力的市场。简而言之,他关注了PPT动态化的技术趋势,特别是模型的动态表现能力,并预测了未来视频模型在专业与动画风格上的细分市场将展现出巨大的发展潜力。 问答回顾 发言人1问:那么根据测试结果,可林3.0相较于字节跳动的动物态生成视频有何差异化优势? 发言人1答:通过我们的多组测试对比,可林3.0在某些特定场景如动画风格的细节表现和光线处理上表现出更强的处理能力,比如花瓣的自然程度、画面的艺术感和光影的丰富性等方面。而在真人视频生成方面,可林3.0在某些测试项如运镜设计和镜头切换上展现出更多元化的特性。不过,两者在技术和功能上各有侧重,具体的优劣势取决于应用场景的需求。 发言人1问:在你们的测评中,分别针对动画风格和真人视频生成进行了多组测试,能否具体介绍一下这些测试及结果? 发言人1答:我们在测评中设计了七组不同的测试,第一组主要关注动画风格的生成能力,如模拟新海城风格、赛博朋克风格等;后续四组则专注于真人视频的生成效果,测试其真实度、自然度以及各种动作表现(例如哭戏、奔跑、360度环绕等)。结果显示,在不同场景下,可林3.0和字节跳动的动物态生成视频各有优劣,尤其是在画风、光影表现、元素丰富度和运镜设计等方面存在差异。 发言人1问:在第一个评价点中,您提到的“问题”具体是指什么? 发言人1答:我的“问题”是指在展示的动画片段中,元素如霓虹灯牌、飞行汽车以及五颜六色的霓虹灯和飞行元素是否很好地遵循了给定的指令。 未知发言人问:您对字节和快手两个模型在场景表现上的总体评价如何? 未知发言人答:整体上,两个模型的表现都是不错的。字节模型在镜头运用、场景还原(模拟日本街道)和声音细节(雨声、飞行汽车声以及后现代风格音乐)等方面表现出良好的完成度。快手模型也有丰富的镜头切换,场景从原景到电动汽车再到雨景的转变展现了多样性,但在元素丰富度上稍显单调。 发言人1问:对于动画中银发少女哭泣的场景,两个模型的表现有何异同? 发言人1答:两个模型都完成了基本要求,表现为银发少女在雨中哭泣,有悲伤情绪和流泪细节。但细节上,字节模型可能在元素丰富度上更胜一筹,如背景、衣物和头发细节;而快手模型则更侧重于微表情的刻画,表现出一种忍耐眼泪的真实感。 未知发言人问:在真人骷髅戏的表现上,PROM和快手的模型哪个表现更好? 未知发言人答:PROM模型呈现的都市女性站在深夜街头,眼眶含泪且嘴唇微颤,试图忍住不哭出来的场景,表情逼真,而快手模型在表情上更为丰富,尤其是对忍耐眼泪这一情绪的描绘更为细腻,皮肤纹理、毛孔、眼影等细节刻画更为详尽。 发言人1问:在运动表现测试中,快手模型的表现相较于PROM模型有何优势? 发言人1答:快手模型在运动表现上更显慌张,雨天奔跑时衣服粘皮肤的效果以及地面水花等细节刻画更为生动,尤其是在镜头切换和动态表现上,如奔跑过程中人物保持一致性和镜头抖动感等方面,快手模型的表现更为 出色。 未知发言人问:在视频转视频的能力测试中,可林和PROM的生成效果如何? 未知发言人答:可林模型成功将原视频转换成迪士尼风格,但背景音乐使用了原视频的音乐,且生成效果略显僵硬,不如从文本生成视频那么生动。而PROM模型在视频转视频维度上的表现优于可林,生成了一段较为流畅且生动的动画片段。 发言人1问:在生成视频时,快手这款应用是否能够实现生成细节更丰富的效果? 发言人1答:是的,使用快手在生成视频时可以实现一些生成细节更丰富的功能。 发言人1问:CDS和