您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国家广播电视总局广播电视规划院]:广电视听科技动态-2025年第8期(总第49期) - 发现报告

广电视听科技动态-2025年第8期(总第49期)

AI智能总结
查看更多
广电视听科技动态-2025年第8期(总第49期)

快手可灵 2.0 版上线多模态视频编辑功能...........................................5Runway 发布视频生成模型 Gen-4 提升内容一致性....................................5亚马逊引入 AI 视频理解模型提升视频资产价值........................................6美国公司推出“自行车赛中央智能”AI 报道平台...........................................6 制 作 海思推出全球首款 AI 双目 4K 网络直播相机及套装.................................7中国锐思智芯发布全球首款像素级融合视觉传感器.................................8 传输 星闪音频技术实现高速超低时延无线音频无损传输........................................8西班牙宣布新的超高清地面数字电视计划..................................................9 终端与应用 Terminals and Applications 欧洲 HbbTV 家庭用户数突破 1 亿户大关....................................................9 摘 要 A IArtificial Intelligence 快手可灵 2.0 版上线多模态视频编辑功能快手可灵 2.0 版上线多模态视频编辑功能 快手可灵 2.0 版显著提升用户意图的理解能力,其多模态视频编辑功能,还可通过输入图片或文字,实现对生成视频内容元素的二次编辑和处理,进一步降低了视频创作的门槛。 P5 Runway 发布视频生成模型 Gen-4 提升内容一致性Runway 发布视频生成模型 Gen-4 提升内容一致性 美国 Runway 发布 AI 视频生成模型 Gen-4,可生成风格统一、主体稳定的视频内容,实现角色、物体和场景的高度一致性,将加速 AI 在影视制作领域的渗透。 亚马逊引入 AI 视频理解模型提升视频资产价值亚马逊引入 AI 视频理解模型提升视频资产价值 P6 亚马逊云科技(AWS)将 AI 多模态视频理解模型引入 Bedrock平台,通过同步处理视频中的画面、音频和文本语义关联,实现海量视频高效检索,释放视频数据潜力,提升视频资产商业价值。观看体验。 美国公司推出“自行车赛中央智能”AI 报道平台美国公司推出“自行车赛中央智能”AI 报道平台 P6 华纳兄弟探索公司(WBD)联合 AWS 推出 AI 驱动的“自行车赛中央智能”(CCI)平台。CCI 利用 AI 技术提升解说效率,同时保留专业解说的人文特色,标志着 AI 在赛事报道领域的突破。 制 作Production 海思推出全球首款 AI 双目 4K 网络直播相机及套装海思推出全球首款 AI 双目 4K 网络直播相机及套装 P7 海思公司宣布推出全球首款 AI 双目 4K 直播相机及便携式直播箱套装。该套装实现了 4K 超高清画质、小巧便携设计和稳定高速的 5G 网络连接,提升了户外网络直播的便捷性和专业性。 中国锐思智芯发布全球首款像素级融合视觉传感器中国锐思智芯发布全球首款像素级融合视觉传感器 P8 中国公司锐思智芯推出全球首款融合视觉传感器 ALPIX-Pizol,融合全局曝光图像技术与事件感知技术,与传统传感器相比,算力需求及功耗大幅降低,为端侧 AI 感知和无人机等领域提供支持。 摘 要 传 输Transmission 星闪音频技术实现高速超低时延无线音频无损传输星闪音频技术实现高速超低时延无线音频无损传输 P8 海思发布星闪音频技术方案,可实现 12Mbps 的高速率、250μs的超低时延以及无损音频编解码无线传输,解决了传统无线音频传输的痛点,为用户带来流畅的音频体验。 西班牙宣布新的超高清地面数字电视计划西班牙宣布新的超高清地面数字电视计划 西班牙超高清协会 UHD Spain 宣布新的全国地面数字电视计划,推广 DVB-T2 技术,部署超高清地面数字电视广播。第一阶段将优先实施高清 / 超高清同播,第二阶段将实现 90% 的设备支持超高清信 终端与应用Terminals and Applications 欧洲 HbbTV 家庭用户数突破 1 亿户大关欧洲 HbbTV 家庭用户数突破 1 亿户大关 P9 2025 年,混合广播宽带电视(HbbTV)标准在欧洲的家庭用户数突破 1 亿户。自 2010 年问世以来,HbbTV 标准通过提供内容发现、互动服务、混合内容传输及无障碍功能,不断提升观看体验。 A I 1快手可灵 2.0 版上线多模态视频编辑功能 全球 AI 基准测试机构 Artificial Analysis 发布了最新的全球视频生成大模型排名。快手旗下可灵 1.6pro(高品质模式)以 1000 分 Arena ELO 基准测试评分,在图生视频(Image to Video)赛道位列第一,Google Veo2 和 Pika Art 分别排名第二、第三。近日,快手又发布了全新的可灵 2.0 大师版,在语义响应、动态质量、画面美学等方面显著提升生成效果。 可灵 1.6 模型自去年 12 月推出以来,已在视频生成的文本响应度、动态展现及画质等方面展现出领先表现。今年 1 月,可灵 1.6pro 新增“多图参考”功能,使用户能够在动画场景中直接融合不同元素,并有效解决了 AI 视频中常见的“角色变形”难题。可灵 1.6pro 还引入了 DeepSeekR1,用户仅通过输入关键词,模型即可智能补全场景细节、动作设计和镜头语言等专业内容,大大简化了视频创作流程。 随 着 2.0 版, 可 灵 AI 正 式 发 布 AI 视 频 生 成 的 全 新 交 互 理 念 Multi-modal Visual Language(MVL),让用户能够结合图像参考、视频片段等多模态信息,将脑海中包含身份、外观、风格、场景、动作、表情、2 运镜在内的多维度复杂创意,直接高效地传达给 AI。基于这个理念,可灵 2.0上线的全新多模态视频编辑功能,通过输入图片或文字,对生成的视频内容实现元素的增加、删减、替换,帮助创作者们实现更加灵活的二次编辑和处理。这些功能的引入降低了视频创作的门槛,使普通用户能够创作出专业水准的内容,在提升作品整体质量的同时,为用户节省了大量的构思与制作时间。快手负责人表示,“可灵 2.0 大师版不仅仅是一次简单的技术升级,更是一次全方位的体验跃升,实现了技术、体验、美学的三重突破。” (信息来源 :网易 www.163.com) 2Runway 发布视频生成模型 Gen-4 提升内容一致性 美国人工智能初创公司 Runway 发布了新一代 AI 视频生成模型 Gen-4,在角色、物体和场景的一致性表现方面取得突破。用户仅通过提供参考图像和文本指令,即可生成风格统一、主体稳定的视频内容,无需额外训练。Gen-4 还支持多视角元素重构,能根据光照条件动态调整角色外观,从而提升动态视频的连贯性和真实感。 Gen-4 的关键创新在于“一致性引擎”,该引擎 3 采用跨帧注意力机制和空间 - 时间建模,通过参考图像来编码主体的特征,并结合文本描述中构图和视角等空间约束,来实现动态场景中各元素的精准匹配。这一技术 提高了“长序列生成”的稳定性,有效解决了传统模型中角色变形或场景跳变的问题。此外,Gen-4 采用多模态联合训练框架,实现视觉参考与文本指令的深度融合,进一步强化了对复杂指令的解析能力。 尽管 Gen-4 展现了强大的创作潜力,但其对行业的影响引发争议。研究表明,AI 视频工具的应用已导致部分影视公司缩减岗位,预计到 2026 年,这一趋势可能影响超过 10 万个娱乐业职位。为应对挑战,Runway 正采取差异化竞争策略,包括与好莱坞制片厂合作及资助 AI 电影项目等。业界普遍认为,Gen-4 的发布将加速 AI 在影视制作领域的渗透,但其技术边界和伦理问题仍需长期观察和探讨。 (信息来源:Gen-4 项目官网 runwayml.com) 3亚马逊引入 AI 视频理解模型提升视频资产价值 亚马逊云科技(AWS)宣布与视频理解公司 TwelveLabs 合作,将后者基于多模态架构的基础模型 Marengo 和 Pegasus 引入 Amazon Bedrock平台。此次合作旨在通过 AI 技术赋能开发者,使其能够更高效地 4 搜索和分析视频内容,解决全球范围内大量视频数据难以有效利用的问题,为媒体、体育、教育等行业开启高效视频管理的新时代。 Marengo 和 Pegasus 模型采用深度神经网络和时序分析技术,能同步处理视频中的视觉画面、音频和文本信息,并准确捕捉其间的语义关联。在实际应用中,用户通过自然语言指令即可检索海量视频,例如“找出射门得分后的庆祝画面”,系统可在数秒内完成海量检索,准确率高达 95%。通过整合至 AmazonBedrock 平台,模型的视频理解能力将获得更广泛的应用。AWS 提供的弹性计算资源和安全架构确保了大规模视频处理的稳定性,让开发者专注于业务创新,而无需担忧基础设施的运维挑战。 此次合作提升了视频资产的商业价值,并为跨行业创新提供了标准化工具。未来,视频数据在影视制作、流媒体广告等领域的潜力有望得到进一步释放。 (信息来源:先进电视网 www.advanced-television.com) 4美国公司推出“自行车赛中央智能”AI 报道平台 华纳兄弟探索公司(WBD)与亚马逊云科技(AWS)合作推出了“自行车赛中央智能”(CCI)生成式 AI 平台,它能够实时整合骑手数据、赛事历史和成绩分析,支持自然语言提问,助力解说团队迅速生成有深度的内容,有效提升山地自行车赛事的报道效率。该平台在 2025 年 WHOOPUCI 山地自行车世界巡回赛中首次亮相。 据悉,CCI 平台基于 AWS 的生成式 AI 服务构建,其工作流程包括三个步骤:首先,利用文档识别技术提取赛事资料;接着,通过多语言翻译模块处理国际内容;最后,运用自然语言理解工具对比赛数据进行结构化分析。与传统的手动搜寻分散信息的方式相比,CCI 平台能借助 AI 技术自动处理多源数据。在此过程中,AI 模型负责整合信息并产出易于理解的解说素材,而人工团队则掌控最终的叙事方向,这种技术与人文的结合,提升了数据处理速度,并保留了体育解说的人文情怀,在 AI 技术与专业经验之间找到了平衡点。 这一创新举措为山地自行车赛事带来了革新,也为其他体育项目的智能化制作提供了借鉴。 (信息来源:华纳官网 media.wbdsports.com) 制 作 5海思推出全球首款 AI 双目 4K 网络直播相机及套装 近日,海思技术有限公司发布了全球首款 AI 双目 64K 直播相机及便携式直播箱套装,专为户外直播场景设计,旨在解决传统户外直播设备在画质、便携性和连接稳定性方面的痛点。该套装将专业直播设备高度集成在一个便携箱体中,用户无需携带大量笨重设备,即可进行高质量的户外直播。 该 AI 双目 4K 直播相机是套装的核心。它搭载海思最新的 AI 视觉处理解决方案,能够智能识别场景并优化图像质量,即使在复杂光线条件下也能呈现清晰、细腻的 4K 画面。该相机采用相位检测自动对焦技术,将昏暗或焦点偏离时的对焦速度从秒级提升至毫秒级,确保画面始终清晰锐利。其采用云台摄像头一体化设计,提升了集成度和物理防抖能力,在户外运动场景下也能保持画面流畅稳定。此外,该相机使用星闪鸿蒙音视频传输方案,实现了高质量的无线音频传输,其低时延和抗干扰能力确保了直播收音的稳定性和声画同步,并支持一机多麦,为