您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国家广播电视总局广播电视规划院]:广电视听科技动态2025年第22期(总第63期) - 发现报告

广电视听科技动态2025年第22期(总第63期)

AI智能总结
查看更多
广电视听科技动态2025年第22期(总第63期)

超高清 华数 AI 超分技术落地,4500 小时内容升级 4K/8K....................................5AI 辅助制作的 8K VR 沉浸视频《六艺传韵》发布....................................5 AIGC 百度搜索旗下 AI 短剧生成平台开启公测....................................................6国产视频生成模型实现分钟级多镜头视频创作.........................................6百度文心助手升级,实现 AI 长视频实时交互生成....................................7谷歌 Veo 3.1 视频生成模型,提供视频编辑功能........................................7 AI 治理 AI Governance YouTube 推出 AI 肖像识别功能,加强内容治理........................................8 终 端 雷鸟推出全球首款 HDR AR 眼镜 RayNeo Air4............................................9 摘 要 超高清Ultra High Definition 华数 AI 超分技术落地,4500 小时内容升级 4K/8K华数 AI 超分技术落地,4500 小时内容升级 4K/8K P5 华数推出 AI 超分辨率视频处理系统,可实现从标清、高清到4K、8K 的画质升频,目前已完成 4500 小时内容升级,上线“华彩 4K 专区”。未来,该技术将应用于老片修复和窄带高清编码等场景,助推文化内容消费升级。 AI 辅助制作的 8K VR 沉浸视频《六艺传韵》发布AI 辅助制作的 8K VR 沉浸视频《六艺传韵》发布 P5 vivo 发布了首款混合现实头显 vivo Vision,并同步推出沉浸视频《六艺传韵》。该作品由 4K 花园承制,采用 8K、180° VR 与 AI后期处理等技术,实现传统文化的沉浸式体验。这是国内首个超高清 +VR+AI 标杆性案例。 A IGCArtificial Intelligence 百度搜索旗下 AI 短剧生成平台开启公测百度搜索旗下 AI 短剧生成平台开启公测 P6 该 AI 短剧生成平台支持自动生成和人机协作两种模式,能辅助创作者完成约 80% 内容创作,提升效率并降低成本。该平台结合亿元创作基金、百亿流量扶持及 IP 资源合作,为创作者提供全方位支持和多元变现渠道,推动短剧产业发展。 国产视频生成模型实现分钟级多镜头视频创作国产视频生成模型实现分钟级多镜头视频创作 P6 中科大联合字节跳动发布能实现分钟级长度、多场景的高效视频生成模型,其核心算法 MoGA 通过优化注意力机制,显著提升上下文处理能力与计算效率,并具备模块化与兼容性优势。该成果兼具科研与产业价值,标志着国产视频生成技术实现重要突破。 百度文心助手升级,实现 AI 长视频实时交互生成百度文心助手升级,实现 AI 长视频实时交互生成 P7 此次升级提升了其 AIGC 多模态创作与任务解决能力,并推出行业首个开放式实时互动数字人智能体。百度自研“蒸汽机”模型在 AI 视频实时交互生成方面也首次突破 10 秒时长的限制,实现了“无限时长”生成,用户可实时预览生成内容并随时暂停或修改,这种“双向共创”使得 AI 视频创作进入全新阶段。 摘 要 谷歌 Veo 3.1 视频生成模型,提供视频编辑功能谷歌 Veo 3.1 视频生成模型,提供视频编辑功能 P7 Veo3.1 版本支持在视频中添加对象,并自动将其融入原有画面风 格。 模 型 已 集 成 于 Flow、Gemini 和 Vertex AI 等 平 台, 自Flow 上线以来已生成超 2.75 亿个视频。此次版本更新体现了 AI在生成质量与编辑精度方面的进步:一是画面真实性与语义理解能力提升,二是编辑操作从整体生成拓展至局部修改与对象增删。 AI 治理AI Governance YouTube 推出 AI 肖像识别功能,加强内容治理YouTube 推出 AI 肖像识别功能,加强内容治理 近日,YouTube 上线“肖像识别”新功能,用于帮助创作者识别并管理平台上未经授权使用其面部形象的内容。这为创作者和平台提供了新的权益保护手段,有助于防止公众人物形象被不当使用,也为平台治理深度伪造内容提供了技术支撑。 P8 终端Terminal 雷鸟推出全球首款 HDR AR 眼镜 RayNeo Air4雷鸟推出全球首款 HDR AR 眼镜 RayNeo Air4 近日,中国公司雷鸟正式推出第四代口袋电视“雷鸟 Air 4 系列”AR眼镜,作为全球首款支持 HDR10 的 AR 眼镜,支持 AI 实时 SDR视频转 HDR、2D 视频转 3D,音频方面支持 B&O 调音,从画质、音质到内容实现三位一体跨越。 P9 超高清 1华数 AI 超分技术落地,4500 小时内容升级 4K/8K 2025 年是国家广电总局确立的“超高清发展年”,这是一项推动广电视听与互联网内容服务升级、技术产业演进的重大系统工程。华数传媒充分利用 AI 超分辨率等技术,推动视听内容管理实现“高清化、低码化、智能化”转型。 在技术层面,华数打造了以 AI 为驱动、云算力为底座的智能化视频处理平台,融合 SRCNN、EDSR 等 AI 模型,自主研发 AI 超分辨率编码服务系统,并集成智能转码、噪声抑制、画质增强等模块,形成端到端自动化视频处理工作流。该系统支持多尺度分辨率提升和自适应编码,可实现从标清、高清到 4K、8K 的升频重建,能兼顾画质提升与码率优化。该系统采用分布式调度,能充分利用云与闲时算力,显著提升资源利用率并降低运营成本。 目前,该技术已在画质增强与 4K 超分业务中广泛应用,完成了 4500小时内容的 AI 超分编码,并在华数 TV“华彩 4K 专区”上线,丰富了 4K精品内容库。未来,华数计划将该技术拓展至老片修复、窄带高清编码等领域,进一步释放 AI 超分技术的潜能,提升用户观影体验,推动文化内容消费的技术化升级。 (信息来源 :微信公众号 mp.weixin.qq.com) 2AI 辅助制作的 8K VR 沉浸视频《六艺传韵》发布 vivo 发 布了 首 款 混合 现 实头 显 探 索版 vivoVision,并同步推出文化类沉浸穹幕视频《六艺传韵》,在 vivo 线下体验店引发关注。该作品由vivo 出品、4K 花园承制,采用 8K 超高清分辨率和 180° 3D VR 沉浸视频方案,通过舞狮绣球串联六种传统文化技艺,实现沉浸式视觉体验,展示传统文化与现代科技的结合。《六艺传韵》成为国内首个标杆性的沉浸视频案例,体现了超高清 +VR+AI 技术在行业的创新落地。 vivo 与 4K 花园的合作基于双方在超高清和 VR 技术领域的长期积累和行业洞察。vivo Vision 头显具备轻量化设计、双目 8K 显示和自由手势交互三大核心特性。优质内容生态是用户体验的关键,双方选择以传统文化题材为核心,采用绣球串联不同技艺场景制作 8K VR 内容,以充分展现头显的色彩表现和清晰度,实现超常沉浸体验。在技术实现上,4K 花园通过 AI深度介入抠像和后期处理,提升制作效率和成片质量,并突破传统 VR 拍摄局限,采用动态镜头和复杂机位,实现沉浸式叙事表达。 该项目在技术整合和制作难度上均属行业高标准,同时注重内容创作与 技术结合,确保沉浸体验服务叙事表达。《六艺传韵》被视为阶段性成果,不仅为 vivo Vision 内容生态提供支撑,也为国内超高清沉浸影像行业积累经验和技术基础,推动未来更高规格创作的可能。 (信息来源:流媒体网 vv.lmtw.com) AIGC 3百度搜索旗下 AI 短剧生成平台开启公测 百度搜索宣布旗下 AI 短剧生成平台正式开启公测,并将通过亿元创作基金、百亿流量扶持及长期 IP 变现等方式,为创作者提供全方位支持。平台旨在降低创作门槛,推动短剧内容生产与创新。 百度介绍,该 AI 短剧生成平台支持自动生成与人机协作两种模式,可辅助创作者完成约 80% 的内容创作。创作者只需在 AI 生成内容基础上进行微调,即可快速产出高质量短剧,实现风格统一的批量生产,从而提升创作效率并降低制作成本。 此外,百度搜索将联合头部版权方提供丰富 IP 资源,帮助创作者解决版权问题,专注创作。对于精品和爆款内容,百度还将提供深度 IP 孵化和运营支持,为创作者提供多元化变现渠道,助力短剧产业的发展与生态建设。 (信息来源:百度网 baijiahao.baidu.com) 4国产视频生成模型实现分钟级多镜头长视频创作 中国科学技术大学与字节跳动联合发布一款端到端长视频生成模型。该模型可直接生成分钟级长度、480p 分辨率、24 帧 / 秒(fps)的高质量视频,并支持多镜头场景切换。这一成果标志着国产视频生成技术在全球生成式AI 竞争中实现了重要突破,显示出中国团队在长时视频生成领域的技术进展。 该 模 型 的 核 心 创 新 在 于 其 底 层 算 法 ——MoGA(Modular GlobalAttention),这是一种专为解决长视频生成中上下文扩展与算力开销问题设计的全新注意力机制。借助 MoGA 结构优化,模型可处理长达580Ktoken 的上下文信息,从而实现长时、多场景视频的高效生成。研究团队指出,传统模型受限于显存和计算量,通常只能生成几秒钟的视频片段,而 MoGA 的引入使生成具备多镜头切换与叙事连贯性的“迷你短片”成为可能。此外,MoGA 具备高度模块化与兼容性,可与 FlashAttention、 xFormers、DeepSpeed 等高效加速库集成,提升训练与推理速度。这一特性使其具备科研与产业双重价值。 MoGA 预计可广泛应用于影视创作、广告生成、游戏动画及数字人内容制作等领域。随着 OpenAI、Pika、Runway 等国际公司持续推动短视频生成,中国科大与字节跳动的该联合成果有望成为国内首个实现分钟级长视频生成的系统,推动中国在视频生成技术领域跻身全球领先行列。 (信息来源:人工智能基地网 news.aibase.com) 5百度文心助手升级,实现 AI 长视频实时交互生成 10 月 15 日,百度搜索正式宣布对其文心助手进行重大升级,显著增强了其 AIGC 多模态创作与智能任务解决能力。这次更新使得文心助手不仅能生成文字,还可以创造出包括 AI 图片、视频、音乐和播客在内的 8 种不同类型的内容,标志着 AI 创作领域的新纪元。数据显示,使用文心助手的用户每日生成的 AIGC 内容量已经突破千万大关。 本次升级中,百度还推出了行业首个开放式实时互动数字人智能体,具备高真实感的形象和低延迟的情感交互能力。这一新特性将为用户提供更专业的内容和陪伴服务,让人与 AI 的互动变得更加生动和亲切。该数字人可进行双向沉浸式互动,适用于导购、教育和陪伴等场景,而开放式则允许用户在 AI 生成的虚拟空间中自由探索,拓展了 AIGC 在现实和虚拟世界融合中的应用潜力。 用户体验方面,文心助手实现了从短内容到长视频的全覆盖。只需输入一句话,用户便能生成一部长达 3 分钟的剧情短片,AI 将自动完成情节设计、角色设定、场景搭建、镜头调度和配乐等整个过程。助手还集成了“一句话写歌”“MV 制作”等创意功能,提供超过 30 种特效模板,让创作变得更加轻松有趣。 在技术层面,百度自研的“蒸汽机”模型在 AI 视频实时交互生成方面首次突破 10 秒时长的限制,实现了“无限时长”生成。用户只需上传一张图片并输入提示词,便可以实时预览生成