您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国家广播电视总局广播电视规划院]:广电视听科技动态2025年第16期(总第57期) - 发现报告

广电视听科技动态2025年第16期(总第57期)

AI智能总结
查看更多
广电视听科技动态2025年第16期(总第57期)

AIGC Producer AI 发布突破性对话式音乐创作工具.............................................5Sketch-to-Video 让手绘草图秒变电影级视频...............................................5Runway 推出视频编辑大模型:一句话改变场景........................................6 A I 治理 网信办整治自媒体利用 AI 编造虚假信息....................................................7《中国人工智能安全承诺框架》发布..........................................................7欧盟发布通用人工智能模型提供商指南......................................................8 超高清 超高清“芒果模式”:新增内容中 4K 占比已超 70%...............................8多家主流平台均已支持“菁彩视听”技术..................................................9北京广电局推出超高清视听活动活化文化遗产.......................................10 传 输 中国移动首发 6G 小规模试验网.............................................................10 摘 要 A IGCArtificial Intelligence Generated Content Producer AI 发布突破性对话式音乐创作工具Producer AI 发布突破性对话式音乐创作工具 P5 该工具支持自然语言输入进行音乐创作,涵盖从旋律、歌词到整张 EP 专辑的生成,显著降低了音乐制作技术门槛。其基于FUZZ-2.0 模型,结合对话交互模式,让音乐创作更加直观灵活,特别适合非专业用户和内容创作者探索新创作形式。 Sketch-to-Video 让手绘草图秒变电影级视频Sketch-to-Video 让手绘草图秒变电影级视频 P5 该功能无需复杂提示词和后期软件,用户上传手绘草图即可生成1080p、5 秒电影级视频。这标志着 AI 视频生成从“提示词驱动”向“视觉驱动”与“创意驱动”转变,显著降低视频创作时间和成本,对中小制作单位与独立创作者具有现实意义。 Runway 推出视频编辑大模型:一句话改变场景Runway 推出视频编辑大模型:一句话改变场景 P6 美国 Runway 公司的新一代大模型 Aleph 通过深度整合上下文理解与先进视觉生成技术,用自然语言指令即可实现多样化的专业级视频编辑,能完成视频内容增删,环境氛围调整、艺术风格转换以及多视角画面生成等,为创作者提供灵活工具。 AI 治理AI Governance 网信办整治自媒体利用 AI 编造虚假信息网信办整治自媒体利用 AI 编造虚假信息 P7 7 月 24 日,网信办启动为期两个月的整治专项行动,特别点名利用 AI 生成技术编造虚假信息欺骗公众的问题,要求健全标注机制及强化违规处置,明确要求平台优化信息来源与 AI 生成内容标注功能。 《中国人工智能安全承诺框架》发布《中国人工智能安全承诺框架》发布 P7 该框架由中国信通院和中国人工智能产业发展联盟牵头制定,并于 7 月 26 日在上海发布,涵盖设置安全团队、开展模型测试、保障数据安全、提升基础设施安全、增强模型透明度等七大承诺。旨在通过产业自律保障 AI 安全。 欧盟发布通用人工智能模型提供商指南欧盟发布通用人工智能模型提供商指南 P8 为配合《人工智能法案》落地实施,欧盟于 2025 年 7 月发布该指南,明确定义通用人工智能模型为超过 10 的 23 次方浮点运算资源、具备生成语言、文本转图像或转视频能力的模型;明确了“提供商”与“投放市场”的定义框架;规定了在满足透明度要求的免费开源许可下发布模型的豁免条件。 摘 要 超高清Ultra high definition 超高清“芒果模式”:新增内容中 4K 占比已超 70%超高清“芒果模式”:新增内容中 4K 占比已超 70% P8 芒果 TV 自研基于中国标准的“双 Vivid”解决方案,具备从内容制作到终端播放的全链路超高清化的能力,其新增内容中超过70% 为 4K 格式。其自研云制播系统将超高清制作效率提升 3 倍、成本控制在高清制作的 1.2 倍。 多家主流平台均已支持“菁彩视听”技术多家主流平台均已支持“菁彩视听”技术 P9 “菁彩视听”技术包括 Audio Vivid 与 HDR Vivid。海思推出菁彩视听标准机顶盒;腾讯、优酷、爱奇艺等主流平台均已支持菁彩视听技术;车载 AudioVivid 内容破 500 万首;新疆广电推出“菁彩专区”。菁彩视听技术已实现在大屏端的规模化应用。 北京广电局推出超高清视听活动活化文化遗产北京广电局推出超高清视听活动活化文化遗产 P10 近期举办的“北京超高清视听·行!视听奇境”活动,通过高精度扫描重建等技术,将古建筑藻井等文化内容以超高清画质呈现。北京广电局发布“北京市十大超高清视听创新应用场景”,覆盖数字体验、文旅、车载、剧院等多行业,展现了超高清的广泛前景和影响。 传输 Transmission 中国移动首发 6G 小规模试验网中国移动首发 6G 小规模试验网 P10 中国移动主导 4 项国家级 6G 重大专项,已形成 10 项关键技术成果,并全球首发 6G 小规模试验网,在全国部署 10 个基站进行验证。中国移动还是全球 5G 引领者,拥有 240 万个 5G 基站,占全球三成,牵头制定 300 余项国际 5G 标准。 A I GC 1Producer AI 发布突破性对话式音乐创作工具 近 日, 美 国 Producer AI 团 队 发 布 了 其 全 新 对 话 式 音 乐 创 作 工 具“Producer”。该工具以对话交互形式进行音乐创作,用户通过自然语言与其进行沟通,可完成从旋律、歌词到整张 EP 专辑的全流程创作,其还能学习乐器演奏技巧,探索音乐风格组合等,显著降低了音乐制作的技术门槛。 Producer 的核心技术支撑为升级版的音乐生成模型 FUZZ-2.0,相比早期版本,其在多乐器处理、声音合成和风格适配能力上实现了全面提升,能够生成高保真的音频内容。FUZZ-2.0 支持从基础旋律构思到复杂音频层次的细节编排,适用于不同音乐水平的创作者。此外,FUZZ-2.0 还具备根据用户指令生成个性化音乐风格的能力。依托这一模型,Producer 实现了对话式创作模式,让音乐创作过程更加直观灵活,特别适合非专业用户和内容创作者探索新的创作形式,提升音乐制作效率。 目前,Producer 已向 Riffusion 现有用户开放直接访问,并向新用户提供了 1000 条限量邀请码。平台不仅提供音乐生成工具,还搭建了创作社区,鼓励用户分享作品和经验,形成用户之间的协作与反馈机制。从长远来看,Producer 的发布预示着 AI 音乐工具将进一步推动音乐创作的民主化,为音乐产业引入更多样化的创作路径与参与主体。 (信息来源 :AI 基地网 news.aibase.com) 2Sketch-to-Video 让手绘草图秒变电影级视频 加拿大深度学习技术开发商 Moonvalley 公司近日 推 出 其 Marey 视 频生 成 模 型 的 新 功 能“Sketch-to-Video”,允许用户通过简单的手绘草图和文字提示生成 1080p 分辨率、24 帧 / 秒、最长 5 秒的视频片段。 该功能旨在降低视频创作门槛,为影视制作、广告原型开发及独立创作提供更高效的解决方案。用户无需掌握复杂的生成提示词或后期软件操作,仅通过可视化草图输入即可实现创意表达。这标志着 AI 视频生成从传统“提示词驱动”向“视觉驱动”与“创意驱动”转变。 Sketch-to-Video 功能由 Marey 模型提供技术支持。该模型使用经授权的高清视频素材进行训练,避免版权争议,已被应用于 HBO 纪录片等实际项目中。该模型控制能力较强,支持通过“镜头控制”和“运动控制”实现对虚拟摄像机运动与物体轨迹的精细调节,提升内容表现的真实性和连续性。据反馈,该模型生成的视频细节表现力高,动作流畅,具备商业可用性。Moonvalley 还通过与平台如 Vimeo 的合作,确保训练数据的多样性与合法性,为模型质量和合规性提供保障。 该功能的上线显著降低了视频内容生产的时间与成本,尤其对中小制作单位与独立创作者具有现实意义。据行业估算,使用 Marey 模型可将制作成本降低约 40%。Moonvalley 计划在未来推出更多高级控制功能及角色素材库,并正在测试整合全功能的创作平台“Voyager”。此次产品迭代强化了 Moonvalley 在生成式视频 AI 领域的技术布局,也为全球影视创作带来了更加多元化、可持续的发展路径。 (信息来源:AI 基地网 news.aibase.com) 3Runway 推出视频编辑大模型:一句话改变场景 近日,美国 Runway 公司推出的全新视频编辑大模型 Aleph,以自然语言指令实现多样化视频编辑,为创作者提供灵活工具。据项目官网介绍,Aleph 支持通过文字增删内容,如消除玻璃反光、背景杂物;可改变环境氛围,如将晴天转雨天、白天变夜景;能转换风格为卡通或油画且保持视觉一致;还能保留原视频相机运动生成新视角,并具备绿幕抠像和光照优化功能。无专业经验的用户也能通过简单描述实现专业级效果。 Aleph 的核心优势源于上下文理解与视觉生成技术的深度整合。其采用的先进 AI 算法能够理解用户输入的文本指令,并智能匹配到视频内容进行修改,例如输入“将背景改为雪景并添加飞鸟”,算法能生成对应画面且保持人物、物体等核心元素的连续性。此外,该模型支持从单段输入视频生成多视角内容,这对影视制作和虚拟场景构建尤为实用。与 Runway 此前的 Gen-3 alpha 模型相比,Aleph 在处理复杂场景和动态物体时表现出更高的稳定性与一致性,无需逐帧调整或复杂参数设置,大幅降低了操作门槛。 目前,Aleph 已向 Runway 的付费用户和企业用户开放,未来有望通过 免费试用扩大用户群体。业内分析认为,Aleph 的发布为短视频创作者、电影制作人提供了便利,也为广告营销、虚拟现实内容开发等行业带来新的可能性。步加速行业的技术创新。 (信息来源:AI 基地网 www.aibase.com) A I 治理 4网信办整治自媒体利用 AI 编造虚假信息 为持续深入整治自媒体发布不实信息乱象,进一步规范自媒体信息发布行为,中央网信办自 2025 年 7 月 24 日起,在全国范围内启动为期 2 个月的“清朗·整治‘自媒体’发布不实信息”专项行动。此次整治覆盖各省、自治区、直辖市及新疆生产建设兵团,目标是通过技术治理与平台管理并行的方式,规范内容发布行为,提升网络信息传播的真实性和可靠性。 专项行动聚焦四个主要问题:“恶意蹭炒误导公众问题”“多种手段歪曲事实问题”“不做标注以假乱真问题”和“专业领域信息不实问题”。其中 , 对应“多种手段歪曲事实问题”,通知提及了利用人工智能(AI)生成合成技术,仿冒他人或编造社会民生等领域虚假信息,欺骗公众的问题。 为落实治理成效,中央网信办要求加强组织引导,健全标注机制,完善资质认证,强化违规处置。其中,网信办明确要求平台切实优化信息来源标注、AI 生成合成内容标识等功能设置,在信息发布流程的显著位置提供标