您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国家广播电视总局广播电视规划院]:广电视科科技动态 - 发现报告

广电视科科技动态

AI智能总结
查看更多
广电视科科技动态

目录 A IArtificial Intelligence OpenAI 正式发布 AI 视频生成模型 Sora..........................................................05AI 图像工具支持人物与背景的精准分离与融合.............................................05英伟达展示可文字生成音乐、转换音频的 AI 模型........................................06腾讯混元大模型上线文生视频功能并全面开源.............................................06 传输 高通成功试验卫星向智能手机推送 5G 广播服务...........................................06联通 & 华为启用全球首个 5G-A 规模立体智慧网....................................07AI 在 6G 系统中的应用使通信速度提升 18%..................................................07 终 端Terminals and Applications 亚马逊推出融合 AI 的 Omni Mini-LED 智能电视............................................08 业务与应用Terminals and Applications 美国 Comcast 宣布拆分大部分有线电视业务..................................................09 摘 要 A IArtificial Intelligence OpenAI 正式发布 AI 视频生成模型 SoraOpenAI 正式发布 AI 视频生成模型 Sora P05 12 月 10 日,OpenAI 宣布正式开放 AI 视频生成模型 Sora。新版Sora Turbo 具备更强大的视频生成能力,可以生成 1080p、最长 20 秒的视频,还可进行故事板剪辑、场景混合和视频扩展。OpenAI 视 Sora 为通往 AGI 之路的重要里程碑。 AI 图像工具支持人物与背景的精准分离与融合AI 图像工具支持人物与背景的精准分离与融合 P05 挪威 Pixotope 公司推出 AI 驱动的图像背景分离工具,能精准分离图像中的人物与背景,并深度融合虚拟元素与现实世界,有望取代传统的绿幕、抠像等技术,推动虚拟演播制作技术发展。 英伟达展示可文字生成音乐、转换音频的 AI 模型英伟达展示可文字生成音乐、转换音频的 AI 模型 P06 英伟达近日展示了生成式 AI 模型 Fugatto,能够基于文字生成音乐,或对上传的音频进行独特的音效处理。为防止生成式 AI 被不当使用等风险,英伟达暂未公开发布该模型。 腾讯混元大模型上线文生视频功能并全面开源腾讯混元大模型上线文生视频功能并全面开源 P06 腾讯混元大模型上线文生视频功能,参数量达 130 亿,是目前最大的视频生成开源模型。该模型支持中英文双语输入、多种视频尺寸以及多种视频清晰度,用户无需从零开始训练,即可直接应用于推理,创建个性化的应用和服务。 传输Transmission 高通成功试验卫星向智能手机推送 5G 广播服务高通成功试验卫星向智能手机推送 5G 广播服务 P06 10 月,高通与新加坡 Astrum Mobile 完成全球首个地球同步轨道卫星向智能手机推送 5G 广播服务试验,实现了电视直播、OTT 热点内容推送和应急广播等多项业务,验证了 5G NTN 的技术可行性。 摘 要 联通 & 华为启用全球首个 5G-A 规模立体智慧网联通 & 华为启用全球首个 5G-A 规模立体智慧网 P07 北京联通与华为开启 5G-A 规模立体智慧网,实现北京核心区域覆盖,5G-A 生效比超 85%。其中在北京工体的网络下行速率达11.2Gbps,可满足工体 6.8 万观众同时流畅观看 1080p 高清视频。 AI 在 6G 系统中的应用使通信速度提升 18%AI 在 6G 系统中的应用使通信速度提升 18% P17 日本 NTT Docomo 联合多公司完成日本首次 6G 无线系统应用AI 技术的测试,在 4.8GHz 频段室内环境中将通信速度提升了18%。6G+AI 技术有望为各种复杂的传播环境优化调制和解调方案,全面提升无线传输的质量。 终端 Terminals 亚马逊推出融合 AI 的 Omni Mini-LED 智能电视亚马逊推出融合 AI 的 Omni Mini-LED 智能电视 P08 亚马逊推出全新 Omni Mini-LED 系列智能电视,将 AI 技术与硬件结合,带来提升视觉和互动体验的创新功能,包括使用智能图像技术实现画质优化,引入生成式 AI 工具进行视频内容概括等。 业务与应用Terminals 美国 Comcast 宣布拆分大部分有线电视业务美国 Comcast 宣布拆分大部分有线电视业务 P09 Comcast 宣布将拆分其大部分有线电视资产,重新组合为提供多样化内容的独立公司,同时整合 NBC Universal 的部分广播、影视和流媒体资产。此举以应对媒体环境变化并推动其收入增长。 A I 1OpenAI 正式发布 AI 视频生成模型 Sora 12 月 10 日,OpenAI 公司宣布视频生成模型 Sora 将正式向用户开放。相较于 2 月的预览版 Sora,新版本 Sora Turbo 具备更强大的视频生成能力。 Sora Turbo 可以生成 1080p、最长 20 秒的视频,支持横屏(16:9)、正方形(1:1)和竖屏(9:16)多种常见比例,并且可以对生成的视频进行Remix(重混)、Re-cut(重新切割)、混合、故事板剪辑、风格预设等操作。无论是生成包含多个角色、特定运动类型以及主题精确、背景细节复杂的场景,还是创造出生动的角色表情和复杂的运镜,Sora 都能够轻松应对。此外,Sora 还具备从静态图像生成视频的能力,能够将现有的静态图像准确地动画化,或者扩展现有视频,填补视频中的缺失帧。 据介绍,Sora 还支持社区分享功能,用户生成的视频可以分享至社区,也可以在社区看到、搜索或再创作其他用户分享的视频。OpenAI 表示,Sora 对于 OpenAI 而言,不仅仅是一个视频生成工具,更是通往 AGI(通用人工智能)之路的重要里程碑。 (信息来源:网易科技 www.163.com) 2AI 图像工具支持人物与背景的精准分离与融合 近日,挪威科技公司 Pixotope 推出了 AI 驱动的图像背景分离工具Pixotope Reveal。该工具能够从任何背景中精准分离出人物形象,并与2D 和 3D 图形无缝集成,还能结合人物追踪技术,实现虚拟元素与现实世界的自然融合。该工具的推出有望使内容制作摆脱对传统绿幕技术及手动动态抠像的依赖,显著提升制作效率。 Pixotope Reveal 改变了新闻与体育节目制作中的现场图形处理方式。在新闻领域,该工具使主播能够与投票数据、气象信息图形和财务图表等进行自然的互动。在体育转播中,实时统计和分析可以无缝集成到现场画面中,实现运动员数据融入于物理空间中的效果,而不仅仅是简单地叠加在屏幕上。此外,该工具支持处理超过 20 人的场景,并保持超高清分辨率和每秒 60 帧的实时性能,适用于多主持人节目和动态新闻讨论等场景。该工具还能够将虚拟广告无缝融入图像中,在确保观众观看体验的同时为赞助商提供更多的曝光机会。该工具或将成为广播公司的优先选择,逐步取代传统色度键控技术,推动虚拟演播室制作迈向新高度。 (信息来源:电视新闻观察 tvnewscheck.com) 3英伟达展示可文字生成音乐、转换音频的 AI 模型 近日,英伟达展示了一款为音乐、电影和游戏音频制作领域设计的新型AI 模型 Fugatto。该模型能够根据文字提示生成音乐或音频,可创造出独特的音效,例如让乐器发出非传统的声音。此外,Fugatto 还具备音频处理能力,如将钢琴旋律转化为人声演唱、调整录音中的口音和情感等。 随着生成式 AI 技术的快速发展,如何防止其被不当使用已成为一个关键问题。此前,OpenAI 因模仿好莱坞明星斯嘉丽·约翰逊的声音而陷入争议,导致科技界与好莱坞的关系趋紧。英伟达表示,Fugatto 基于开源数据进行训练,但考虑到生成式技术有可能被用于制造虚假信息或侵犯版权,他们决定暂时不公开发布该模型。当前,生成式 AI 的开发者们正积极寻找防止技术滥用的方法,以避免版权侵权等潜在风险。 (信息来源:网易科技网 www.163.com) 4腾讯混元大模型上线文生视频功能并全面开源 12 月 3 日,腾讯混元大模型正式上线文生视频功能,这是其继文生文、文生图及 3D 生成后又一重大突破,用户只需要输入一段描述,即可生成视频。腾讯称,该大模型参数量高达 130 亿,是目前最大的视频生成开源模型。 腾讯混元大模型视频生成功能支持中英文双语输入、多种视频尺寸以及多种视频清晰度。该模型已上线腾讯元宝 APP,并向个人和企业用户开放试用申请。腾讯已在 Hugging Face 和 GitHub 平台发布该模型的完整资源,包括算法代码和模型权重,开发者和企业均可免费使用。基于该开源模型,使用者无需从零训练即可直接用于推理,并可基于腾讯混元系列打造专属应用及服务,能够节约大量人力及算力,加速行业创新。 自年初以来,腾讯混元已经开源了旗下文生文、文生图及 3D 生成大模型。至此,腾讯混元系列已全面开源。 (信息来源:上海证券报微信公众号) 传 输 5高通成功试验卫星向智能手机推送 5G 广播服务 近日,高通与位于新加坡的亚太地区卫星直连终端广播公司 AstrumMobile 联合宣布,成功完成了全球首个通过地球同步轨道卫星向个人智能手机推送 5G 广播服务的试验,验证了 5G 非地面网络(NTN)技术的可行性。 此次试验于 2024 年 10 月进行,使用了覆盖亚太地区的 AsiaStar 卫星, 全面展示了由 3GPP 规范定义的 5G 广播功能(ETSI TS 103 720)的实际应用潜力。试验内容包括电视直播、游戏直播、OTT 热点内容推送和应急广播等多项业务,试验覆盖了车载、海上以及随时随地服务等各种移动服务使用场景,验证了通过地球同步轨道卫星直接向智能手机提供 5G 广播服务的可行性。 此次试验为 5G 与卫星广播的融合提供了关键验证,标志着移动通信行业取得了重大进展。AstrumMobile 的高功率地球同步轨道卫星将利用 L 波段频谱直接向亚太地区的移动设备传送丰富的媒体内容。作为 5G 非地面网络的一部分,基于卫星的 5G 广播将改变向移动手机传输大容量媒体内容的方式,使其在全球范围内更易获取且更具成本效益。 (信息来源:宽带电视网 www.broadbandtvnews.com) 6联通 & 华为启用全球首个 5G-A 规模立体智慧网 近日,北京联通与华为在“5G Capital 路上见——5G-A 全城点亮”活动上,宣布全球首个 5G-A 规模立体智慧网正式投入使用。这一网络覆盖北京四环内及城市副中心等核心区域,5G-A 生效比超过 85%,为沉浸式视频、超高清直播、云游戏等业务提供了卓越的网络支撑能力。 该 5G-A 网络基于超大规模商用 5G-A 3CC 网络构建,覆盖了体育场馆、学校、景区等多个重点场景。其中,在北京工人体育场通过高低频组网技术,实现了全球最“厚”的 5G-A 万兆协同组网,打造了全球领先的 5G-A 立体组网超级网络。实测数据显示,该网络下行峰值速率高达 11.2Gbps,上行