行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

科技动态2023年第6期(总第6期)

2024-08-05 - Amdocs Daisy.Aldrich

未来电视

ITU-R SG6 审议通过《未来广播电视展望》报告书，提出2024年及以后广播电视新系统、技术和应用的未来发展框架，涵盖未来用户体验、未来媒体制作和未来广播电视分发三个部分。未来用户体验将提供个性化媒体体验，包括语音唤醒、数字助理和触觉交互等选项，并强调沉浸式体验、增强的图像和声音质量以及虚拟社区的重要性。未来媒体制作将需要生产更具真实感的内容，并为内容的个性化和交互性提供选项。未来广播电视分发将不断发展，以适应新的媒体形式和用户体验。

AI

谷歌发布全球最大视觉语言模型PaLM-E，参数量达5620亿，能够将视觉和语言集成到机器人控制中。Meta AI工具坚持非商务性授权和有限性开放，向特定群体提供AI工具的非商务授权，以帮助评估和改进模型。英特尔发布识别深度伪造（AI换脸）的检测工具FakeCatcher，通过光密度测量法检测视频中是否存在AI换脸的情况。智源研究院开源AI生成内容（AIGC）新模型AltDiffusion，实现“中国风”AI作图。科学家研发算法实现弱光条件下快速高质量成像，VEViD算法能以每秒超过200帧的速度增强4K分辨率的视频。

制作

摄像机引入元数据标记，助力现场拍摄效率优化，索尼摄像机自动将元数据附加到所拍摄的视频上，并立即将视频内容代理文件和元数据标记传送到新闻编辑室的Avid系统。报新闻、能采访、会唱歌的全国两会AI主播齐上阵，如央视《中国神气局》的小C、中国日报《元曦跑两会》的元曦等，为两会报道注入科技“创新力”。英特尔发布识别深度伪造（AI换脸）的检测工具FakeCatcher，通过光密度测量法检测视频中是否存在AI换脸的情况。AI生成内容（AIGC）新模型实现“中国风”AI作图，智源研究院开源最新AI生成内容（AIGC）中英双语AltDiffusion模型，更懂中文，产出真正具有“中国风”的画面。科学家研发算法实现弱光条件下快速高质量成像，美国加州大学洛杉矶分校科学家团队研发了一种视觉增强算法VEViD，能以每秒超过200帧的速度增强4K分辨率的视频。

传输

Ofcom在英国开放毫米波频谱用于移动业务，决定在26GHz和40GHz频段为包括5G在内的移动业务提供超过6GHz的毫米波无线电频谱，以提高无线数据容量和速度。

终端

国内首块1200平米8K裸眼3D户外大屏正式启用，由4K花园独家运营的国内首块1200平米8K裸眼3D户外大屏——“8K春天”在广州北京路大厦外墙正式启动，投入商用。LG推出业界首款高分辨率可拉伸显示屏，全球首款12英寸高分辨率可拉伸显示屏，实现20%可拉伸、100PPI分辨率和全彩色RGB显示。

数据安全

TikTok推出“三叶草计划”以保障用户数据安全，拟将目前存储在新加坡和美国的欧洲用户数据转移到年度总投资额达12亿欧元的三个欧洲数据中心。

业务

YouTube将短视频业务向大屏迁移，YouTube分享其设计过程，如当短视频在传统播放器中显示时，进行专门定制以更好地填补视频两侧的空白，或采用“Jukebox”风格让多个短片同时填充屏幕。百度数字人入驻快手，将开启24小时AI直播，百度数字人家族集体入驻快手，在百度智能云曦灵平台的技术支撑下，百度数字人家族形象逼真，并具备作画、作诗、写小说、写歌词等智能创作能力，后续还将开启24小时AI直播。世界杯收视预测报告反映多元化收视需求，Amdocs发布的2022年世界杯收视预测报告显示，73%的观众计划在公共电视直播中观看世界杯，44%的千禧一代和38%的Z世代选择流媒体观看比赛。48%的人表示愿意支付无限制的世界杯专用移动数据套餐，以获得无延迟和无连接中断的5G直播比赛体验。观众表达了对更多互动体验的渴望，30%的观众期待360度赛事直播视频，24%的观众渴望体验互动赛事挑战和AR/VR，超过62%的观众表示有兴趣在元宇宙虚拟球场中与其他球迷一起观看体育赛事。

制作FutureTV未来电视 ITU-RSG6 审议通过《未来广播电视展望》报告书.............................07 谷歌发布全球最大视觉语言模型PaLM-E..................................................08MetaAI 工具坚持非商务性授权和有限性开放......................................08 制作摄像机引入元数据标记，助力现场拍摄效率优化................................09报新闻、能采访、会唱歌的全国两会 AI 主播齐上阵..........................09英特尔发布识别深度伪造（AI 换脸）的检测工具...............................10AI 生成内容（AIGC）新模型实现“中国风”AI 作图...........................10科学家研发算法实现弱光条件下快速高质量成像................................11 传输 Transmission Ofcom 在英国开放毫米波频谱用于移动业务............................................11 终端Terminal 国内首块 1200 平米 8K 裸眼 3D 户外大屏正式启用................................12LG 推出业界首款高分辨率可拉伸显示屏.................................................12 制作 TikTok 推出“三叶草计划”以保障用户数据安全..................................13 制作 YouTube 将短视频业务向大屏迁移.............................................................13百度数字人入驻快手，将开启 24 小时 AI 直播........................................14世界杯收视预测报告反映多元化收视需求................................................15 摘要未来电视FutureTV ITU-R SG6 审议通过《未来广播电视展望》报告书ITU-R SG6 审议通过《未来广播电视展望》报告书 2023 年 3 月 ITU-R SG6 会议审议通过《未来广播电视展望》报告书。该报告提出了 2024 年及以后广播电视新系统、技术和应用的未来发展框架，包括未来用户体验、未来媒体制作和未来广播电视分发三个部分。 AIArtificialIntelligence 谷歌发布全球最大视觉语言模型 PaLM-E谷歌发布全球最大视觉语言模型 PaLM-E P08 谷歌和德国柏林工业大学的研究人员公布全球最大的多模态具身视觉语言模型 PaLM-E，参数量达 5620 亿。该模型将视觉和语言集成到机器人控制中，使得机器人能够分析视觉数据并执行高级命令。 Meta AI 工具坚持非商务性授权和有限性开放Meta AI 工具坚持非商务性授权和有限性开放 Meta 最新的大型语言模型 LLaMA 遭到用户泄露，但 Meta 表示会继续向特定群体通过审查并获得核准的研究人员提供该 AI 工具的非商务授权，让他们帮助 Meta 评估改进模型。制作Production 摄像机引入元数据标记，助力现场拍摄效率优化摄像机引入元数据标记，助力现场拍摄效率优化 Sinclair、Sony 和 Avid 公司合作了一项实验，摄像机自动将元数据标记实时插入到现场拍摄的视频中，并将附加元数据标记的内容直接发送回新闻编辑室，提高新闻摄像处理工作效率。 P09 报新闻、能采访、会唱歌的全国两会 AI 主播齐上阵报新闻、能采访、会唱歌的全国两会 AI 主播齐上阵谷歌研究院的研究人员提出基于文本条件视频扩散模型的视频编辑新方法 Dreamix，可根据文本描述和输入视频 / 图片生成新的视频，从而实现智能化编辑视频内容的目标。 P09 摘要英特尔发布识别深度伪造（AI 换脸）的检测工具英特尔发布识别深度伪造（AI 换脸）的检测工具 P10 英特尔发布名为 FakeCatcher 的深度伪造（Deepfake）检测工具，能够通过光密度测量法（PPG）检测血流产生的血管颜色微妙变化来实时判断视频中是否存在 AI 换脸的情况。 AI 生成内容（AIGC）新模型实现“中国风”AI 作图AI 生成内容（AIGC）新模型实现“中国风”AI 作图智源研究院大模型研究团队开源最新人工智能生成内容（AIGC）中英双语 AltDiffusion 模型，该模型更懂中文，能够迅速理解中文创作者意图，产出真正具有“中国风”的画面。科学家研发算法实现弱光条件下快速高质量成像科学家研发算法实现弱光条件下快速高质量成像 P11 美国加州大学洛杉矶分校科学家团队研发了一种视觉增强算法VEViD，该算法在弱光照下的图像增强能力出色，能以每秒超过200 帧的速度增强 4K 分辨率的视频，在安全摄像头、夜间驾驶和太空探索等多种成像应用中有高性能表现。传输Transmission Ofcom 在英国开放毫米波频谱用于移动业务Ofcom 在英国开放毫米波频谱用于移动业务 P11 英国通信监管机构 Ofcom 决定在 26GHz 和 40GHz 频段为包括5G 在内的移动业务提供超过 6GHz 的毫米波频谱，以提高移动服务的数据容量和速度，鼓励开发需要大量数据和极高网速的创新服务。终端Terminal 国内首块 1200 平米 8K 裸眼 3D 户外大屏正式启用国内首块 1200 平米 8K 裸眼 3D 户外大屏正式启用 P12 国内首块 1200 平米 8K 裸眼 3D 户外大屏“8K 春天”在广州市北京路正式启动。户外大屏是目前 8K 内容的最佳应用场景，通过融合“5G+8K+ 裸眼 3D+AI”等技术和艺术的创新应用，能够最大化激活传统户外 LED 产业的社会效应与传播价值。 LG 推出业界首款高分辨率可拉伸显示屏LG 推出业界首款高分辨率可拉伸显示屏 P12 LG 发布了 12 英寸高分辨率可拉伸显示屏，作为首款实现了20% 可拉伸、100PPI 分辨率和全彩色 RGB 显示屏，可以轻松地附着在皮肤、服装、家具、汽车和飞机等曲面上，在时尚、可穿戴设备、移动设备和游戏等领域具备应用潜力。摘要数据安全DataSecurity TikTok 推出“三叶草计划”以保障用户数据安全TikTok 推出“三叶草计划”以保障用户数据安全 P13 抖音海外版 TikTok 推出“三叶草计划”，拟将目前存储在新加坡和美国的欧洲用户数据转移到年度总投资额达 12 亿欧元的三个欧洲数据中心，以保障欧洲用户数据安全。业务Business YouTube 将短视频业务向大屏迁移YouTube 将短视频业务向大屏迁移谷歌宣布 YouTube 上的短视频服务 YouTube Shorts 将向大屏端迁移。随着短视频在移动端的逐渐成熟，包括抖音、快手、B 站在内，越来越多的国内外短视频平台相继在大屏P13 百度数字人入驻快手，将开启 24 小时 AI 直播百度数字人入驻快手，将开启 24 小时 AI 直播 P14 百度数字人家族集体入驻快手，在百度智能云曦灵平台的技术支撑下，百度数字人家族形象逼真，并具备作画、作诗、写小说、写歌词等智能创作能力，后续还将开启 24 小时 AI 直播，深入探索数字人短视频内容。世界杯收视预测报告反映多元化收视需求世界杯收视预测报告反映多元化收视需求 P15 Amdocs 发布的 2022 年世界杯收视预测报告显示，虽然 73% 的观众计划在公共电视直播中观看世界杯，但 44% 的千禧一代和38% 的 Z 世代选择流媒体观看比赛。48% 的人为观看世界杯愿意为有保障的 5G 连接和访问付费。观众表达了对互动赛事挑战、AR/VR 等体验的渴望，超过 62% 的观众表示有兴趣在元宇宙虚未来电视 1ITU-R SG6 审议通过《未来广播电视展望》报告书在 2023 年 3 月的 ITU-R SG6 会议上，未来广播电视展望报告小组（RG-FOB）提交了《未来广播电视展望》报告书草案，并获得 ITU-R SG6审议通过。这是一份关于广播电视技术发展的报告，提出了 2024 年及以后广播电视新系统、技术和应用的未来发展框架，并指出媒体技术的发展正在改变广播电视媒体用户的期望，而用户的期望正在重塑传统的广播电视理念。报告分为三个部分：未来用户体验、未来媒体制作和未来广播电视分发。未来用户体验：未来基于用户体验的广播电视技术发展将为个性化媒体体验提供越来越多的选择，包括使用语音唤醒、数字助理和触觉交互。这些选项可以由用户选择，也可以由本地环境或用户需求自动触发。沉浸式的体验、增强的图像和声音质量提升了真实感。此外，通过将现实或传统媒体世界与数字化的虚拟世界相结合，可以创造更新的体验。虚拟社区可以在数字化创建的虚拟世界中聚集公共的内容。未来广播电视内容和技术将提供更强的真实感。加上媒体个性化和互动的额外选项，围绕公共内容聚集的虚拟社区用户体验将大大加强。未来媒体制作：内容通过多种分发路径触达最终用户，这通常需要不同的技术格式或编辑版本，并通过提供不同级别用户选项或服务的平台触达最终用户。广播和电视内容通常由多个组织联合制作，这增加了现场节目、预录制节目和非现场后期制作或打包节目工作流程的复杂性。广播电视内容创作者非常清楚，他们正在与众多其他娱乐和信息服务（包括游戏、社交媒体和用户生成的内容）竞争，并且意识到单一固定版本的节目在商业上不再可行。未来的媒体制作将需要通过生产更具真实感的内容来迎合用户喜好，并为内容的个性化和交互性提供选项。未来广播电视分发：媒体分发系统位于广播电视公司的内容和用户接收设备之间，包括用于将便携式设备连接到网络集线器的家庭媒体分发系统。目前，世界各地有众多不同的媒体分发系统，新的媒体分发系统和技术改进不时被引入。地面电视广播是向家庭分发媒体的最初形式，大多数国家都部署了大规模的地面电视广播网络来覆盖其人口。地面电视广播的重要性源于其独特的特性，即允许将本地、区域、国家和国际内容免费传输给无限数量的用户，频谱和能源效率高。随着技术的发展和媒体消费习惯的改变，地面电视广播必须不断发展，分发新的媒体形式，并提供新的用户体验。注：未来广播电视展望报告小组（RG-FOB）后续还将对《未来广播电视展望》报告书进行持续更新和完善。（信息来源：国际电信联盟 www.itu.int） AI 2谷歌发布全球最大视觉语言模型 PaLM-E 3 月 6 日，来自谷歌和德国柏林工业大学的研究人员公布了视觉语言模型 PaLM-E（全称 Pathways Language Model with Embodied），其参数量高达 5620 亿（GPT-3 的参数量为 1750 亿），可以在不需要再训练的情况下执行各种任务。作为迄今为止最大规模的多模态具身视觉语言模型（VLM），PaLM-E 通过添加感官信息和机器人控制使大型语言模型PaLM“具体化”，能够将视觉和语言集成到机器人控制中。由于 PaLM-E 是基于语言的模型，所以它会连续观察图像或传感器数据，并将其编码成与语言符号大小相同的向量序列，这使得模型能够以处理语言的相同方式“理解”感官信息。以这样的方式，PaLM-E 通过分析来自机器人摄像头的数据来实现对

点击免费查看完整报告

科技动态2023年第6期(总第6期)

未来电视

AI

制作

传输

终端

数据安全

业务

你可能感兴趣

科技动态2024年第6期（总第33期）

广电视听科技动态2026年第6期（总第73期）

科技动态2023年第26期（总第26期）

科技动态2023年第27期（总第27期）

科技动态2023年第8期(总第8期)

科技动态2023年第3期(总第3期)

科技动态2023年第18期(总第18期)

科技动态2023年第20期（总第20期）

科技动态2023年第24期（总第24期）

科技动态2023年第15期(总第15期)