行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

科技动态2023年第16期(总第16期)

2024-08-05 - ABP 等待花开

制作

新壹科技发布 AIGC 视频垂直大模型：新壹科技发布“新壹视频大模型”，具备多模态感知、实时学习、自迭代及多场景交叉推理能力，实现 AI 全流程视频生产。基于该模型的产品“秒祝”可在 3-5 分钟内生成以明星数字人为主角的个性化定制祝福视频。
华为云推出盘古数字人通用大模型：华为云将推出盘古数字人大模型，帮助用户在 12 小时内完成数字人生成，提供个性化数字人体验。该模型基于盘古基础大模型，使用 PB 级音视频数据训练而成，包含数字人形象、动作、表情、口型、声音等要素，支持个性化定制。
咪咕智能字幕打造无障碍观赛新模式：中国移动咪咕智能字幕在女足世界杯和成都大运会中创新升级，支持特色方言解说，字幕准确率达 92%，提升用户无障碍观赛体验并促进方言文化传播。
法国 Newsbridge 专利 AI 视频索引技术将推新功能：法国 Newsbridge 公司将推出其专利 AI 视频索引技术 MXT-1 的新功能，支持快速生成多语种的富媒体摘要，聚焦视频亮点，帮助广播公司快速找到特定片段，加快媒体制作流程。
佳能携手 Balus 实现真实和虚拟艺人跨维同台演绎：佳能与 Balus 合作，利用体积视频技术和虚拟直播技术，成功实现真实艺人和虚拟歌手在同一个 CG 空间中同台演绎，打造高度沉浸式的现场音乐体验。
苹果、英伟达等成立联盟，制定 3D 建模标准：苹果、英伟达、皮克斯、Adobe 和 Autodesk 联合成立 OpenUSD 联盟，旨在推动 3D 生态系统标准化，使 AR、VR 项目中使用的 3D 对象和环境信息得以共享。
CastLabs 公司推出全新视频单帧取证水印技术：CastLabs 公司推出单帧取证水印技术，使用户能够仅从单个视频帧的图像中提取隐藏数据，为内容所有者和权利持有者提供有效的安全保护。

传输

Fastweb 采用开放式缓存解决方案增强流媒体体验：思科、Qwilt 与意大利电信运营商 Fastweb 合作，推出基于开放缓存的联合 CDN 解决方案，将内容缓存和交付推至 Fastweb 固定和移动网络的最边缘，将平均延迟降低 60%。
成都大运会实现国内首次“无压缩 8K 超高清赛事视频”实时无线传输：在成都大运会田径比赛中，电子科技大学太赫兹通信团队成功开展了“无压缩 8K 超高清赛事视频”实时无线传输应用验证，实时业务速率为 48Gbps，传输距离为 200 米。
英国将资助 1.6 亿英镑用于近地轨道连接计划：英国宣布将资助 1.6 亿英镑用于近地轨道连接计划，旨在以近地轨道卫星通信技术解决英国 5G 和宽带的全面覆盖问题，改善英国的通信基础，缩小偏远农村和核心城市的通信连接差距。

终端与应用

智能电视正成为美国家庭娱乐中心：美国约四分之三的家庭拥有智能电视，约三分之二的家庭使用智能电视来播放流媒体视频。智能电视的拥有量和观看使用量的双重增长，表明智能电视正在成为美国家庭娱乐的中心。
Antilatency 推出旨在提升 XR 体验的新型 3D 显示器：Antilatency 公司推出“Illummetry IO”3D 显示设备，能够在平面上呈现逼真的 3D 物体，通过全息图提供多角度查看和交互式操作，重新定义 XR 体验。
影音进入便携大屏时代：首款谷歌认证的 AR 便携式 Android TV 设备发布：Rokid 发布 Rokid Station（全球版），全球第一个经过谷歌认证的 AR 便携式 Android TV 设备，搭配 AR 眼镜，可将影像画面呈现在观感 6 米外 215 寸的超大屏幕上。
河北 IPTV 整合中医药专业资源开设中医专区：河北广电无线传媒在 IPTV“健康万家”平台上设立“燕赵中医药”专区，整合了中医药领域各专业资源，打造了全国 IPTV 领域首个包含视频、中医问诊、中医药资源商城的中医专区。
数据报告：2023 年 73% 的广告商正在使用可寻址广告：2023 年，73% 的广告商正在使用可寻址广告，相比于 2022 年的 63% 提升了 16%，广告行业对寻址广告的采用呈现显著增长趋势。

制作新壹科技发布国内领先的 AIGC 视频垂直大模型................................07华为云推出盘古数字人通用大模型.............................................................07咪咕智能字幕打造无障碍观赛新模式........................................................08法国Newsbridge专利AI视频索引技术将推新功能.................................08佳能携手Balus实现真实和虚拟艺人跨维同台演绎.................................09苹果、英伟达等成立联盟，制定3D建模标准.........................................09CastLabs公司推出全新视频单帧取证水印技术.........................................10 传输 Fastweb采用开放式缓存解决方案增强流媒体体验..................................10成都大运会实现国内首次“无压缩8K超高清赛事视频”实时无线传输...11英国将资助1.6亿英镑用于近地轨道连接计划.........................................11 终端与应用智能电视正成为美国家庭娱乐中心.............................................................12Antilatency推出旨在提升XR体验的新型3D显示器...............................13影音进入便携大屏时代：首款谷歌认证的AR便携式AndroidTV设备发布..13河北IPTV整合中医药专业资源开设中医专区.........................................14数据报告：2023年73% 的广告商正在使用可寻址广告..........................14 摘要制作Make 新壹科技发布国内领先的 AIGC 视频垂直大模型新壹科技发布国内领先的 AIGC 视频垂直大模型 P07 新壹科技发布 AIGC 视频垂直大模型，其具备多模态感知、实时学习、自迭代及多场景交叉推理能力，能够实现 AI 全流程视频生产。基于该模型的视频制作产品“秒祝”能够在 3 ～ 5 分钟内生成以明星数字人为主角的个性化定制祝福视频。华为云推出盘古数字人通用大模型华为云推出盘古数字人通用大模型 P07 华为云的 AIGC 技术已经在影视、游戏、音频和动漫等多个领域落地应用，后续将推出盘古数字人大模型，可帮助用户在 12 小时内完成数字人生成，提供个性化数字人体验。咪咕智能字幕打造无障碍观赛新模式咪咕智能字幕打造无障碍观赛新模式 P08 中国移动咪咕智能字幕继在北京冬奥会、卡塔尔世界杯精彩亮相后，在 7 月开幕的女足世界杯和第 31 届大运会中再次创新升级为支持特色方言解说的智能字幕，其字幕准确率达 92%，提升了用户无障碍观赛体验并促进了方言文化传播。法国 Newsbridge 专利 AI 视频索引技术将推新功能传输法国 Newsbridge 专利 AI 视频索引技术将推新功能传输法国 Newsbridge 公司将推出其专利视频索引技术 MXT-1 的新功能，支持快速生成多语种的富媒体摘要，并能够聚焦视频亮点，帮助广播公司快速找到特定片段，有助于加快媒体制作流程，提高媒体投资回报率。 P08 佳能携手 Balus 实现真实和虚拟艺人跨维同台演绎佳能携手 Balus 实现真实和虚拟艺人跨维同台演绎 P09 佳能与 Balus 合作，利用佳能的体积视频技术和 Balus 的虚拟直播技术，成功实现了真实艺人和虚拟歌手同时在同一个 CG 空间中一同演绎，打造高度沉浸式的现场音乐体验。苹果、英伟达等成立联盟，制定 3D 建模标准苹果、英伟达等成立联盟，制定 3D 建模标准 P09 苹果、英伟达、皮克斯、Adobe 和 Autodesk 联合成立了OpenUSD 联盟（AOUSD），旨在推动 3D 生态系统标准化，使AR、VR 项目中使用的 3D 对象和环境信息得以共享，赋能开发者和内容创作者描述、创作和模拟大规模 3D 项目。摘要 CastLabs 公司推出全新视频单帧取证水印技术CastLabs 公司推出全新视频单帧取证水印技术 P10 CastLabs 公司推出单帧取证水印技术，使用户能够仅从单个视频帧的图像中提取隐藏数据，即使帧失真、部分被遮挡或只有一张手机拍摄的视频照片，也可以提取水印信息，为内容所有者和权利持有者提供有效的安全保护。传输Transmission Fastweb 采用开放式缓存解决方案增强流媒体体验Fastweb 采用开放式缓存解决方案增强流媒体体验 P10 思科、Qwilt 公司与意大利电信运营商 Fastweb 合作，推出基于开放缓存的联合内容分发网络解决方案，将内容缓存和交付推至Fastweb 固定和移动网络的最边缘，将平均延迟降低 60%，提高了用户的流媒体体验。成都大运会实现国内首次“无压缩 8K 超高清赛事视频” 实时无成都大运会实现国内首次“无压缩 8K 超高清赛事视频” 实时无线传输线传输 P11 在成都大运会田径比赛中，电子科技大学太赫兹通信团队成功开展了“无压缩 8K 超高清赛事视频”实时无线传输应用验证，实时业务速率为 48Gbps，传输距离为 200 米。英国将资助 1.6 亿英镑用于近地轨道连接计划英国将资助 1.6 亿英镑用于近地轨道连接计划 P11 英国于近日宣布，将资助 1.6 亿英镑用于近地轨道连接计划，凭借近地轨道卫星通信技术，解决英国 5G 和宽带的全面覆盖问题，改善英国的通信基础，缩小偏远农村和核心城市的通信连接差距，弥合用户的数字鸿沟。终端与应用TerminalsandApplications 智能电视正成为美国家庭娱乐中心智能电视正成为美国家庭娱乐中心 P12 相关研究报告显示，美国约四分之三的家庭拥有智能电视，约三分之二的家庭使用智能电视来播放流媒体视频。拥有量和观看使用量的双重增长，表明智能电视正在成为美国家庭娱乐的中心。智能电视的另两项常用功能则是播放音频和投屏。摘要 Antilatency 推出旨在提升 XR 体验的新型 3D 显示器Antilatency 推出旨在提升 XR 体验的新型 3D 显示器 P13 法国 Antilatency 公司推出旨在提升 XR 体验的全新 3D 显示设备“Illummetry IO”。该设备能够在平面上呈现逼真的 3D 物体，通过全息图提供多角度查看和交互式操作，重新定义 XR 体验。影音进入便携大屏时代：首款谷歌认证的 AR 便携式 Android TV影音进入便携大屏时代：首款谷歌认证的 AR 便携式 Android TV设备发布设备发布 P13 8 月 2 日国内 AR 头部企业 Rokid 发布 RokidStation（全球版），这是全球第一个经过谷歌认证的 AR 便携式 Android TV 设备。该设备搭配 AR 眼镜，可将影像画面呈现在观感 6 米外 215寸的超大屏幕上，随时随地享受沉浸且私密的大屏 TV 体验，全球影音娱乐进入便携大屏时代。河北 IPTV 整合中医药专业资源开设中医专区河北 IPTV 整合中医药专业资源开设中医专区 P14 河北广电无线传媒发挥 IPTV 的独特优势，在“健康万家”平台上设立“燕赵中医药”专区 , 为用户提供专业中医科普知识、权威中医诊疗服务和多样化中医药管理产品等健康服务。数据报告：2023 年 73% 的广告商正在使用可寻址广告数据报告：2023 年 73% 的广告商正在使用可寻址广告 P14 可寻址广告可以让收看同一节目的不同观众看到不同内容的电视广告。相关数据表明，2023 年 73% 的广告商正在使用可寻址广告，相比于 2022 年的 63% 提升了 16%。广告行业对寻址广告的采用呈现显著增长趋势。制作 1新壹科技发布国内领先的 AIGC 视频垂直大模型 7 月 27 日，新壹科技在北京发布了视频垂直大模型——“新壹视频大模型”。该多模态 AIGC 模型以视频生成为核心，基于深度学习海量视频样本，拥有从脚本生成、素材匹配、智能剪辑配音到数字人播报的 AI 全流程视频生产能力。新壹视频大模型具备多模态感知、实时学习、自迭代及多场景交叉推理的核心能力，能够深度理解文字、图像、音乐等多模态输入信息，生成高质量视频内容。通过自监督学习方案，该模型能够观察和学习大量的视频数据，通过分析视频的结构、内容、风格等多个维度 , 理解和把握视频制作的规则和逻辑。新壹视频大模型还能面向行业级的垂直场景进行定向训练，以提供更加精准、专业的服务，满足客户的多样化需求。此外，模型能进行跨场景知识迁移与关联 , 从而选择合适素材，调整视频风格 , 生成满足创作者需求的视频。基于新壹视频大模型，新壹科技推出了首款明星数字人祝福视频制作产品——“秒祝”。通过对明星视频进行约 24 小时的训练，“秒祝”能够将明星的形象和声音完美地还原出来，生成对应的明星数字人形象。用户可在 3 ～ 5 分钟内制作出以明星数字人为主角的个性化定制祝福视频，满足了粉丝和明星建立更深联系的需求。（信息来源 1：中国网科学频道 science.china.com.cn）（信息来源 2：中国日报网 chinadaily.com.cn） 2华为云将推出盘古数字人通用大模型在 7 月 28 日的华为云数字文娱 AI 创新峰会上，华为云表示将在后续推出盘古数字人大模型，可帮助用户在 12 小时内完成数字人生成。该数字人通用大模型基于盘古基础大模型，由华为云 MetaStudio 数字内容生产线构建，使用 PB 级音视频数据训练而成。华为云表示，其基于大模型的 AIGC 技术已经在影视、游戏、音频和动漫等多个领域落地应用，为数字文娱产业带来巨大价值。华为 AI 云服务单集群算力可达 2000P Flops，AI 推理性能提升 30%，大模型训练效率达到了主流 GPU 的 1.1 倍。华为云提供全栈 AI 服务，其盘古大模型 3.0 三层架构支持自有数据训练通用大模型，满足细化行业应用需求。盘古数字人大模型包含数字人形象、动作、表情、口型、声音等要素，用户可以结合个人数据对数字人再进行训练，构建个性化的数字人模型。用户可以通过输入文字、上传照片或拍摄视频（5 分钟视频需训练 1 小时）的方式来生成数字人。生成后用户可通过对话进行二次编辑和背景融合，实现发型、配饰、服装等个性化定制。盘古数字人的推出意味着在人工智能的助力下，每个人都有望实现自由的数字人体验。（信息来源 1：华为云 www.huaweicloud.com）（信息来源 2：Techweb 网 www.techweb.com.cn） 3Comprimato 推出基于云的视频帧率转换解决方案在北京冬奥会期间，中国移动咪咕公司开创性地实现了体育直播场景中的智能双语字幕，被用户誉为“最暖心的观赛功能”。卡塔尔世界杯期间，咪咕首次实现了世界杯直播场景中智能字幕与数智手语主播实时联动，为“无碍”体验注入更多温情。在于 2023 年 7 月 20 日开幕的女足世界杯上，咪咕实现了业界首创的闽南语直播智能字幕，旨在让更多人感受特色方言的魅力，促进跨地域文化交流，实现跨语言无障碍交流。而在 7 月 28 日开始的第 31 届世界大学生夏季运动会（大运会）中，咪咕智能字幕再次引领行业发展

点击免费查看完整报告

科技动态2023年第16期(总第16期)

制作

传输

终端与应用

你可能感兴趣

广电视听科技动态2025年第16期(总第57期)

科技动态2023年第26期（总第26期）

科技动态2023年第27期（总第27期）

科技动态2023年第8期(总第8期)

科技动态2023年第3期(总第3期)

科技动态2023年第18期(总第18期)

科技动态2023年第20期（总第20期）

科技动态2023年第24期（总第24期）

科技动态2023年第15期(总第15期)

科技动态2023年第23期（总第23期）