行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

科技动态2024年第6期（总第33期）

2024-08-05 - ABP 喵小鱼

核心观点与关键数据

国产视频大模型技术突破

Vidu 发布三项重大技术突破：一键生成 32 秒长时长视频、合成高度一致性音视频、生成时空一致的高动态性 4D 内容。Vidu 正向“更长时长”和“更多模态”进化，音频生成或将成为技术迭代的重点方向。
快手推出国产版 Sora “可灵”：支持生成 120 秒超长视频，采用原生文生视频技术，支持多种宽高比。基于可灵，已推出“AI 舞王”“AI 唱跳”，即将推出图生视频。

手语新闻 CG 生成技术

NHK STRL 正研发手语新闻 CG 生成技术：将新闻脚本翻译成手语并生成 CG 动画，应用运动生成和面部表情控制技术提升表现力，基于图像分析实现手语新闻词汇的自动翻译。计划 2025 年完成系统开发。

人工智能个人资料保障

香港发布《人工智能：个人资料保障模范框架》：涵盖制定 AI 策略、风险评估、AI 系统管理、与持份者沟通四个方面，提出不同风险程度下的 AI 系统应用模式，旨在降低个人资料外泄风险。

可控人物视频生成大模型

商汤推出面向 C 端的可控人物视频生成大模型 Vimi：基于商汤日日新大模型，通过一张照片生成和目标动作一致的人物类视频，支持多种驱动方式，可精准控制人物表情和肢体变化，稳定生成长达 1 分钟的单镜头人物类视频。

AI 视频生成应用

全球首部 Sora 宣传片《玩具反斗城的起源》亮相：游戏“玩具反斗城”推出全球首个由 OpenAI 视频生成大模型 Sora 制作的宣传片，展示了 AI 在数字娱乐产业中的潜力。

无标记动作捕捉新方案

Move AI 发布无标记动作捕捉新方案 MoveLive：从视频直接提取人体动作，并自动将数据应用到虚拟角色上，实时模拟人类动作，革新了动作捕捉方法，提供高效的内容创作手段。

8K-ROI 制作系统

NHK 研制 8K-ROI 制作系统：拍摄 8K 广角图像，并半自动裁剪出多个高清视频区域，以少量人员实现多机位摄像效果，简化了多机位视频的节目制作流程。

5G 广播技术发展

德国将在欧洲杯和奥运会期间测试 5G 广播：四家德国公共广播联盟媒体公司宣布将通过 5G 广播进行联合直播，使用户能在 5G 移动设备上接收线性视听内容。
3GPP R18 标准冻结：面向 5G-A 的第一个标准版本，拓展 5G 应用场景，深挖 5G 潜能，探索新技术使 5G 与 6G 衔接。R18 标准的冻结将加速 5G-A 技术商用进程。
中国移动开通 800G 空芯光纤传输技术试验网：实现 20 公里单空芯光纤双向 128Tb/s 的超大容量传输，将光链路传输时延降低 30% 以上，为未来智算中心分布式部署提供技术支撑。
浙江移动完成全球首个 5G-A 智能分组核心网部署：能实时感知业务体验和评估网络质量，动态提供资源和业务保障，显著提升用户网络体验。

6G 通信技术试验

国内 6G 双星协同传输试验成功：传输速率超过 1Gbps，成功流畅播放了 8K 视频，验证了 6G 终端直连卫星技术的可行性。

现场直播与内容交付平台

现场直播是 40% 观众首选的广播电视内容：一项调查显示，40% 的观众首选现场直播，比点播和预先安排的节目更受欢迎，打破代际差异，受到各个年龄段观众的喜爱。
日本正研发集成广播与互联网的内容交付平台：整合云原生交付平台和内容智能推荐技术，提供满足观众多样化需求的内容，计划于 2026 年前后落地应用。

内容来源生成和展示技术

NHK 研发内容来源生成和展示技术：开发了一款能实时显示内容来源并检测篡改的视频播放器，以及用于分类视频材料来源的软件，预计 2026 年部分投入使用。

消费者对 5G 广播的兴趣

调查显示消费者对 5G 广播极为感兴趣：三分之二的受访者认为 5G 广播可能取代互联网流媒体播放，68% 的受访者希望在移动设备上更频繁地观看直播电视内容。

智能手机助力奥运开幕式直播

智能手机助力奥运开幕式直播新体验：OBS 将在巴黎奥运会开幕式上采用三星手机直播，200 余部智能手机捕捉高质量的 HDR 视频，并通过专用 5G 网络进行分享和流传输。

沉浸式演出技术

BBC 打造沉浸式演出吸引年轻观众：利用创新的沉浸式演出技术，将艺术家的现场表演实时转换为 3D 模型，并传输到虚拟场地中呈现，观众还可以通过虚拟替身加入演出，并与他人实时互动。

国产视频大模型 Vidu 发布三项重大技术突破....................................07快手推出国产版 Sora “可灵”并开放测试.....................................................07NHK STRL 正研发手语新闻 CG 生成技术.................................................08香港发布《人工智能：个人资料保障模范框架》...................................08商汤推出面向 C 端的可控人物视频生成大模型 Vimi..............................09全球首部 Sora 宣传片《玩具反斗城的起源》亮相...................................09 制作 Move AI 发布无标记动作捕捉新方案..........................................................10NHK 研制 8K-ROI 制作系统，高效模拟多机位效果.....................................10 传输德国将在欧洲杯和奥运会期间测试 5G 广播.............................................113GPP R18 标准冻结，助力 5G-A 加速商用落地..............................................11中国移动开通 800G 空芯光纤传输技术试验网...............................................12浙江移动完成全球首个 5G-A 智能分组核心网部署.......................................12国内 6G 双星协同传输试验成功......................................................................13 业务与应用现场直播是 40% 观众首选的广播电视内容...............................................13日本正研发集成广播与互联网的内容交付平台...........................................14NHK 研发内容来源生成和展示技术...........................................................14调查显示消费者对 5G 广播极为感兴趣......................................................14智能手机助力奥运开幕式直播新体验............................................................15BBC 打造沉浸式演出吸引年轻观众............................................................15 摘要 A IArtificial Intelligence 国产视频大模型 Vidu 发布三项重大技术突破国产视频大模型 Vidu 发布三项重大技术突破 P07 视频大模型 Vidu 近日发布三项重大技术突破：一键生成 32 秒长时长视频、合成高度一致性音视频及生成时空一致的高动态性4D 内容。Vidu 正向“更长时长”“更多模态”进化，继视频生成，音频生成或将成为 Vidu 技术迭代的重点方向。快手推出国产版 Sora “可灵”并开放测试快手推出国产版 Sora “可灵”并开放测试 P07 近日，快手发布视频生成大模型“可灵”并开放测试。可灵采用原生文生视频技术，可生成 120 秒超长视频，且支持多种宽高比。基于可灵，已推出“AI 舞王”“AI 唱跳”，即将推出图生视频。 NHK STRL 正研发手语新闻 CG 生成技术NHK STRL 正研发手语新闻 CG 生成技术 P08 NHK 科学技术研究实验室 STRL 正在研发将新闻脚本翻译成手语并生成 CG 动画的技术。该研究应用运动生成、面部表情控制技术提升手语 CG 表现力，并基于图像分析实现手语新闻词汇的自动翻译。STRL 计划 2025 年完成系统开发。香港发布《人工智能：个人资料保障模范框架》香港发布《人工智能：个人资料保障模范框架》 P08 香港私隐公署发布《人工智能：个人资料保障模范框架》，旨在降低个人资料外泄风险。框架涵盖制定 AI 策略、风险评估、AI系统管理、与持份者沟通四个方面的具体步骤和建议，并提出了不同风险程度下的 AI 系统应用模式。商汤推出面向 C 端的可控人物视频生成大模型 Vimi商汤推出面向 C 端的可控人物视频生成大模型 Vimi P09 首个面向 C 端用户的可控人物视频生成大模型 Vimi 亮相世界人工智能大会。Vimi 基于商汤日日新大模型，可通过一张照片生成和目标动作一致的人物类视频，填补了 AIGC 产品的市场空缺。全球首部 Sora 宣传片《玩具反斗城的起源》亮相全球首部 Sora 宣传片《玩具反斗城的起源》亮相 P09 游戏“玩具反斗城”推出了全球首个由 OpenAI 视频生成大模型Sora 制作的宣传片。这一创新应用不仅减少了视频制作的成本和时间，还突显了 AI 在数字娱乐产业中的巨大潜力。摘要制作Making Move AI 发布无标记动作捕捉新方案Move AI 发布无标记动作捕捉新方案 P10 Move AI 推出了无标记动作捕捉技术方案 MoveLive，从视频直接提取人体动作，并自动将数据应用到虚拟角色上，实时模拟人类动作。这革新了动作捕捉方法，提供了更高效的内容创作手段。 NHK 研制 8K-ROI 制作系统，高效模拟多机位效果NHK 研制 8K-ROI 制作系统，高效模拟多机位效果 NHK STRL 研制了一种 8K-ROI 摄像制作系统，拍摄 8K 广角图像，并半自动裁剪出多个高清视频区域，以少量人员实现多机位摄像效果，简化了多机位视频的节目制作流程。传输Transmission 德国将在欧洲杯和奥运会期间测试 5G 广播德国将在欧洲杯和奥运会期间测试 5G 广播 P11 四家德国公共广播联盟媒体公司宣布将在欧洲杯和奥运会期间通过 5G 广播进行联合直播，使用户能在 5G 移动设备上接收线性视听内容，并测试 5G 广播技术的各项功能。 3GPP R18 标准冻结，助力 5G-A 加速商用落地3GPP R18 标准冻结，助力 5G-A 加速商用落地 6 月 18 日，R18 技术标准在 3GPP RAN 会议上正式冻结，是面向 5G-A 的第一个标准版本，具有拓展 5G 应用场景、深挖 5G 潜能及探索新技术使 5G 与 6G 衔接的三大特点。R18 标准的冻结，将加速 5G-A 技术商用进程。中国移动开通 800G 空芯光纤传输技术试验网中国移动开通 800G 空芯光纤传输技术试验网 P12 中国移动成功开通 800G 空芯光纤传输技术试验网，实现了 20公里单空芯光纤双向 128Tb/s 的超大容量传输，可将光链路传输时延降低 30% 以上，有望为未来智算中心分布式部署提供技术支撑。浙江移动完成全球首个 5G-A 智能分组核心网部署浙江移动完成全球首个 5G-A 智能分组核心网部署 P12 浙江移动与华为合作部署了全球首个 5G-A 智能分组核心网，能实时感知业务体验和评估网络质量，动态提供资源和业务保障，显著提升用户网络体验，彰显了中国 5G 技术的全球领先地位。摘要国内 6G 双星协同传输试验成功国内 6G 双星协同传输试验成功 P13 在中国电信北京地球站，国内首次针对 6G 的双星协同高速传输外场试验取得了成功，传输速率超过 1Gbps，成功流畅播放了8K 视频，验证了 6G 终端直连卫星技术的可行性。业务与应用Services and Applications 现场直播是 40% 观众首选的广播电视内容现场直播是 40% 观众首选的广播电视内容 P13 一项对英国、美国、西班牙、德国、法国和北欧消费者的最新调查结果显示，现场直播是 40% 观众首选的广播电视内容类型。并且现场直播正在打破代际差异，受到各个年龄段观众的喜爱。日本正研发集成广播与互联网的内容交付平台日本正研发集成广播与互联网的内容交付平台 P14 日本 NHK STRL 正在研发集广播与宽带互联网于一体的内容交付平台，整合云原生交付平台和内容智能推荐技术，提供满足观众多样化需求的内容。该平台计划于 2026 年前后落地应用。 NHK 研发内容来源生成和展示技术NHK 研发内容来源生成和展示技术 NHK STRL 正在开发一种生成和展示内容来源的技术，包括一款能实时显示内容来源并检测篡改的视频播放器。该技术预计2026 年部分投入使用。调查显示消费者对 5G 广播极为感兴趣调查显示消费者对 5G 广播极为感兴趣德国一项调查结果显示，消费者对 5G 广播极为感兴趣，三分之二的受访者认为 5G 广播可能取代互联网流媒体播放，68% 对5G 广播感兴趣的用户希望在移动设备上更频繁地观看直播电视内容。智能手机助力奥运开幕式直播新体验智能手机助力奥运开幕式直播新体验 P15 OBS 将在巴黎奥运会开幕式上采用三星手机直播，200 余部智能手机捕捉高质量的 HDR 视频，并通过专用 5G 网络进行分享和流传输，为巴黎奥运会提供独特视角，改变观众体验奥运会的方式。 BBC 打造沉浸式演出吸引年轻观众BBC 打造沉浸式演出吸引年轻观众 P15 BBC 与英国科技公司 Condense 合作，利用创新的沉浸式表演技术吸引年轻观众。将艺术家的表演转换为 3D 模型，并传输到虚拟场地呈现，观众还能通过虚拟替身加入表演，并与他人实时互动。 A I 1国产视频大模型 Vidu 发布三项重大技术突破近日，生数科技与清华大学联合发布的国产视频大模型 Vidu 完成长时长、高一致性、高动态性三项重大技术突破。（1）Vidu 能一键生成长达 32s 的视频：视频画面连贯且效果逼真，例如在以“图书馆书架放着的地球仪”为题生成的视频中，Vidu 不仅复现了地球仪表面的地图细粒度信息，还实现了“地球仪”到“内部蓝色星球”的流畅动态转场。（2）Vidu 是首次支持高度一致性的音视频合成的大模型：从效果来看，能够很好地实现声音与画面内容的匹配。（3）Vidu 支持从单一视频生成时空一致的高动态性 4D 内容：该 4D 内容即序列 3D，通过提升 3D 一致性来增强视频生成对真实世界的模拟。 Vidu 正朝着“更长时长”和“更多模态”的方向进化。理论上，Vidu底层架构支持任意时长的音频生成和音视频匹配。在视频生成之后，音频生成或将成为 Vidu 技术迭代的重点方向。（信息来源：钛媒体网 www.tmtpost.com） 2快手推出国产版 Sora“可灵”并开放测试近日，快手推出产品级视频生成大模型“可灵”，支持生成 30fps、1080p 分辨率的 120s 超长视频，并支持多种宽高比。作为中国版 Sora 产品级应用，“可灵”已在快影 APP 中开启邀请测试。 “可灵”采用原生文生视频技术路线，替代了图像生成加时序模块的组合。能够模拟真实物理世界的特性和运动规律，从而准确刻画复杂时空运动，并处理与真实世界的交互。在模型设计方面，“可灵”采用类 Sora 的Diffusion Transformer 结构，并通过自研的 3D VAE 网络和全注意力机制提升模型的建模能力。数据构建

点击免费查看完整报告

科技动态2024年第6期（总第33期）

核心观点与关键数据

国产视频大模型技术突破

手语新闻 CG 生成技术

人工智能个人资料保障

可控人物视频生成大模型

AI 视频生成应用

无标记动作捕捉新方案

8K-ROI 制作系统

5G 广播技术发展

6G 通信技术试验

现场直播与内容交付平台

内容来源生成和展示技术

消费者对 5G 广播的兴趣

智能手机助力奥运开幕式直播

沉浸式演出技术

你可能感兴趣

广电视听科技动态2026年第6期（总第73期）

科技动态2023年第6期(总第6期)

科技动态2024年第5期（总第32期）

科技动态2024年第9期（总第36期）

科技动态2024年第14期（总第41期）

科技动态2024年第11期（总第38期）

科技动态2024年第7期（总第34期）

科技动态2024年第2期（总第29期）

科技动态2024年第3期（总第30期）

科技动态2024年第4期（总第31期）