行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

科技动态2024年第14期（总第41期）

2025-01-07 - ABP 章嘉艺

总结

人工智能 (AI)

谷歌: 推出 Veo 2 视频生成模型和增强版 Imagen 3 图像生成模型，提升 AI 视频和图像生成技术水平。Veo 2 专注于生成多样化主题和风格的高质量视频，能达到电影级效果；Imagen 3 在图像构图和细节准确性上有提升，支持多种风格。Veo 2 预计 2025 年上线至 YouTube Shorts，Imagen 3 已通过谷歌实验室的 ImageFX 工具在全球 100 多个国家上线。
亚马逊: 推出 Amazon Nova 系列模型，其中 Nova Reel 模型专注生成演播室级别视频内容，目前能制作 6 秒视频，计划未来支持 2 分钟。Amazon Nova 系列还包括 Micro、Lite、Pro、Premier 以及 Canvas 等模型，能处理文本、图像和视频生成高质量内容。计划 2025 年推出语音对语音模型。
斯坦福李飞飞团队: 发布单图生成 3D 世界的 AI 系统，能将单张静态图片转换成交互式 3D 世界，支持景深调整、推拉变焦等特效，以及实时渲染和多种交互功能。该系统为内容创作、VR 等领域带来新机遇。
Dubformer 公司: 推出情感逼真的 AI 配音技术 Emotion Transfer，通过分析语音音调、音量和语速，模拟专业配音演员的情感调动过程，实现情感的精准表达。支持 20 种语言的内容翻译，避免未经授权使用演员声音的风险。

传输

FCC: 为超低功耗设备开放 6GHz 频段的 1200MHz 频谱，加速 AR、VR 应用发展。FCC 允许 VLP 设备在 6GHz 频段的 U-NII-6 和 U-NII-8 部分运营，无需许可证，但需遵循与 U-NII-5、U-NII-7 频段相同的发射功率水平和技术保护措施。FCC 要求 VLP 设备采用基于竞争的协议，动态分配和使用频谱资源。该决策获得 Meta、苹果、博通、高通、英特尔和谷歌等科技巨头支持。

终端与应用

三星: 推出 TVKey 云技术，实现无机顶盒观看直播电视。用户使用三星智能电视遥控器即可直接访问直播和点播内容，简化操作流程并减少额外硬件使用。TVKey 云技术兼容三星 2023 年和 2024 年的多款网络电视型号，并与印度有线电视台 GTPL Hathway 和卫星电视服务商 Dish TV 合作提供直播广播和点播内容服务。
美国 Light Field Lab: 发布 SolidLight 裸眼全息 3D 显示技术，可以生成每平方米高达 100 亿像素的图像，允许观众裸眼观看并自由聚焦半空中的全息图像。该技术利用一系列复杂的波导调制密集光线场，通过能产生全息图的小型子模块组合成完整的全息图像。
FuboTV: 推出四种全新交互式联网电视广告格式，包括交易型广告、游戏型广告、循环轮播型广告和地理定位型广告。这些广告格式增加观众的参与感，并提供可寻址性和可衡量性，使广告商能够追踪和量化广告效果。

预测

全球流媒体订阅用户数: 英国机构预测，2029 年全球视频流媒体订阅用户将超 20 亿，订阅收入增速为用户增速的三倍。亚太地区的增长尤为显著，主要得益于 Netflix 等平台采取的打击账户共享行为、广告支持和捆绑策略等关键战略举措。预计到 2029 年，订阅流媒体服务将创造近 1700 亿美元的年收入，加上广告销售为市场带来的 220 亿美元收入，整个市场的年总收入将超过 1900 亿美元。

目录 A IArtificial Intelligence 谷歌推出视频模型 Veo 2 和图像模型 Imagen3................................................05亚马逊推出演播室级别视频制作 AI 模型 Nova Reel.......................................05斯坦福李飞飞团队发布单图生成 3D 世界的 AI 系统.....................................05Dubformer 公司推出情感逼真的 AI 配音技术.................................................06 传输 FCC 为超低功耗设备开放新频谱，加速 AR、VR 应用发展.........................06 终端与应用 Terminals and Applications 三星推出 TVKey 云技术实现无机顶盒观看直播电视.....................................07美国 Light Field Lab 发布裸眼全息 3D 显示技术..............................................07FuboTV 推出四种全新交互式联网电视广告格式...........................................08预测：全球流媒体订阅用户数到 2029 年将超 20 亿.......................................08 摘要 A IArtificial Intelligence 谷歌推出视频模型 Veo 2 和图像模型 Imagen3谷歌推出视频模型 Veo 2 和图像模型 Imagen3 P05 谷歌升级推出 Veo 2 视频生成模型和增强版 Imagen 3 图像生成模型，提升 AI 视频和图像生成的技术水平。Veo 2 模型专注于生成多样化主题和风格的高质量视频，能达到电影级效果。亚马逊推出演播室级别视频制作 AI 模型 Nova Reel亚马逊推出演播室级别视频制作 AI 模型 Nova Reel P05 亚马逊推出集成多种模态创意内容生成的新一代基础模型Amazon Nova，该系列模型中的 Nova Reel 模型专注于生成演播室级别的视频内容，目前能制作 6 秒视频，未来将支持 2 分钟的视频制作。斯坦福李飞飞团队发布单图生成 3D 世界的 AI 系统斯坦福李飞飞团队发布单图生成 3D 世界的 AI 系统 P06 斯坦福教授李飞飞创立的 World Labs 发布一款 AI 系统，能将单张静态图片转换成交互式 3D 世界，支持景深调整和推拉变焦等特效，以及实时渲染和多种交互功能，将为内容创作、VR 等领域带来新机遇。 Dubformer 公司推出情感逼真的 AI 配音技术Dubformer 公司推出情感逼真的 AI 配音技术 P06 AI 配音公司 Dubformer 推出 Emotion Transfer 技术，可使 AI配音更加真实和具有感染力。该技术并不使用演员数据进行训练，支持 20 种语言的内容翻译，可避免未经授权使用演员声音的风险。传输Transmission FCC 为超低功耗设备开放新频谱，加速 AR、VR 应用发展FCC 为超低功耗设备开放新频谱，加速 AR、VR 应用发展 P06 近日，FCC 全面开放 6GHz 频段的 1200MHz 频谱，供无需许证的超低功耗设备使用，此举获多家科技巨头支持，将加速 AR、VR 等前沿技术的发展，为消费者提供更丰富的无线体验。摘要终端与应用Terminals and Applications 三星推出 TVKey 云技术实现无机顶盒观看直播电视三星推出 TVKey 云技术实现无机顶盒观看直播电视 P07 近日，三星在印度推出 TVKey 云技术，与印度有线电视台和卫星电视服务商合作，让用户无需机顶盒，使用三星智能电视机通过互联网即可验证并访问直播电视和点播内容，简化了操作流程并减少了额外硬件的使用。美国 Light Field Lab 发布裸眼全息 3D 显示技术美国 Light Field Lab 发布裸眼全息 3D 显示技术美国公司 Light Field Lab 发布 SolidLight 裸眼全息 3D 显示技术，可以生成每平方米高达 100 亿像素的图像，允许观众裸眼观看并自由聚焦半空中的全息图像，享受沉浸式体验。 FuboTV 推出四种全新交互式联网电视广告格式FuboTV 推出四种全新交互式联网电视广告格式 P08 美国体育直播电视流媒体平台 FuboTV 推出交易型、游戏型、循环轮播型、地理定位型四种创新的联网电视互动广告格式，不仅增加了观众的参与感，而且使广告商能够追踪和量化广告效果。预测：全球流媒体订阅用户数到 2029 年将超 20 亿预测：全球流媒体订阅用户数到 2029 年将超 20 亿 P09 英国机构预测，2029 年全球视频流媒体订阅用户将超 20 亿，订阅收入增速为用户增速的三倍且亚太地区的增长尤为显著。这得益于 Netflix 等流媒体平台采取的打击账户共享行为、广告支持和捆绑策略等关键战略举措。 A I 1谷歌推出视频模型 Veo 2 和图像模型 Imagen3 谷歌的旗舰 AI 研究实验室 Google DeepMind 近日对旗下人工智能内容生成工具进行重大升级，推出了 Veo 2 视频生成模型和增强版 Imagen 3 图像生成模型，旨在提升 AI 图像和视频生成的技术水平。 Veo 2 模型专注于生成多样化主题和风格的高质量视频，生成的人物表情真实，细节丰富，能达到电影级效果。Veo 2 将通过谷歌 Vertex AI 平台提供给开发者，预计在 2025 年上线至 YouTube Shorts 等平台。Imagen 3模型在图像构图和细节准确性上有很大提升，生成的图像纹理丰富，支持从写实到抽象的多种风格，而且能更好地响应用户的需求和提示。目前，Imagen 3 已通过谷歌实验室的 ImageFX 工具在全球 100 多个国家上线。 DeepMind 产品副总裁 Eli Collins 指出，随着技术的成熟，谷歌会将这些工具规模化，为视频和图像创作者提供定制化使用体验，从而变革创意工作流程。（信息来源：华尔街见闻 author.baidu.com） 2亚马逊推出演播室级别视频制作 AI 模型 Nova Reel 亚马逊在 12 月 4 日的 AWS re:Invent 大会上推出集成多种模态创意内容生成的新一代基础模型 Amazon Nova，该升级模型在降低延迟、提高成本效益和定制化方面取得了显著进步，将助力企业优化服务、创新流程、降低成本和提升价值。值得关注的是 Amazon Nova 系列模型中的 NovaReel 模型，其专注生成演播室级别的视频内容，目前能制作 6 秒视频，计划未来可支持 2 分钟的视频制作。Nova Reel 主要服务于广告、营销和培训领域，允许用户通过自然语言来控制视频风格和节奏，为内容创作带来便捷和效率。 Amazon Nova 系列还包括 Micro、Lite、Pro、Premier 以及 Canvas等模型，这些模型能够处理文本、图像和视频，生成高质量的内容。此外，亚马逊计划于 2025 年推出包括语音对语音模型在内的两款新 Nova 模型，进一步推动生成式 AI 技术的创新，并为各行业提供更智能、个性化的解决方案。（信息来源：亚马逊官网 press.aboutamazon.com） 3斯坦福李飞飞团队发布单图生成 3D 世界的 AI 系统近斯坦福大学教授、AI 专家李飞飞创立的 WorldLabs 近日发布一款创新 AI 系统，能够将单张静态图片转换成交互式 3D 世界，支持景深调整和推拉变焦等特效，以及实时渲染和多种交互功能。与传统的二维内容生成相比，该系统生成的 3D 场景遵循准确的几何规则，具有更真实的深度感、更灵活的交互控制。用户可以通过键盘和鼠标操作，实现场景中的自由移动，以及包括颜色变化、聚光灯特效和动态效果在内的多种视觉效果的调整。World Labs 的这一技术突破为内容创作、VR 等领域带来新机遇，预示着电影、游戏、模拟器制作等行业将会产生大变革。虽然该技术目前尚处于早期阶段，存在一定限制，但 World Labs 表示将持续优化，以尽快将这一创新工具推向市场。（信息来源：worldlabs 官网 www.worldlabs.ai） 4Dubformer 公司推出情感逼真的 AI 配音技术 AI 配音初创公司 Dubformer 近日推出了名为 Emotion Transfer 的创新技术，该技术致力于为 AI 配音注入更丰富的情感和表现力。 Emotion Transfer 技术不同于声音克隆或预录制音频技术，其专注语音音调、音量和语速的分析，并通过独立分析每个短语的情感精髓，以及模拟专业配音演员的情感调动过程，将其与个体音色分离，从而实现情感的精准表达。值得一提的是，该技术并不使用演员数据进行训练，并且支持将 20 种语言的内容翻译为英语、德语、西班牙语和法语。 Dubformer的创始人兼 CEO Anton Dvorkovich指出，EmotionTransfer 技术的推出是 AI 配音技术的一次重大突破，其能够提高配音的表现力和情感传递，可使 AI 配音更加真实和具有感染力，同时避免未经授权使用演员声音的风险。（信息来源：即刻广播新闻网 broadcastnow.co.uk）传输 5FCC 为超低功耗设备开放新频谱，加速 AR、VR 应用发展美国联邦通信委员会（FCC）近日通过新规定，全面开放 6GHz 频段中的 1200MHz 频谱，供无需许可证的超低功耗（VLP）设备使用。这一决策旨在推动技术创新，加速 AR、VR 等前沿技术的发展，为消费者提供更丰富的无线体验。 FCC 允许 VLP 设备在 6GHz 频段的 U-NII-6 和 U-NII-8 部分运营，设备需遵循与 U-NII-5、U-NII-7 频段相同的发射功率水平和技术保护措施，但无需遵守地点限制和自动频率协调系统。FCC 要求 VLP 设备采用基于竞争的协议，这样可以根据优先级、需求等因素来动态分配和使用频谱资源。FCC 还禁止将 VLP 设备作为建筑物、电线杆等室外固定基础设施的一部分，这降低了其他设备的干扰风险，有助于维护周围的电磁环境和安全。 FCC 的频谱开放决策既保障了新设备的部署，又保护了现有授权服务的稳定运行，获得了包括 Meta、苹果、博通、高通、英特尔和谷歌在内的科技巨头支持，有望为无线行业带来显著经济效益。据称，仅 Wi-Fi 一项便能在 2024 年实现高达 7690 亿美元的经济增长，并将在未来几年内持续推动增长。（信息来源：tvtech 网 www.tvtechnology.com）终端与应用 6三星推出 TVKey 云技术实现无机顶盒观看直播电视近日，三星电子在印度推出了 TVKey 云技术，用户使用三星智能电视遥控器即可直接访问直播和点播内容，简化了操作流程并减少了额外硬件的使用，实现了无需机顶盒观看直播电视功能。 TVKey 云技术具备芯片级安全功能，可实现内容安全传输和知识产权保护。TVKey 云技术兼容三星 2023 年和 2024 年的多款网络电视型号，包括超高清、OLED、QLED 和 Neo QLED 系列。三星已与印度有线电视台GTPL Hathway 和卫星电视服务商 Dish TV 建立合作，提供包括直播

点击免费查看完整报告

科技动态2024年第14期（总第41期）

总结

人工智能 (AI)

传输

终端与应用

预测

你可能感兴趣

广电视听科技动态2025年第14期(总第55期)

科技动态2023年第14期(总第14期)

科技动态2024年第5期（总第32期）

科技动态2024年第9期（总第36期）

科技动态2024年第11期（总第38期）

科技动态2024年第7期（总第34期）

科技动态2024年第2期（总第29期）

科技动态2024年第3期（总第30期）

科技动态2024年第4期（总第31期）

科技动态2024年第6期（总第33期）