行业研究公司研究宏观策略财报招股书会议纪要 seedance2.0 低空经济 DeepSeek AIGC 大模型

科技动态2024年第10期

文化传媒 2024-11-26 - 国家广播电视总局广播电视规划院 Michael Wong 香港继承教育

主要内容总结

IT 服务公司 Globant 推出 AI 视频搜索工具

工具名称：AVS（高级视频搜索工具）
特点：基于 Google Cloud 的 Gemini 和定制 AI 模型，不依赖元数据，通过语义搜索技术精确搜索特定剪辑、图像和时刻。
应用领域：体育内容、广告相关时刻、培训或教育视频等。

OpenAI 发布实时 API

功能：支持语音到语音的 AI 应用及智能体，显著减少语音交互延迟，情感表达更接近真人。
合作：与 LiveKit、Agora 及 Twilio 合作。

Flawless AI 推出 AI 视觉配音技术

技术名称：TrueSync
特点：利用 AI 调整演员口型，解决多语言配音过程中的唇形和声音不同步问题。
应用：与 Deluxe 和 Pixelogic 合作，应用于多部国际电影。

Super Hi-Fi 发布 FM 广播级 AI 音频制作工具

工具名称：VoiceIQ 2.0
特点：自动清除噪音、优化动态范围、提供多种 FM 语音配置文件，处理速度提升两倍。
应用：提升广播节目的音质和制作效率。

Radio.Cloud 推出主持人“AI 助理”

功能：提供语音创意素材、生成文本摘要，支持选择 AI 声音或克隆声音。
应用：提高主持人的工作效率和节目质量。

AI 驱动视频压缩技术

应用：美国 MediaKind 为 Slovak Telekom 改造电视前端系统，通过分析内容和调整编解码器实现实时视频质量优化。

法国公司推出防止深度伪造的数字水印系统

系统名称：“Tag”
特点：嵌入不可见且无法移除的数字标识，应用于内容制作、分发和播出全工作流程。

美国电视台推出 Apple Vision Pro 新闻应用程序

应用：提供 280 多家地方电视台的本地新闻直播和点播，利用 Vision Pro 的空间特性提供交互式新闻体验。

中科院团队实现高清视频信号公里级太赫兹通信

技术：基于超导接收的高清视频信号传输，实现 0.5THz 频段 1.2 公里的传输。

美国 DOCSIS 4.0 一体化方案实现对称千兆位传输

技术：Harmonic 的 cOS 平台实现对称通信的千兆位传输速度，结合 PON 光纤技术，为未来宽带服务提供关键支持。

NTT 成功研发长距传输、极低延迟的 HDMI 信号转换技术

技术：实现延迟仅 0.1 毫秒的远程高清视频和声音的即时传输，适用于虚拟现实和远程监控等领域。

阿联酋 5G-Advanced 网络速率突破 62Gbps

技术：e& 公司实现 62Gbps 的 5G-Advanced 网络速率，彰显公司在 5G 技术领域的领先地位。

IT 服务公司 Globant 推出 AI 视频搜索工具....................................07OpenAI 发布实时 API，开启多模态互动新纪元.............................................07Flawless AI 推出 AI 视觉配音技术，提升配音质效...................................08Super Hi-Fi 发布 FM 广播级 AI 音频制作工具.................................................08Radio.Cloud 推出主持人“AI 助理”...............................................................09AI 驱动视频压缩技术助力电视前端系统升级改造.........................................09 制作法国公司推出防止深度伪造的数字水印系统............................................10美国电视台推出 Apple Vision Pro 新闻应用程序.............................................10 传输中科院团队实现高清视频信号公里级太赫兹通信...................................11美国 DOCSIS 4.0 一体化方案实现对称千兆位传输.........................................11NTT 成功研发长距传输、极低延迟的 HDMI 信号转换技术.................12阿联酋 5G-Advanced 网络速率突破 62Gbps....................................................12英国研发无线数据传输新技术，速率达 938Gbps...........................................12 终端与应用大尺寸电视市场持续攀升，百寸电视成为新主流...................................13美国 TiVo 打造一体化、个性化内容发现平台..............................................14星链用户总数达 400 万，低轨卫星互联网市场迎来机遇........................14MediaKind 合作推出多画面流媒体直播解决方案.....................................15 摘要 A IArtificial Intelligence IT 服务公司 Globant 推出 AI 视频搜索工具IT 服务公司 Globant 推出 AI 视频搜索工具 P07 美国 IT 服务公司 Globant 推出高级视频搜索工具 AVS，该工具基于 Google Cloud 的 Gemini 和定制 AI 模型，不依赖元数据，通过文本或图像在内容库中利用语义搜索技术精确搜索特定剪辑、图像和时刻，重塑用户与视频内容的交互方式。 OpenAI 发布实时 API，开启多模态互动新纪元OpenAI 发布实时 API，开启多模态互动新纪元 P07 OpenAI 发布实时 API 公测版，支持开发者构建基于 GPT-4o 的语音到语音 AI 应用及智能体，显著减少语音交互延迟，在情感表达上更接近真人，提升多模态的实时互动体验。 Flawless AI 推出 AI 视觉配音技术，提升配音质效Flawless AI 推出 AI 视觉配音技术，提升配音质效 P08 英国 Flawless AI 公司推出 AI 视觉配音技术 TrueSync，利用 AI 调整演员的口型以匹配新的语种、语音，解决电影在多语言配音过程中常见的唇形和声音不同步的问题，从而提升配音质效，增强观众沉浸式观影体验。 Super Hi-Fi 发布 FM 广播级 AI 音频制作工具Super Hi-Fi 发布 FM 广播级 AI 音频制作工具 P08 美国 Super Hi-Fi 公司发布 FM 广播级 AI 音频制作工具 VoiceIQ2.0，通过基于 AI 的语音识别和修复技术，能在任何环境提供高质量语音轨道，提升广播节目音质和制作效率。 Radio.Cloud 推出主持人“AI 助理”Radio.Cloud 推出主持人“AI 助理” P09 德国 Radio.Cloud 公司推出主持人“AI 助理”，能为广播节目主持人提供语音创意素材，生成文本摘要，有助于提高主持人的工作效率和节目质量，助力广播行业向智能化迈进。 AI 驱动视频压缩技术助力电视前端系统升级改造AI 驱动视频压缩技术助力电视前端系统升级改造 P09 美国媒体技术供应商 MediaKind 采用基于 AI 驱动的视频压缩技术为德国 Slovak Telekom 改造升级电视前端系统，过分析内容和调整编解码器，实现实时视频质量优化，提升视频质量。摘要制作Making 法国公司推出防止深度伪造的数字水印系统法国公司推出防止深度伪造的数字水印系统法国公司 B<>com 推出数字水印系统“*Tag*”，可在视频或图像中嵌入不可见且无法移除的数字标识，防止任意形式的内容篡改，以应对深度伪造，可用于内容制作的任何环节。该系统已被用于打击盗版美国电视台推出 Apple Vision Pro 新闻应用程序美国电视台推出 Apple Vision Pro 新闻应用程序美国电视台 Sinclair 与 Mindgrub 推出用于 AppleVision Pro 的应用程序 NewsON，提供 280 多家电视台的新闻直播和点播。利用 Vision Pro 的空间特性，提供交互式、沉浸式电视新闻体验。传输Transmission 中科院团队实现高清视频信号公里级太赫兹通信中科院团队实现高清视频信号公里级太赫兹通信中科院团队在青海完成了基于超导接收的公里级太赫兹 / 亚毫米波高清视频无线传输实验，实现 0.5THz 频段的远距离传输突破，为未来大容量空间 / 空地通信奠定了基础。美国 DOCSIS 4.0 一体化方案实现对称千兆位传输美国 DOCSIS 4.0 一体化方案实现对称千兆位传输美国 Harmonic 公司在 DOCSIS 4.0 一体化解决方案中取得进展。其虚拟化宽带平台 cOS 集成全双工和频分双工 DOCSIS 4.0 模式，结合 PON 光纤技术，能在现有基础设施上为运营商提供达9Gbps 的对称千兆位传输速度。 NTT 成功研发长距传输、极低延迟的 HDMI 信号转换技术NTT 成功研发长距传输、极低延迟的 HDMI 信号转换技术 P12 日本 NTT 成功研发能在长距离传输中保持极低延迟的 HDMI 信号转换技术，可实现延迟仅 0.1 毫秒的远程高清视频和声音的即时传输，有望在虚拟现实、增强现实、远程监控等多个领域应用。摘要阿联酋 5G-Advanced 网络速率突破 62Gbps阿联酋 5G-Advanced 网络速率突破 62Gbps P12 阿联酋电信运营商 e& 公司通过聚合高频和低频段多个载波，成功实现 62Gbps 的 5G-Advanced 网络速率全球新纪录，彰显了e& 公司在 5G 技术领域的领先地位。英国研发无线数据传输新技术，速率达 938Gbps英国研发无线数据传输新技术，速率达 938Gbps P12 英国将高速电子学与毫米波光子学相结合，研发出将无线数据传输速度提升至 938Gbps 的新技术，计划未来五年内实现商业化，有望为 6G 网络部署提供强大支撑，改善拥挤场所无线网络体验。终端与应用Terminals and Applications 大尺寸电视市场持续攀升，百寸电视成为新主流大尺寸电视市场持续攀升，百寸电视成为新主流 P13 相关数据显，2024 年 8 月 75 英寸及以上大尺寸电视市场份额持续上升至 26.1%，85 英寸和 100 英寸电视销量同比分别增长21% 和 180%，且价格更加亲民，百寸电视正逐渐成为家庭娱乐的中心。美国 TiVo 打造一体化、个性化内容发现平台美国 TiVo 打造一体化、个性化内容发现平台美国 TiVo 公司打造个性化内容发现平台，利用 AI 技术整合多种流媒体、广播和本地内容，通过“超级聚合”功能提供一体化无缝的内容发现体验和宽带电视服务，已在美国和欧洲市场推出。 P14 星链用户总数达 400 万，低轨卫星互联网市场迎来机遇星链用户总数达 400 万，低轨卫星互联网市场迎来机遇 P14 SpaceX 星链用户数突破 400 万，随着终端用户规模增长，预计2024 年由亏损转为盈利。全球低轨卫星互联网市场迎来重要发展机遇，2024 年我国开始规模发射低轨通信卫星，产业前景广阔。 MediaKind 合作推出多画面流媒体直播解决方案MediaKind 合作推出多画面流媒体直播解决方案 P15 美国公司 MediaKind 合作推出多画面流媒体直播解决方案，可以满足多视频同时传输需求，且能够在不改变现有基础设施的情况下实现无缝部署。方案支持智能电视、手机等多种设备播放，允许观众自定义摄像机视角并无缝切换视频源，以及自定义音频信号源，有助于提升互动性和观看体验。 A I 1IT 服务公司 Globant 推出 AI 视频搜索工具近日，美国 IT 服务公司 Globant 推出了 AI 驱动的高级视频搜索（AVS）工具。该工具基于 Google Cloud 的 Gemini 和 Vertex AI 模型，允许用户通过文本或图像输入，在内容库中精准搜索特定剪辑和图像，定位视频时刻等。 AVS 结合了 Google Cloud 的大型语言模型和为其定制的 AI 模型，不依赖预先标记的元数据，利用语义搜索技术直接根据内容本身进行查找，显著提升了搜索的精确度和效率。该创新工具具有广泛的应用前景，如在体育内容中搜索精彩片段、查找与广告最相关的时刻、跟踪屏幕上出现的特定徽标或商标，以及在培训或教育视频中快速定位特定内容。 Globant 表示，随着视频迅速取代文本成为信息消费的主要媒介，AVS等工具将在企业和媒体公司中发挥关键作用，重新定义人们与视频内容的互动方式。AVS 不仅是一个搜索工具，更是一个释放视频存档价值、提高工作流程效率和实现精确内容交付的引擎。（信息来源：broadcastnow www.broadcastnow.co.uk） 2OpenAI 发布实时 API，开启多模态互动新纪元 10 月 2 日，OpenAI 发布了实时 API 的公测版本，为广大开发者提供构建基于 GPT-4o 的语音到语音的 AI 应用及多模态智能体的能力。这一功能的推出标志着 OpenAI 在创建低延时、多模态的实时互动体验方面迈出了重要一步。该 API 利用神经网络在自然语言处理上的强大能力，能够理解和生成人类语言 , 并通过生成对抗网络和变分自编码器来提升语音质量和交互反应速度，确保了低延迟的用户体验。该 API 支持语音识别与生成的无缝结合，让用户不仅可以通过语音进行交互，还能通过生成的文本内容与应用进行互动。这种多模态的交互方式，为各行业应用提供了更广泛的潜力，预计在教育、客户服务、娱乐等领域产生巨大的变革。此次实时 API 的推出，是 OpenAI 在 AI 应用领域的又一重大进展。与以往的模型相比，使用该 API 不仅显著减少语音交互延迟，在情感表达上还能更接近真人，提供更加自然的对话体验。此外，OpenA

点击免费查看完整报告