AI智能总结
谷歌推出可同时理解音视频等五种模态信息的大语言模型 Gemini...07TCL华星发布半导体显示领域AI大模型..................................................07 制作 英国拟用 AI 模拟真实光线交互进行虚拟演播室拍摄........................08谷歌发布最新AI文生图大模型Imagen2....................................................08我国自主AVS3实时语音编码标准取得重大进展....................................09 传 输 日本研究团队实现22.9Pb/s光纤数据传输速率.........................................09西班牙电信探索使用5G技术传输全息图像数据...........................................10芬兰展示欧洲首个基于现网的5.5G技术应用..........................................10 Wi-Fi7标准将于2024年一季度末形成最终定案.....................................11FCC授权SpaceX开展星链卫星直连智能手机测试......................................11亚马逊成功验证激光星间链路OISLs技术........................................................12 终端与应用 TerminalandApplication 英国电视服务商推出定制版AppleTV4K机顶盒.....................................12我国首条大尺寸硅基Micro-LED微显示屏产线贯通...................................13Meta开启智能眼镜多模态AI功能测试.............................................................13 摘要 AITerminalandApplication 谷 歌 推 出 可 同 时 理 解 音 视 频 等 五 种 模 态 信 息 的 大 语 言 模 型谷 歌 推 出 可 同 时 理 解 音 视 频 等 五 种 模 态 信 息 的 大 语 言 模 型GeminiGemini P07 谷歌宣布推出其全新通用大语言模型 Gemini 1.0,该模型可以同时处理文本、图像、音频、视频和代码五种模态的信息,尤其擅长回答复杂数理问题,在大部分性能测试中超越了 GPT-4,具有更强大的多任务语言理解和代码生成能力。 P07TCL 华 星 发 布 全 球 首 款 半 导 体 显 示 垂 直 领 域 AI 大 模 型“ 星 智X-intelligence”,该大模型整合了半导体领域的海量知识,适用于设计协助、答疑解惑、人才培养等多个场景,在半导体显示领域能力超越 GPT-4,且目前已内部开放使用。 制作Make 英国拟用 AI 模拟真实光线交互进行虚拟演播室拍摄英国拟用 AI 模拟真实光线交互进行虚拟演播室拍摄 P08 英国电视制作机构 dock10 与约克大学拟共同开展 AI 在虚拟演播室应用的研究项目,合作探索利用 AI 技术,通过算法模拟真实光线交互,为电视、游戏、音乐表演等节目的虚拟演播室拍摄提供更高效、更逼真的效果。 谷歌发布最新 AI 文生图大模型 Imagen2谷歌发布最新 AI 文生图大模型 Imagen2 P08 谷歌发布最新 AI 文生图大模型 Imagen2,该大模型在文本理解和图像合成方面性能卓越,能够根据自然语言提示生成高质量、逼真且高分辨率的精美图像,同时支持多语言文本提示。 我国自主 AVS3 实时语音编码标准取得重大进展我国自主 AVS3 实时语音编码标准取得重大进展 P09 12 月 14 日,新一代语音编解码技术标准《智能媒体编码 第 10部分 实时语音》(AVS3P10)WD1.0 通过了 AVS 工作组会议审议,腾讯提交的技术方案被选作 AVS3P10 实时语音编码的 RM0基线,该方案最低码率可达 5.9kbps。 摘要 传输Transmission 日本研究团队实现 22.9Pb/s 光纤数据传输日本研究团队实现 22.9Pb/s 光纤数据传输 P09 通过结合大规模空分复用(SDM)和多波段波分复用(WDM)等最新技术,日本国立信息通信研究所与其欧洲合作研究团队突破性地实现了 22.9Pb/s 的光纤数据传输速率,超过了其之前10.66Pb/s 的世界纪录。在现有光连接基础设施中集成该技术,可处理的数据流量预计将提升 1000 倍。 西班牙电信探索使用 5G 技术传输全息图像数据西班牙电信探索使用 5G 技术传输全息图像数据 西班牙电信与诺基亚和瓦伦西亚理工大学合作部署了该国第一个基于 5G 通信的全息实验室,该实验室通过 6GHz 频谱的独立组网和非独立组网 5G 技术实现全息图像数据的高效网络传输,并支持具有沉浸式内容的全息用例开发和测试。 芬兰展示欧洲首个基于现网的 5.5G 技术应用芬兰展示欧洲首个基于现网的 5.5G 技术应用 P10 芬兰网络运营商 DNA 展示了欧洲首个基于现网的 5.5G 技术应用,标志着 2024 年欧洲即将迈入 5.5G 商用时代。5.5G 技术使单用户下行速率达到 10Gbps 以上,为未来消费者和家庭宽带的网络速率向 2Gbps-4Gbps 迈进奠定了基础。 Wi-Fi 7 标准将于 2024 年一季度末形成最终定案Wi-Fi 7 标准将于 2024 年一季度末形成最终定案 P11 Wi-Fi 联盟宣布 Wi-Fi 7 标准规范将于 2024 年第一季度末形成最终定案。Wi-Fi 7 性能提升显著,速率可高达 30Gbps,是目前Wi-Fi 6 最高速率的三倍多 , 可为诸如沉浸式 AR/VR 等新兴应用提供更好的支持。 FCC 授权 SpaceX 开展星链卫星直连智能手机测试FCC 授权 SpaceX 开展星链卫星直连智能手机测试 P11 FCC 向 SpaceX 颁发“实验性特别临时授权”,测试验证卫星与常规智能手机通信的有效性和安全性,以及评估该通信方式对现有无线电信号的可能干扰。一旦测试成功 ,SpaceX 和 T-Mobile有望在 2024 年推出卫星通信短信服务,并在 2025 年陆续开放更多高级通讯功能。 摘要 亚马逊成功验证激光星间链路 OISLs 技术亚马逊成功验证激光星间链路 OISLs 技术 P12 亚马逊公司宣布成功验证了激光星间链路 OISLs 技术,两颗卫星在全程间隔 1000 公里的情况下,实现了 100GB/ 秒的信息传输速率。亚马逊将在明年初发射的新卫星上配备这一突破性关键技术,以实现真正的“星际互联网”。 终端与应用TerminalandApplication 英国电视服务商推出定制版 Apple TV 4K 机顶盒英国电视服务商推出定制版 Apple TV 4K 机顶盒 P12 英国宽带电视平台 EE 宣布为订阅者推出定制的 Apple TV 4K 机顶盒,该机顶盒预装有 EE TV 应用,可通过互联网实时收看英国所有的免费广播电视频道。该定制版机顶盒还配备了一个带有快捷打开电视应用按钮的遥控器。 我国首条大尺寸硅基 Micro-LED 微显示屏产线贯通我国首条大尺寸硅基 Micro-LED 微显示屏产线贯通 P13 我国首条大尺寸硅基 Micro-LED 微显示屏产线在陕西正式贯通,总产能达 60 万颗 / 月。该产线将满足大规模微显示屏出货需求,有利于降低作为 AR 眼镜光机的微显示屏成本,为 AR 眼镜产品的市场普及提供价格优势。 Meta 开启智能眼镜多模态 AI 功能测试Meta 开启智能眼镜多模态 AI 功能测试 P13 Meta 开启 Ray-Ban Meta 智能眼镜的多模态 AI 功能测试 , 该功能可让智能眼镜的 AI 助手通过眼镜的摄像头和麦克风了解佩戴者所看到和听到的东西,并提供相关信息和帮助。 AI 1谷歌推出可同时理解音视频等五种模态信息的大语言模型 Gemini 12 月 7 日,谷歌正式发布了通用大型语言模型 Gemini 1.0,并在 12月 13 日向开发者开放了其在谷歌云上的访问权限。该模型包含了三个针对不同场景的版本,分别是 Gemini Ultra,适用于高度复杂任务;GeminiPro,适用于各种任务的最佳模型;以及 GeminiNano,适用于手机等端侧设备。 Gemini 1.0 采用了 Transformer 架构和高效的 Attention 机制,支持32K 的上下文长度,可以同时识别和理解文本、图像、音频、视频和代码五种不同模态的信息。该模型能够发现大量数据中难以辨别的知识,从而更好地理解微妙的信息并回答复杂的问题,尤其是涉及数学和物理等学科中复杂的推理问题。在编程能力方面,Gemini 可以理解、解释和生成Python、Java、C++ 和 Go 等编程语言的高质量代码,还可以作为更高级编码系统的引擎。 研究团队在包括多任务语言理解和生成 Python 代码等 32 个完善的基准测试结果显示,Gemini 在其中 30 项基准测试中大幅超越了 OpenAI 的GPT-4。此外,Gemini Ultra 在 MMLU(大规模多任务语言理解)测试中获得了 90.0% 的得分,成为首个超过人类专家水平的模型。 (信息来源:IT 之家 www.ithome.com) 2TCL 华星发布半导体显示领域 AI 大模型 12 月 7 日,TCL 华星在 DTC2023 全球显示生态大会 上 正 式 发 布 了半 导 体 显 示 AI 大 模 型 “ 星 智 X-intelligence”,这是全球首款针对显示行业的垂直领域大模型,由 TCL 华星联合 TCL 工研院、清华 KEG 团队和智谱 AI 团队、国家新型显示技术创新中心团队共同研发。 “星智 X-intelligence”大模型针对显示行业需求而设计,在通域大模型具有强大的自然语言处理和知识推理能力的基础上,研发团队构建了百万级的专业文献库,该大模型学习并整合了半导体领域的海量知识,可以深度理解显示领域内相关术语和概念,在显示领域的能力超越 GPT-4。该大模型适用于设计协助、答疑解惑、人才培养等多个场景,目前主要面向 TCL 华星内部员工开放,可以通过向大模型提出研发相关的专业知识问题来加速产品开发过程。 (信息来源:电子信息产业网 www.cena.com.cn) 制作 3英国拟用 AI 模拟真实光线交互进行虚拟演播室拍摄 如何在虚拟演播室拍摄中实现真实光线交互仍是业界面临的一个巨大挑战。近日,英国领先的电视制作机构 dock10 与约克大学宣布,将共同开展一项关于 AI 在虚拟演播室应用的研究项目。该项目旨在利用 AI 技术,探索如何模拟真实光线交互,为多相机绿色幕布虚拟演播室中的电视节目、游戏节目、音乐表演拍摄提供更逼真的效果。 在多相机绿色幕布虚拟演播室中,演员与虚拟环境的交互效果往往需要后期制作来完善,这不仅增加了制作成本,还影响了拍摄效率。dock10 与约克大学开展的 AI 在虚拟演播室应用的研究项目则利用 AI 技术,通过算法模拟光线交互,实现拍摄过程中实时呈现真实的光线效果。此次合作得到了英国工程与物理科学研究委员会资助的 XR Network+ 项目的支持,相信通过 dock10 与约克大学的共同努力,这项研究有望为虚拟制作领域带来新变革。 (信息来源:dock10 官网 www.d