您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[ABP]:科技动态2023年第7期(总第7期) - 发现报告

科技动态2023年第7期(总第7期)

信息技术2024-08-05-ABP徐***
AI智能总结
查看更多
科技动态2023年第7期(总第7期)

Meta 推出文本生成三维动态场景 AI 模型.................................................07英伟达发布四款 AI 推理芯片.......................................................................07华为将上线盘古系列 AI 大模型.............................................................08Newsbridge 公司推出生成式 AI 索引技术 MXT-1.....................................08腾讯正式发布 AI 智能创作助手“腾讯智影”..........................................09为规避过度依赖,OpenAI 之外的同类公司受到青睐.............................09 传 输 中国联通现有 117 万个 5G 基站,约占全球 30%.....................................10YouTube 近期加入安全可靠传输协议联盟...........................................10MuxIP 公司推出支持广播的免费流媒体电视方案...................................11 终端与应用Terminal and Application 国科微面向 AR/VR 市场推出 GK68 系列芯片..........................................11海信发布百吋 MiniLED 电视 E8K................................................................12新华网、新华智云联合发布首个 AIGC 元宇宙系统...............................12腾讯公布可还原人脸朝向、表情的视频换脸专利...................................13UE5 用视频转换实现高精度面部捕捉与数字人建模...............................13以色列 yes 公司多措并举,增强智能电视用户体验................................14苹果在为 Apple TV 应用测试“多视图”新特性......................................14 制 作 Hitachi Kokusai 展示最新 4K 超高清相机系统...........................................15 摘 要 A IArtificial Intelligence Meta 推出文本生成三维动态场景 AI 模型Meta 推出文本生成三维动态场景 AI 模型 P07 Meta 提出首个通过文本描述生成 3D 动态场景的方法 MAV3D,基于 4D 动态神经辐射场和文本到视频的扩散模型,无需任何3D/4D 数据即可生成能在任意视角下观看的三维动态视频。 英伟达发布四款 AI 推理芯片英伟达发布四款 AI 推理芯片 英伟达在 GTC 2023 大会上发布了四款 AI 推理芯片,分别适用于视频云推理、生成式 AI 图像处理、大模型处理和海量数据的存储、查询与推理。 P07 华为将上线盘古系列 AI 大模型华为将上线盘古系列 AI 大模型 华为官网显示,其盘古系列 AI 大模型中的 NLP 大模型、CV 大模型和科学计算大模型即将上线。其中,NLP 大模型用于中文内容生成、内容理解,CV 大模型兼顾了图像判别与生成能力。 P08 Newsbridge 公司推出生成式 AI 索引技术 MXT-1Newsbridge 公司推出生成式 AI 索引技术 MXT-1 P08 Newsbridge 公司推出生成式 AI 索引技术 MXT-1,能够每分钟索引超过 500 小时的视频,可极大降低大规模使用 AI 的成本,使基于 AI 大规模索引视频等媒体资产成为商业现实。 腾讯正式发布 AI 智能创作助手“腾讯智影”腾讯正式发布 AI 智能创作助手“腾讯智影” P09 腾讯正式发布全新的 AI 智能创作助手“腾讯智影”,推出智影数字人、文本配音、文章转视频等 AI 创作工具,可为 PGC 的工业化规模产出和 UGC 的创意转化提质增效。 为规避过度依赖,OpenAI 之外的同类公司受到青睐为规避过度依赖,OpenAI 之外的同类公司受到青睐 P09 为避免对 AIGC 领军企业 OpenAI 的过度依赖,以及削减成本方面的考虑,十多家初创公司和投资者正在转向与除 OpenAI 之外的其他 AI基础模型提供商开展合作,以建立健康运行的生态系统。 摘 要 传 输Transmission 中国联通现有 117 万个 5G 基站,约占全球 30%中国联通现有 117 万个 5G 基站,约占全球 30% P10 截至 2 月,中国联通已有 5G 套餐用户近 2.2 亿户,5G 基站 117万个,计划今年在 5G 基础设施建设和科技创新方面投入近千亿元。6G 方面,联通预计到 2025 年推出 6G 应用场景,2030 年实现 6G 规模商用。 YouTube 近期加入安全可靠传输协议联盟YouTube 近期加入安全可靠传输协议联盟 实 时 视 频 网 络 和 视 觉 协 作 解 决 方 案 提 供 商 Haivision 宣 布YouTube 已加入安全可靠传输协议(SRT)联盟,YouTube 对SRT 的支持是开源协议的一个重要里程碑,体现了该协议在端到端低延迟视频传输方面的广泛普及。 P10 MuxIP 公司推出支持广播的免费流媒体电视方案MuxIP 公司推出支持广播的免费流媒体电视方案 P11 流媒体自动化解决方案提供商 MuxIP 推出支持广播的 FASTHub方案,旨在创建通用传输的单一工作流程,使卫星运营商、广播公司和有线电视运营商能最大限度利用基础设施,能快速生成免费流媒体电视频道,从而大幅降低广播公司的成本。 终端与应用Terminal and Application 国科微面向 AR/VR 市场推出 GK68 系列芯片国科微面向 AR/VR 市场推出 GK68 系列芯片 P11 国科微公司针对 AR/VR 市场推出了高集成度、低功耗的 GK68 系列芯片,支持 8K 120FPS 的全景 360 度视频解码和显示输出,以及 HDR Vivid、MEMC、边缘计算和超分辨率图像处理。 海信发布百吋 MiniLED 电视 E8K海信发布百吋 MiniLED 电视 E8K P12 海信发布行业首款千级分区百吋 MiniLED 电视 E8K,除了尺寸升级外,其在分区数量、控光能力、环境光感智能技术和双侧发声环绕音响系统方面都有所提升。 新华网、新华智云联合发布首个 AIGC 元宇宙系统新华网、新华智云联合发布首个 AIGC 元宇宙系统 P12 新华网、新华智云联合发布首个 AIGC 元宇宙系统“元卯”,将集合多类虚实融合软硬件产品,实现数字人、数字内容和数字场景在元宇宙世界的智能生产,消解元宇宙数字内容生产成本压力。 腾讯公布可还原人脸朝向、表情的视频换脸专利腾讯公布可还原人脸朝向、表情的视频换脸专利 P13 腾讯视频换脸专利“待播放视频中人脸的替换方法和装置”获授权,该专利提供一种将视频中的人脸替换为其他人脸的技术,可还原视频中人脸的朝向和表情。 UE5 用视频转换实现高精度面部捕捉与数字人建模UE5 用视频转换实现高精度面部捕捉与数字人建模 P13 虚 幻 引 擎 UE5 最 新 版 本 的 Live Link Face 和 MetaHumanAnimator 应用程序可以将仅用 iPhone 录制的视频转换成和视频中真人一比一还原的高保真数字人动画,在几分钟内实现从真人到数字人的转换。 以色列 yes 公司多措并举,增强智能电视用户体验以色列 yes 公司多措并举,增强智能电视用户体验 P14 以色列电信公司 Bezeq 的付费电视子公司 yes 采用最新版本的Synamedia Go 体验管理器,以及 Synamedia 的安全解决方案和视频网络技术,用以增强智能电视用户体验。 苹果在为 Apple TV 应用测试“多视图”新特性苹果在为 Apple TV 应用测试“多视图”新特性 P14 苹果正在为 Apple TV 应用测试一项名为“多视图”的新特性,该特性的实现与完善将可支持用户同时观看多达四个画面的直播内容。 制作Production Hitachi Kokusai 展示最新 4K 超高清相机系统Hitachi Kokusai 展示最新 4K 超高清相机系统 P15 NAB Show2023 上,Hitachi Kokusai 公司展示了最新研发的 4K超高清相机系统,该系统具有突出的性能可用于专业现场活动制作和广播制作,还可作为组件应用于下一代摄像机中。 A I 1Meta 推出文本生成三维动态场景 AI 模型 3 月 19 日消息,Meta 首次提出通过文本描述生成三维动态场景的模型MAV3D(Make-A-Video3D),可以为视频游戏、视觉效果或 AR/VR 应用生成3D 动画。 在具体实现时,MAV3D 使用了 4D 动态神经辐射场(NeRF)、基于输入文本到视频(T2V)的扩散模型,对生成的动态场景外观、密度和运动一致性进行了优化。模型不需要任何 3D 或 4D 数据,只在文本图像对和未标记的视频上进行训练。模型生成的动态场景视频可以在任意机位或角度进行观看,并可以合成到任意 3D 环境中。但是目前的生成效果还处于初级阶段,只能生成一些简单的对象。 左图:一只正在打球的柯基犬。 右上角:一个骑士在砍柴。右下角:一只袋鼠在做饭。 (信息来源:arXiv arxiv.org) 2英伟达发布四款 AI 推理芯片 英伟达在 3 月 21 日的 GTC 2023 大会上发布了四款用于 AI 推理的新芯片。 第一款 AI 视频芯片 L4 具有视频云推理功能,其功能主要集中于视频解码和转码、视频内容审核、视频通话等,可在视频通话过程中实现背景替换、重打光、眼神交互、语音转录和实时语言翻译等。 第二款推理芯片 L40 主要用于 Omniverse(英伟达的“工业元宇宙平台”)、图形渲染和生成式 AI,能够胜任文本到图像、文本到视频等跨模态生成任务。同为针对图像的 AI 推理芯片,L40 相比 L4 更通用,可以实现所有与图像相关的场景优化。 第三款芯片 H100 NVL 是面向 ChatGPT 等应用的针对预训练大模型的芯片。一台 8 卡的 H100 NVL 的速度是目前标配 8 卡 A100 服务器的 10 倍。 该芯片的推出不仅可提升大模型训练速度,也将降低相关公司在算力方面的成本。 第四款芯片 Grace Hopper 是存算一体的超级芯片。其由 Grace CPU和 Hopper GPU 连接而成,拥有一个 900GB/ 秒的高速接口。相较于 CPU和 GPU 之间传统的通过 PCIE 连接的方式,在 Grace 中查询嵌入并传输到Hopper 的速度快了七倍。Grace Hopper 可以用来处理大型数据集,适用于推荐系统和大型语言模型的 AI 数据库。 (信息来源:甲子光年公众号) 3华为将上线盘古系列 AI 大模型 3 月 27 日消息,华为旗下的盘古系列 AI 大模型即将上线,包括自然语言处理(NLP)大模型、计算机视觉(CV)大模型等。据官网介绍,盘古大模型使用了大量的中文语料库进行训