您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[ABP]:科技动态2023年第8期(总第8期) - 发现报告

科技动态2023年第8期(总第8期)

信息技术2024-08-05-ABPD***
AI智能总结
查看更多
科技动态2023年第8期(总第8期)

Meta 发布 AI 模型 SAM,可准确识别图像中的对象............................07HuggingGPT:用自然语言的方式帮助人类完成多模态复杂 AI 任务...07Disguise 与 Move.ai 开发 AI 无标记点运动捕捉技术.............................08OpenAI 开源新模型代码,AI 图像生成速度更快....................................08Meta 连续开源 AIGC 模型,降低 AI 技术开发门槛.............................09马斯克成立人工智能公司,与 OpenAI 展开竞争.................................09 传输 BitFire 公布高动态范围直播视频传输技术............................................10联发科与 Inmarsat 合作研发卫星直连通信技术....................................10调查报告:云、IP 和 5G 在广播行业的应用不断发展.........................11 终端与应用 中科大研究团队提出超高密度 3D 全息投影新方法................................11海信发布全球首款 8K 激光电视............................................................12我国高动态范围和三维声标准推广至海外应用.......................................13全国首个景区元宇宙体验馆落户张家界....................................................13苹果智能戒指专利可利用手势完成 VR/AR 场景交互.............................14韩国光州科学技术学院与麻省理工学院合作研发新的 VR 运动系统..14 市 场 预测:未来五年全球 OTT 电视服务收入将大幅增长.............................15华纳兄弟探索(WBD)推出全新流媒体 Max......................................15 摘 要 A IArtificial Intelligence Meta 发布 AI 模型 SAM,可准确识别图像中的对象Meta 发布 AI 模型 SAM,可准确识别图像中的对象 P07 Meta 发布 AI 模型 SAM 和用于图像分割的掩码数据集。SAM 可以高效、高质量地分割图像或视频中的任何对象,成为 AR/VR、内容创建等领域及更通用 AI 系统的强大组件。 HuggingGPT:用自然语言的方式帮助人类完成多模态复杂 AI 任HuggingGPT:用自然语言的方式帮助人类完成多模态复杂 AI 任务务 P07 浙大与微软亚洲研究院推出大模型协作系统 HuggingGPT,采用自然语言作为通用接口,使用 ChatGPT 作为中间控制器,连接现有各种 AI 模型来解决多模态的复杂 AI 任务。该系统是迈向人工通用智能(AGI)的关键一步。 Disguise 与 Move.ai 开发 AI 无标记点运动捕捉技术Disguise 与 Move.ai 开发 AI 无标记点运动捕捉技术 P08 Disguise 与 Move.ai 公司正在合作开发一种基于实时动作捕捉软件的 AI 技术,将无标记点动作捕捉技术与图形处理技术结合起来,从视频中提取自然的人体运动,创建实时映射人体运动的虚拟角色,以实现“虚拟制作和元宇宙体验大众化”。 OpenAI 开源新模型代码,AI 图像生成速度更快OpenAI 开源新模型代码,AI 图像生成速度更快 P08OpenAI 提出了一种名为 Consistency Models 的生成模型,无需对抗训练即可快速获得高质量样本,并可实现一步生成图像,生成速度可达每秒 18 张。该模型将成为扩散模型的有力竞争者。 Meta 连续开源 AIGC 模型,降低 AI 技术开发门槛Meta 连续开源 AIGC 模型,降低 AI 技术开发门槛 Meta 公司近期连续开源 AIGC 领域内容生成模型,包括 AI 动画绘图生成模型和开放语言分割模型,分别可以实现“涂鸦转动画”与“未知类别的图像分割”功能,进一步降低 AI 技术开发门槛。 P09 马斯克成立人工智能公司,与 OpenAI 展开竞争马斯克成立人工智能公司,与 OpenAI 展开竞争 P09 马斯克近日成立了一家名为 X.AI 的人工智能公司,旨在与聊天机器人 ChatGPT 的开发公司 OpenAI 展开竞争。 摘 要 传输Transmission BitFire 公布高动态范围直播视频传输技术BitFire 公布高动态范围直播视频传输技术 IDC 与浪潮信息联合发布的《2022-2023 中国人工智能计算力发展评估报告》指出,2022 年中国智能算力规模超过通用算力,预计未来 5 年中国智能算力规模的年复合增长率将达 52.3%。 联发科与 Inmarsat 合作研发卫星直连通信技术联发科与 Inmarsat 合作研发卫星直连通信技术 美国 Displace 公司宣布将在 2023 年 1 月的 CES 展会上推出“世界上第一台真正的无线电视”,该款 55 英寸 4K OLED 电视没有电线或端口,使用专有的可更换电池系统,依靠可充电电池运行。 调查报告:云、IP 和 5G 在广播行业的应用不断发展调查报告:云、IP 和 5G 在广播行业的应用不断发展 为了服务听障人群,英国 AR 公司 XRAI Glass 推出具有语音转文字功能的 AR 眼镜,该眼镜能够将语音生成字幕,并直接呈现在用户眼前,还能将文字记录保存在手机端,方便以后回溯。 终端与应用Terminal and Application 中科大研究团队提出超高密度 3D 全息投影新方法中科大研究团队提出超高密度 3D 全息投影新方法 中科大研究团队提出一种超高密度 3D 动态全息投影的新方法,解决了投影平面深度分辨率低和平面间图像串扰大的问题,能够实现高密度、低串扰、大视角的三维动态全息投影。 海信发布全球首款 8K 激光电视海信发布全球首款 8K 激光电视 P12 海信视像在其全场景显示战略发布会上公布了多款全场景显示产品,包括全球首款 8K 激光电视 LX。LX 能投影 100 英寸超清巨幕画面,拥有高达 3300 万个细节点,画质表现优异。 我国高动态范围和三维声标准推广至海外应用我国高动态范围和三维声标准推广至海外应用 UWA 联盟与会员单位法国 Explorers 公司在北京签署内容合作备忘录,将采用高动态范围 HDR Vivid、三维声 Audio Vivid 等技术标准,对其纪录片进行色彩调节与音画效果提升。Explorers的部分纪录片已经采用 8K+HDR Vivid 制作,这是 HDR Vivid 标准在海外的首次应用。 摘 要 全国首个景区元宇宙体验馆落户张家界全国首个景区元宇宙体验馆落户张家界 P13 全国首个景区元宇宙体验馆将于 4 月 28 日在张家界国家森林公园开放,该项目使用体积视频、虚拟人与高精度数字孪生及AI+XR 等技术为游客打造有故事、有内容的元宇宙沉浸式游览空间。 苹果智能戒指专利可利用手势完成 VR/AR 场景交互苹果智能戒指专利可利用手势完成 VR/AR 场景交互 P14 苹果最近获得了一项“智能戒指”设计专利,该专利可用于增 强 现 实(AR) 或 虚 拟 现 实(VR) 场 景, 通 过 左 右 手 分 别佩戴智能戒指,由内置传感器检测手势,从而在虚拟环境中实现对应操作。 韩国光州科学技术学院与麻省理工学院合作研发新的 VR 运动系韩国光州科学技术学院与麻省理工学院合作研发新的 VR 运动系统统 P14 韩国光州科学技术研究院与美国麻省理工学院的研究人员合作开发了一种基于脚的 VR 运动系统“Seamless-walk”,通过步态识别和分析,为用户提供沉浸式、自然且舒适的 VR 体验。 市场 Market 预测:未来五年全球 OTT 电视服务收入将大幅增长预测:未来五年全球 OTT 电视服务收入将大幅增长 P15 全 球 OTT 电 视 和 视 频 预 测 报 告 表 明,OTT 电 视 剧 集 和 电 影的收入将在 2028 年达到 2350 亿美元,比 2022 年的 1540亿美元增加 810 亿美元。 华纳兄弟探索(WBD)推出全新流媒体 Max华纳兄弟探索(WBD)推出全新流媒体 Max 华纳兄弟探索(WBD)推出全新订阅型视频点播服务流媒体Max,其亮点在于高质量视频回放、个性化服务、更突出的孩子体验、简洁的导航以及 4K 超高清画质。 P15 A I 1Meta 发布 AI 模型 SAM,可准确识别图像中的对象 4 月 6 日,Meta 发 布 AI 模 型 Segment Anything Model(SAM),该模型能够根据文本指令等方式进行图像分割,实现“一键抠图”并识别出分割对象种类。此外,Meta 还发布了使用 SAM 收集的图像注释数据集Segment Anything 1-Billion mask dataset(SA-1B),并表示这是有史以来最大的分割数据集。该数据集可用于研究目的,允许他人在较为宽松的Apache 2.0 许可下使用。 SAM 是基于提示工程(Prompt engineering)技术的可组合系统设计方式,在包含超过 10 亿个掩码的高质量且多样化的数据集上进行训练,这使其能够泛化到新任务和新领域,用于查找和分割图像中的任何对象。开发者可以在该模型的基础上,开发出功能更强大、影响范围更广的人工智能模型。 SAM 可以成为 AR、VR、内容创建、科学领域和更通用 AI 系统的强大组件。在虚拟现实(VR)和增强现实(AR)场景中,SAM 可以根据用户的视线选择对象,然后将其“提升”至 3D。对于内容创作者,SAM 可以提取图像区域以进行拼贴或视频编辑。对于 Meta 来说,SAM 模型可以帮助建立其智能眼镜项目(Project Aria),例如通过 AR 眼镜识别日常物品,向用户发出提醒和指示。 (信息来源 1:DATA CONOMY dataconomy.com)(信息来源 2:Meta AI ai.facebook.com) 2HuggingGPT:用自然语言的方式帮助人类完成多模态复杂 AI 任务 4 月 3 日消息,浙江大学与微软亚洲研究院合作推出大模型协作系统HuggingGPT,该系统以自然语言作为通用接口,能够根据请求自动分析并选择 AI 模型来解决多模态的复杂 AI 任务。其工程流程分为四步:任务规划、模型选择、任务执行和输出结果。 HuggingGPT 设计的目的是实现人工通用智能(AGI),其关键在于能够解决具有不同领域和模式的复杂 AI 任务。先前的研究成果离此还有一定距离,因为大量的 AI 模型只能出色地完成某一特定任务。HuggingGPT 使用大语言模型 ChatGPT 作为中间控制器来管理现有的所有 AI 模型,可以通过“调动和组合个体力量”,来解决复杂的 AI 任务。HuggingGPT 使用 ChatGPT 解析用户请求 , 例如“生成一个女孩正在看书的图片,她的姿势与给定图片中的男孩相同。然后请用你的声音描述新图片”,并将任务分为多个具体的子任务,并根据需要选定合适的 AI 模型来完成任务。 HuggingGPT 的应用范围非常广泛,可以在各种形式的复杂任务上表现出良好的性能。例如,在