您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[ABP]:科技动态2023年第25期(总第25期) - 发现报告

科技动态2023年第25期(总第25期)

2024-01-25-ABP严***
AI智能总结
查看更多
科技动态2023年第25期(总第25期)

制作 我国 AVS 虚拟现实音频团体标准正式发布.........................................07苹果AI技术30分钟内生成“数字化身”.................................................07谷歌推出视频生成多模态大模型VideoPoet..............................................08 传 输 电信、华为完成“双频8T8RRRU”高铁商用验证.................................08中国移动联合华为完成国内首个智慧海域5GRedCap应用试点测试..........09中国移动研究院成功研制3GPPR17NRNTN星载基站.........................09 终端与应用 三星面向机器人和XR应用发布新型定制传感器.....................................10Displace将推出两款“真无线”OLED电视新机型......................................10中国企业在全球MiniLED电视市场份额上升..................................................11华为推出灵犀指向遥控,提升智能操控体验............................................112024年AI在视频流媒体行业中的作用将攀升...............................................12优酷推出AI对话类影视搜索引擎“AI搜片.............................................12爱奇艺完成鸿蒙原生应用Beta版本开发....................................................13 摘要 制作Make 我国 AVS 虚拟现实音频团体标准正式发布我国 AVS 虚拟现实音频团体标准正式发布 P07 近日,中关村视听产业技术创新联盟正式发布了由字节跳动、腾讯、小米、华为等公司起草的《信息技术 虚拟现实内容表达 音频》团体标准。该标准结合国内 VR 音频产业发展的实际情况,对虚拟现实音频的采集、制作、渲染和传输技术进行了规范。 苹果 AI 技术 30 分钟内生成“数字化身”苹果 AI 技术 30 分钟内生成“数字化身” P07 近日,苹果发布了其生成式 AI 技术 HUGS,该技术能够在 30 分钟内从运动人体短视频中分析创建可动画化的人类数字化身,以 60fps 的速度渲染合成目标人体在新场景、新动作下的视频。 谷歌推出视频生成多模态大模型 VideoPoet谷歌推出视频生成多模态大模型 VideoPoet P08 谷歌推出了基于大语言模型架构的视频生成大模型 VideoPoet,具有图文生视频、视频风格化、视频动作控制等功能。相比其他模型,VideoPoet 接受多模态输入,能产生连贯、稳定的大动作内容,并能实现零样本学习的视频生成。 传输Transmission 电信、华为完成“双频 8T8R RRU”高铁商用验证电信、华为完成“双频 8T8R RRU”高铁商用验证 P08 安徽电信携手华为在合福高铁铜陵段完成了 1.8GHz+2.1GHz 双频 8T8R RRU 首次商用验证。其双频双模的覆盖方式使得高铁用户能够无缝切换 5G 与 4G 服务,并享受稳定且流畅的视频直播、远程办公等网络体验。 中国移动联合华为完成国内首个智慧海域 5G RedCap 应用试点中国移动联合华为完成国内首个智慧海域 5G RedCap 应用试点测试测试 P09 中国移动联合华为在福建宁德完成了国内首个智慧海域行业细分场景下的 5G RedCap 应用试点测试。测试涵盖 700MHz 和2.6GHz 主流 5G 频段,5G RedCap 技术为智慧海域场景提供了低成本、低时延、高可靠的网络服务。本次测试为加速 5GRedCap 商用规模化落地奠定了坚实基础。 摘要 中国移动研究院成功研制 3GPP R17 NR NTN 星载基站中国移动研究院成功研制 3GPP R17 NR NTN 星载基站 P09 中国移动研究院成功研制基于 3GPP R17 NR NTN 标准的星载基站,并完成地面通信测试。该基站可为终端提供直连卫星的无线网络覆盖服务,验证了基于星上再生模式的手机直连低轨卫星技术可行性,对手机直连低轨卫星研究与应用推广具有重要意义。 终端与应用TerminalandApplication 三星面向机器人和 XR 应用发布新型定制传感器三星面向机器人和 XR 应用发布新型定制传感器 三星公司发布了面向机器人和 XR 应用量身定制的两款新型传感器 ISOCELL Vizion 63D 和 ISOCELLVizion 931。前者是可捕获高分辨率 3D 图像和精确深度信息的单芯 ToF 传感器,后者是为精细捕捉动态瞬间而设计的全局快门传感器,适用于 XR 设备、机器人等实现安全的面部生物识别和运动跟踪。 Displace 将推出两款“真无线”OLED 电视新机型Displace 将推出两款“真无线”OLED 电视新机型 P10 美国 Displace 将在 CES 2024 发布其“真无线”OLED 电视的两款新机型,该系列电视依靠充电电池运行,支持触摸、语音及手势操控。新机型将新增 NFC 支付功能和用于配合远程医疗的热像仪。 中国企业在全球 Mini LED 电视市场份额上升中国企业在全球 Mini LED 电视市场份额上升 P11 截至 2023 年第三季度,三星电子在全球 Mini LED 电视市场的占有率从 2022 年的 70% 跌至 39%。而中国企业海信和 TCL 的Mini LED 电视出货量在一年内分别增长了 18 倍和 112%,市场占有率分列第 2 名 (27%) 和第 3 名 (26%)。 华为推出灵犀指向遥控,提升智能操控体验华为推出灵犀指向遥控,提升智能操控体验 P11 近日,华为推出灵犀指向遥控,绝对指向交互技术是其最大亮点。用户可以如同使用激光笔,精准指向目标并选中,还可以实现跳选、滑动、拖拽等多种操控。同时,用户可长按语音键调用智慧屏智慧助手,实现智能家居控制功能。目前这款遥控器仅适用于华为智慧屏 V5 系列,未来将逐步加入更多适配机型。 摘要 2024 年 AI 在视频流媒体行业中的作用将攀升2024 年 AI 在视频流媒体行业中的作用将攀升 P12 近日,西班牙 NPAW 公司预测,2024 年 AI 在视频流媒体中的应用将进一步增强。AI 将在自然语言驱动的数据分析、个性化体验、内容推荐方面发挥关键作用,在实时字幕及配音方面也将取得突破。AI 的应用将使用户个性化体验更丰富和智能,同时能更轻松地访问内容。 优酷推出 AI 对话类影视搜索引擎“AI 搜片”优酷推出 AI 对话类影视搜索引擎“AI 搜片” P12 优酷推出的 AI 对话类影视搜索引擎“AI 搜片”具有全网搜片和影视百科两大核心功能,可实现与 AI 对话模糊提问获取高匹配度内容,还可化身数字人与用户畅聊剧集相关信息,为用户带来了全新的观影体验。 爱奇艺完成鸿蒙原生应用 Beta 版本开发爱奇艺完成鸿蒙原生应用 Beta 版本开发 P13 爱奇艺日前宣布完成鸿蒙原生应用 Beta 版本开发,成为影音娱乐领域首批开发者。基于 HarmonyOS 分布式特性,爱奇艺鸿蒙原生应用可在手机、平板、智慧屏、车机等设备间便捷无缝流转,以优质内容提升用户的多场景娱乐体验,为在线视频娱乐产品打开更广阔的想象空间。 制作 1我国 AVS 虚拟现实音频团体标准正式发布 近日,字节跳动、腾讯、小米、华为等公司共同起草的 AVS 虚拟现实(VR)音频团体标准《信息技术 虚拟现实内容表达 音频》由中关村视听产业技术创新联盟正式发布。 该 AVS VR 音频标准描述了虚拟现实音频表达所需要的元数据、渲染器及面向传输的数据流格式,支持三自由度(3DOF)和六自由度(6DOF)等 VR 场景下所需要的技术功能,涉及基于声道、对象、场景三类信号的采集制作和渲染回放等相关技术描述。该标准采纳的所有技术均经过了第三方测试验证和实际应用中的系统验证。其中,AVS VR 音频双耳渲染技术还在 VR 头显设备中基于 Unity 3D 软件平台进行了 3DOF 和 6DOF 下的主观听音测试验证。 该标准遵循 ITU-R BS.2076-2 规范,并根据国内 VR 音频产业发展的实际情况进行了调整,适应我国全景音频播出、沉浸式音频通信、虚拟现实音频交互等领域的需求,填补了国内 VR 音频技术标准的空白。 (信息来源 :新一代人工智能联盟微信公众号) 2苹果 AI 技术 30 分钟内生成“数字化身” 近日,苹果机器学习团队发布了最新的生成式 AI 技术 HUGS,该技术使用了神经渲染方法 3D GaussianSplatting 和 SMPL 人体模型,能够在 30分钟内分析人物动态短视频,然后创建目标人物在新场景下的新动作,生成数字人类分身。 苹果的研究人员表示,HUGS 使用 SMPL 人体模型来初始化人类高斯模型,虽然无法捕获每个细节,但对于未建模的元素(如布料和头发),HUGS 的生成过程可以偏离 SMPL 模型进行自动填充。当前的神经渲染技术通常只适合应用在静态场景中,不能在动态场景中进行自由移动的人类建模。相比当前的神经渲染技术,HUGS 技术填补了这一空白,为创建逼真的数字人类分身提供了新的解决方案。 HUGS 对输入数据的要求很低,最少可以低至 50 到 100 帧的单目视频,相当于 2 到 4 秒的 24fps 视频。训练后的 AI 模型可以“在 30 分钟内解耦静态场景和可动画化的人类化身”,以 60fps 的渲染速度输出高质量的人体动画,比 NeuMan 和 Vid2Avatar 等其它方法快 100 倍。 (信息来源 :IT 之家 www.ithome.com) 3谷歌推出视频生成多模态大模型 VideoPoet 12 月 19 日,谷歌推出其视频生成多模态大模型 VideoPoet,根据用户的文本提示或图片输入,其能够在零样本学习的情况下一次生成 10 秒且有连贯大动作的视频;还能够根据用户文本提示信息对输入视频重新进行风格化设计,例如加入烟雾等;或是通过增补画面将之拓展为一段新视频,亦或是改变物体运动轨迹生成不同的动作,例如让蒙娜丽莎移动身体、改变表情等。 之 前 的 主 流 视 频 生 成 模 型 如 Stable VideoDiffusion 和 VideoDiffusion 是采用扩散架构,而 VideoPoet 是基于大语言模型(LLM)的自回归架构来实现零样本视频生成功能。VideoPoet 还引入多种多模态生成学习目标,在视频、图像、音频和文本之间进行跨模态学习,包括文本到视频、文本到图像、图像到视频等,这些任务可以相互结合,能将多种视频生成功能无缝集成到单个大模型中。 相比基于扩散方法的大多数视频生成模型,VideoPoet 能生成连贯的大动作,接受多模态输入,具备零样本视频生成能力,输出画面更加稳定、动作更逼真,可节省大量数据和计算资源。 (信息来源:IT 之家 www.ithome.com) 传输 4电信、华为完成“双频 8T8R RRU”高铁商用验证 12 月 20 日 消 息, 安 徽 电 信 携 手 华 为 在 合 福 高 铁 铜 陵 段 完 成 了1.8GHz+2.1GHz 双频 8T8R RRU 首次商用验证。乘客可以在高铁上享受流畅的视频直播、高清视频、5G 通话等多种娱乐业务,也可以方便地进