AI智能总结
3D内容制作与生成产业研究报告 3D Content Production and Generation Research Report MellsennXR 王颖WellsennXR高级分析师电话/微信:15021482640Email:wangying@wellsenn.com 何万城WellsennXR首席分析师电话/微信:18611823719Email:hewancheng@wellsenn.com 维深信息wellsennXR助手交流群/微信:17302629715添加请备注:XR内容交流 免责声明: 本报告所采取的数据均来自于合规渠道,研究方法和分析逻辑基于维深信息的专业理解,准确的反应了作者的研究观点。本报告仅在相关法律许可的情况下发布和流转,在任何情况下,本报告中的信息或者表述的观点均不构成对任何人和任何机构的投资建议。本报告的信息来源于公开的资料和数据库,维深信息对该信息的准确性、完整性或者可靠性做尽可能的追求但不做任何保证。本报告所陈列的数据和资料、观点意见和推测预测仅反应报告发布时点维深信息的判断,在不同时期,维深信息可发出与本报告所载的资料、意见及推测不一致的报告。维深信息不保证本报告所含的信息在最新的状态,同时,维深信息对本报告所含信息可在不发出通知的情况下做出修改,读者可自行关注和跟踪维深信息最新更新和修改。 版权声明: 本报告版权归属为维深信息,欢迎研究和引用本报告内容,引用请注明数据来源为"维深信息wellsennXR",对未注明来源的引用、盗用、篡改或其他侵犯维深信息著作权的行为,维深信息将保留追求法律责任的权利。 华天慧创 WLO微型眼动追踪和虹膜识别共用模组 伴随今年6月AppleVisionPro头显设备的发布,眼动追踪和虹膜识别技未成为了未来MR领域热门的需求,华天慧创于2023年10月10日在AR/VR领域首发,推出全球首创WLC微型眼动追踪和虹膜识别共用模组。 华天慧创科技(西安)有限公司是天水华天电子集团新设立的高科技子公司。公司成立于2018年3月,地处西安经济技术开发区。慧创公司总投资23亿元,一期面积:15000m2,二期面积:37000m²。 公司主要以“晶圆级微纳光学设计&制造"为核心,业务范围主要集中在微纳米光学器件、医用内窥镜、光通讯、AR/VR光波导、模组封装等领域。集光学设计、工艺开发、模组生产为一体,整合光学与半导体产业链。 前言 互联网信息形式的发展经历了文字,图片,视频三个阶段,这些信息形式都属于2D内容,真发展的规律是信息密度信息承载量来越大,2D内容进化的下一个方向是3D内容,而VR/AR/MR是3D内容最核心的硬件载体。随着XR行业逐步发展和成熟3D内容的生产和应用必将更为广泛产业即将迎来真正的爆发WellsennXR预计到2030年XR领域的3D内容制作产业将达到480亿充规模 2D内容和3D内容之间差异在是否有深度信息,是否能构建三维模型。视觉上观察3D内容会产生立体视觉观察2D内容则不会。从2D内容发展到3D内容中间还有一种内容为2.5D内容,其原理“欺骗大脑“产生的立体视觉,让观察者误以为被观察对象为3D内容,这种内容包括3D电影,空间视频、裸眼3D以及全息投影等其较传统的2D内容会有更优质的视觉体验,随着苹果VisionProMR的推出也将迎来爆发 3D内容生产日前属于专业化生产阶段,由专业从业人员使用专业工具制作应用于工业影视等专业领域现随着移动端配置提升部分中,高端机型具备初步实现3D扫描的可能朝UGC方向发展。 3D建模方式主要有3D扫描建模、3D软件建模、AIGC建模。体积视频拍摄能以三维的方式记录真实的动态,其本质是构建连续的静态3D模型进行播放, 3D扫描建模方式主要有4种:激光三角测量扫描,结构光扫描,飞行时间激光扫描、全局摄影测量。3D软件建模主要有CAD建模、多边形建模,、数字雕刻三种类型。AIGC建模以NeRF技术最为知名,少量图片或一段文字输入即可生成3D模型。 苹果3D内容生态局已有初步维形。苹果3D内容有两种:空间视频,3D模型空间视频使用iphone主摄,超广角两枚相机拍摄,借助双眼视差原理提供立体视觉,苹果3D模型主要采用LiDAR和摄影测量技术,以API的形式提供给开发者使用,制作3D建模软件。 目录 (一)信息载体发展历程(二)互联网信息形态进化趋势 、3D内容形态与分类 一)3D内容形态概述8(二)2.5D内容形态与分类(三)3D内容形态与分类-16 三、3D内容生产19 (一)3D建模-19(二)3D/体积视频拍摄37(三)3D内容创作工具38(四)3D内容生产发展趋势42(五)全球XR产业3D内容规模42(六)3D内容生产产业地图44 四、苹果3D内容生态布局分析45 (二)苹果3D内容生态布局48 一、3D内容发展概述 (一)信息载体发展历程 人类信息传播的主要载体经历了:语言文字照片视频,每种新载体的诞生,各个载体内部的发展,在追求生产效率的同时都在追求如何更为真实,形象地反映真实世界 语言靠声波传递,声波会随距离的增大而衰减,意味着人类用语言进行交流有距离限制超出一定距离便无法依靠声波进行交流,此外,声音稍纵即逝,无法保存。 在图画基础上发展而来的文字打破了这限制它能够将语言完整记录下来,信息能够跨越时间和空间得到保存和传播,所以我们能看到甲骨文、扁鹊医学典籍等的出王佛经才能跨越海洋随众僧传入日本 照片的出现从视觉上记录了某一时刻的真实场景让信息摆脱了人类大脑的中介避免了语言,文字描述的失真,连续的照片组成了视频,记录了连续的时刻。发展至今照片,视频已成为真实记录的最主要手段能最大程度上实现场景的再现。 载体之间,新的载体信息承载量较前者更为丰富。新载体的诞生与每种载体的内部发展都在追求生动形象与临场感。语言讲究绘声绘色,文字讲究信达雅、画作讲究栩栩如生,照片与视频追求更高的分辨率以使呈现效果最天可能接近记录的真实世界 照片,视频之后,想要追求更真实地还原现实世界需要呈现照片视频未记录下的信息,单一照片视频记录的是某一一时刻单个视角下的对象观看者无法知晓其他角度下的对象信息因为被记录对象的纵向信息缺之属于2D内容。真实世界是三维的以3D内容的形式才能进行完整的记录,可供各个视角进行观察。 (一)互联网信息形态进化趋势 通讯技术和XR终端硬件进步推动互联网进入3D化时代。在PC互联网时代,由于算力、储存、网络传输速率等影响,互联网的信息形式主要是文字和图片例如门户网站、BBS论坛以及Email等,主要内容以图文方式呈现。 移动互联网时代手机成为了核心的信息终端,摄像头成为了手机的核心配置之通讯技术,特别是4G大大的提高了传输速率让图片和视频成为移动时代的主要信息呈现形式。 随着5G时代的来临,深度摄像头逐步成为标准配置三维建模和成像技术的进步同时VRAR将成5G时代的通用计算终端,进一步推动对3D内容的需求,3D全息技术将成为5G时代的核心内容形式互联网进入3D化时代成为构建Metaverse沉浸体验的基石。 二、3D内容形态与分类 (一)3D内容形态概述 2D内容与3D内容差异在于是否有纵向维度的信息,视觉体验差别在于是否能产生立体视觉。在2D内容向3D内容发展过程中出现了一种中间形态2.5D内容。 2.5D内容拥有部分3D特征,但无纵向的深度信息,无法构建三维对象,本质上仍为二维。2.5D内容主要有两种形式,一种以3D电影为代表,特点在于制造类似3D的立体视觉效果;另一种以全景为代表,特点在于通过拼接、扩大视场角的方式,尽可能以二维形式记录更多三维空间的内容。 多数人都是在2.5D的体验中完成了对3D的认知,将3D和立体视觉划上了等号,但产生了立体视觉不等于被观察对象为3D内容,2.5D内容虽然让人产生了一定立体视觉,但其本质上是对2D内容的呈现。 1、2D内容与3D内容差异 D是维度Dimension缩写,2D内容与3D内容的差异,在于记录信息的维度。2D内容记录二维信息,3D内容记录三维信息,差异在于被记录内容是否有纵向维度的信息。 在二维平面,每个点都可以用两个坐标数值(x,y),也就是二维坐标来确定位置;在三维空间,每个点都可以用三个坐标数值(x,y,z)也就是三维坐标来确定位置。2D内容与3D内容相比,缺少的正是纵向距离坐标的信息,也就是常说的深度信息。 在几何图形当中,二维的代表是面,三维的代表是立体方,一个立方体有多个面。一只蚂蚁在二维平面,只能沿、y轴构成的平面上、下、左、右爬行,但无法穿过这个面往前、后方向爬行,在立方体中却可以,因为立方体多了一个纵向的维度,让六个面组合成了一个空间。 照片是某个视角下,场景中的颜色信息以像素点为单位被记录在一个面上,照片上的所有像素点拥有二维坐标,这些点集合成了照片上的图像。点的密度越大,照片对物体的记录越详细、越真实,也就是我们常说的分辨率的高低。 如果我们知道每个像素点的三维坐标、颜色、亮度等信息(像素点在三维空间对应体素的概念),将这些点集合在一起组合成三维图像,能从各个角度观察对象。同样,点的密度越大,记录的物体越真实。 2、双眼视差与立体视觉 3D内容与2D内容相较在视觉观察上有一项显著特点一一立体视觉,也就是我们说的立体感。日常生活中接触的3D,通常是利用双眼视差欺骗大脑"产生的立体视觉,而非真的3D。 双眼视差,指人眼在看向某一物体时,由于左、右眼处于水平线不同位置,左、右眼拥有不同的观察视角,物体的反射光线落到左、右眼视网膜成像略有差异,这种差异被称为视差。大脑接收到视差,会将不同的成像信息进行融合,让人产生立体视觉。 观察2D内容,无论从哪个角度观察,左、右眼看到的是相同的图像,无法形成视差也不会产生立体视觉。 生活中接触的3D多利用双眼视差,通过向左、右眼分别投射同一场景下略有差异的二维图像,大脑误以为来自不同视角,让观察者产生立体感,认为在观察立体的3D对象。 (二)2.5D内容形态与分类 日常生活中我们接触到的3D多数情况下是利用了双眼视差产生立体视觉的2.5D内容本质上呈现的是2D图像,2.5D内容主要呈现 呈现3D立体视觉的2D图像,视觉内容不随观看者角度的变化而变化;呈现3D立体视觉的2D图像,视觉内容随观看者角度的变化而变化:·通过扩大视场角、拼接的方式,使用2D图像尽可能记录更大范围三维空间的内容; 2.5D内容追求的是视觉上的3D效果即立体视觉,或更接近三维信息量的2D图像而非真正有深度信息的3D内容。 1、3D电影/电视/游戏 3D电影的立体效果是一种错觉,而不是真实的深度感,是通过左、右眼观看同一场景的不同图像产生视差,让大脑误以为是不同视角的图像进行处理和理解产生的。 3D电影在拍摄时,用双自相机或多个相机同时拍摄同一场景两个相机分别使用不同方向的偏振滤光片光线按照偏振方向进行分离(只有与偏振片相同方向的光线才能透过),两个摄像头拍摄同一个场景,捕捉到两张有差异的图像 在观看3D电影时会在屏幕上同时显示两张图像,3D眼镜左,右镜片贴有对应不同方向的偏振滤光片滤掉相应屏幕上另外一个图像的光线大脑会将左,右眼略有差异的图像视为来自不同角度,从而产生立体感。 除了使用偏振滤光片其他方式下的3D电影播放,最终都是在同一顿画面向左,右眼呈现不同图像形成双眼视差让用户产生立体感, 3D电视,游戏多依靠屏幕高频交替播放左、右眼视图实现观众戴上主动式3D眼镜眼镜片的液晶层在黑色透明两种状态下迅速切换具体切换动作以屏幕上方的红外LED灯发射的红外信号作为指示。播放左眼视图时,遮挡右眼,播放右眼视图时遮挡左眼在高速切换下实现立体视觉, 这种方式也被称为主动快调式3技术佩戴由液晶屏构成进行主动切换的眼镜称为主动式3D眼镜相对应的普通3D眼镜则被称为被动式3D眼镜。这种方式下的立体视觉效果较好,但对屏幕刷新率要求较高,需达120HZ。 2、可交互3D显示器 3D显示