AI智能总结
双目视觉:仿人眼原理,赋能立体感知:3D感知技术可以分为单目视觉、双目视觉、多目视觉、ToF、结构光、激光三角测量法等。其中,双目视觉的工作原理与人眼进行深度感知的原理类似,其具体原理是三角测量技术,通过从两个视点观察同一物体,从而获得同一物体在不同视角下的图像。双目视觉相较于单目视觉获得更精准的测距能力,相较于激光雷达其摄像头成本更低。 应用:“智能驾驶、人形机器人、无人机”三大场景加速渗透:(1)在智能驾驶领域,双目视觉助力实现低成本高阶智能驾驶,国内已有多个品牌推出纯视觉方案,且价格友好。(2)在人形机器人领域,双目视觉可提供丰富的三维空间信息与纹理细节,在人形机器人近距离环境感知中具有显著优势。(3)在无人机领域,双目视觉可解决无人机测地高度和自主避障两大痛点,自2016年以来,国内厂商陆续发布应用双目视觉的无人机产品。 双目视觉相关公司梳理:(1)元橡科技(未上市):在智能驾驶领域,公司以纯视觉方案进入车载领域,开业界先河。在机器人领域,公司已与10余家国内外领军客户达成合作。其他行业中,公司合作客户涵盖无人机、智慧物流、智能仓储、智慧城市等领域。(2)奥比中光-UW:根据公司官网,公司机器人视觉业务在中国服务机器人市场占有率超过70%,已开发出结构光、iToF、双目视觉传感器,及dToF单线激光雷达、工业三维测量设备,并积极布局面阵dToF、面阵Lidar等前沿技术。(3)保隆科技:公司于2017年开始研发车载双目摄像头,2019年实现量产,其800万像素三目摄像头在2024年已为国内车企量产。公司开发出业界最大尺寸的双目系统,对机器人和飞行器领域提供了感知支持。(4)海康威视:公司下属海康机器人主营机器视觉与移动机器人,在机器视觉方面,3D视觉产品为未来发展重点方向,此类产品已初步完成系列化布局,各方面指标参数均达到与竞品相当的水平。 投资建议:我们认为,双目视觉有望成为智能驾驶/人形机器人/无人机等领域的主流视觉方案,建议关注奥比中光-UW、保隆科技、海康威视等相关标的。 风险提示:下游应用领域发展不及预期、原材料价格波动、技术迭代等风险。 1双目视觉:仿人眼原理,赋能立体感知 1.13D感知:涵盖双目视觉、ToF、结构光等多类技术 3D感知技术按照是否需通过投射光源来获取被测物体三维形貌信息,可以分为两大类:被动视觉和主动视觉。(1)被动视觉仅利用相机拍摄被测物的图像,建立被测物与相机之间的相对位置关系,从而获取被测物表面的三维信息。根据所采用相机的数目,被动视觉可分为单目视觉、双目视觉和多目视觉等。(2)主动视觉需要向被测物体投射光源(点、条纹、图案和散斑等),相机拍摄包含光源的反射光或透射光的被测物体表面图像,利用成像几何关系所建立的数学模型解算出被测物体三维结构信息。主动视觉法包括ToF、结构光、激光三角测量法等。 图1.3D视觉技术分类 单目视觉:单目视觉通常通过获取大量的数据进行学习训练,基于先验知识就可以产生空间信息的判断。 双目视觉:双目立体视觉的工作原理与人眼进行深度感知的原理类似,其具体原理是三角测量技术,通过从两个视点观察同一物体,从而获得同一物体在不同视角下的图像。左右相机对于同一对象在水平方向的像素差异叫做视差(D),结合双目目距(B)、镜头焦距(F),通过Z=BF/D的公式就可以得到物体距离(Z),有了距离之后还可以算出X和Y的值,因此基于双目就可以得到一个空间信息。 相较于单目视觉,双目视觉避免了系统对大量非标障碍物的学习和识别成本,并获得比单目更精准的测距能力;相较于激光雷达,双目摄像头不仅成本更低,且能获得比激光雷达更稠密的点云。 图2.双目视觉技术原理 多目视觉:为减少双目立体视觉测量中同名像点匹配的多义性,在双目立体视觉测量系统的基础上,增加一台或多台辅助相机,即构成多目视觉测量系统。通过多个相机间需满足的成像几何约束可减少误匹配现象,且可以通过光束平差提高测量精度,但计算量也会相应增加,降低测量速度和效率。 图3.多目视觉技术原理 ToF:ToF(time-of-flight飞行时间法)是通过给目标连续发射激光脉冲,利用传感器接收在被测平面反射的光脉冲,计算光脉冲往返时间,得到目标物距离。ToF可进一步分为iToF(间接飞行时间法)和dToF(直接飞行时间法)。(1)iToF:是一种通过直接测量激光从发射到接收之间的飞行时间来实现距离测量的技术,主要包括发射端、接收端以及深度引擎芯片,发射端激光一般被调制成连续波和脉冲波两大类,接收端则通过iToF感光芯片来采集返回光信号,由处理电路实现相位差计算,并进一步对相位差进行滤波、转换等计算以获取深度图像。(2)dToF:是一种通过直接计算脉冲光从发射到接收之间的飞行时间来实现距离测量的技术,主要包含激光发射端和单光子探测阵列芯片。激光发射端向目标发射脉冲光束,经物体反射后被单光子探测阵列芯片采集,获取脉冲光束的飞行时间,进一步计算以获取深度图像。 图4.ToF技术原理 结构光:结构光原理是向物体投射出黑白相间的结构性光束,这些光束由于物体表面形状的不同而产生变形,表现在图像中则是结构性光束发生了变形和扭曲,即高差变化和不连续,高差变化的程度用于计算深度,不连续则显示出了物体表面的物理间隙,进而计算出物体的位置和深度等信息,最终复现三维空间。 图5.结构光技术原理 激光三角测距法:激光三角测距法是通过图像采集系统,采集被测物表面漫反射的激光轮廓。基于设备已知的性对位置,通过算法处理,获得被测物表面的三维轮廓数据,以还原目标物体三维空间信息。 2028年全球3D感知市场规模有望超千亿元。根据Yole group统计,2022年全球3D感知市场规模为82亿美元,随着智能驾驶、无人机、智能家居等应用领域的发展,预计2028年全球3D视觉感知市场规模将扩张至172亿美元(约合1204亿元人民币),2022-2028年复合增速达到13.2%;其中,到2028年,汽车领域应用规模将从2022年的6.58亿美元增长至46.4亿美元,年复合增速达38.5%,占比提升至27%。 图6.全球3D视觉感知市场规模预测及下游应用结构 1.2双目视觉优势:性能优良,结构简洁,成本较低 双目视觉与单目视觉相比,优势在于无需先验知识。以汽车避障为例,单目视觉需要依据先验知识,对物体进行识别和分类,才能根据图像大小的变化来计算物体距离,而双目视觉避免了系统对大量非标障碍物的学习和识别成本。 双目视觉与多目视觉相比,优势在于结构配置更简单。以三目视觉为例,三目视觉系统要合理安置三个摄像机的相对位置,其结构配置比双目视觉系统更烦琐,而且匹配算法更复杂需要消耗更多的时间,实时性更差。 双目视觉与三种常用主动视觉法(结构光、激光三角测量、ToF)相比,优势在于性能优良同时保持低成本。双目视觉在分辨率、抗干扰能力、测量距离等方面均表现优良,且不需要结构光、ToF、激光等发射器和接收器,因此结构简单硬件成本低,适合成本敏感的应用场景。另外,双目视觉依靠自然光,可在室内外使用。 表1.双目视觉与三种常用主动视觉法性能对比 2应用:“智能驾驶、人形机器人、无人机”三大场景加速渗透 2.1智能驾驶:双目视觉助力实现低成本高阶智能驾驶 双目视觉用于智能驾驶,性能表现优秀,且成本低。根据2014年日本的一份研究报告,对比富士重工、沃尔沃,日产和宝马四款车型各自传感器配置发现,在对车和行人的紧急自动制动实机测试中,双目具有较强优势,防碰撞安全等级排序为“双目>雷达+单目+激光>单目”。从成本角度来看,纯视觉方案(尤其是双目视觉方案)拥有更低成本,国外双目成本比单目贵20%,但比雷达+单目+激光组合方案低100%。 图7.双目立体视觉在城市交通场景下更具优势 表2.四款车型传感器配置对比 目前,自动驾驶视觉技术路线主要分为两大类:一是视觉主导的多传感器融合方案,另一种以低成本激光雷达为主导。视觉主导的环境感知技术采用多摄像头、毫米波雷达、超声波雷达和低成本激光雷达融合感知的方案。当前技术条件下,摄像机成像受环境光照的影响较大,基于人工智能的目标检测与定位可靠性仍然较低,但其优势在于传感器成本低。 特斯拉FSD(Full Self-Drive)智驾系统坚持纯视觉方案。2014年特斯拉启动Autopilot项目,早期方案依赖摄像头+毫米波雷达+超声波传感器的多传感器融合。 2021年5月,特斯拉宣布取消量产车标配的毫米波雷达,仅保留全车8个摄像头,首次明确纯视觉技术路线,并基于其自研的BEV感知模型和Transformer算法,替代了传统雷达的作用。特斯拉最新(2023年)发布的FSD HW4.0版本硬件沿袭了纯视觉技术路线,搭载12个500万像素高分辨率摄像头,最远探测距离拓展至424米,并重新引入高精度4D毫米波雷达,以弥补纯视觉方案在极端天气或复杂光照条件下的局限性。 国内已经有多个品牌推出纯视觉方案,且价格友好。比亚迪天神之眼C版本“二郎神”方案、卓驭(原大疆车载)的成行平台、华为的ADS SE(乾崑智驾基础版)等国产视觉方案覆盖车型价格已下探至约7万元。相比之下,特斯拉FSD(HW4.0)套件入华选装价格高达6.4万元。 比亚迪“天神之眼”:2025年2月10日,比亚迪在深圳总部召开智能化战略发布会,发布高阶智能驾驶系统“天神之眼”。天神之眼C版本“二郎神”方案创新采用双广角摄像头+长焦摄像头,物体探测精度 1cm ,高程感知时延低至30ms,最远探测距离可达 350m 。同时,天神之眼C首批21款车型上市,覆盖车型价格区间6.98万元-24.98万元,包括了海鸥、海豚、海狮、海豹、秦、宋、元、唐、汉等车系,基本上做到了比亚迪王朝网和海洋网的全覆盖。 图8.天神之眼C版本采用双广角摄像头+长焦摄像头 图9.天神之眼C版本性能指标 图10.天神之眼C版本搭载车型及价格 大疆“成行平台”:“成行平台”是大疆车载为车企提供的全场景智能驾驶解决方案,首次亮相于2023年百人会年会。按照传感器构型+芯片算力的多阶梯配置划分,「成行平台」主要有三个量产版本:基础版7V+32TOPS、升级版7V+100TOPS、高配版10V+100TOPS。目前7V+32TOPS基础版配置已在多款量产车型上搭载(宝骏云朵/iCAR03/宝骏悦也plus),通过极致性价比将可搭载车型的门槛降低到了8万元级别。 图11.大疆“成行平台”基础版7V+32TOPS配置 华为乾崑:2024年4月,华为乾崑发布乾崑智驾基础版方案ADS SE,该版本支持纯视觉但不含激光雷达,提供高速智驾领航辅助、智能泊车辅助等功能,并已实现搭载于15~20万级别车型,推动更多中低端车型实现智驾平权。 2024年9月,深蓝L07正式上市,搭载华为乾崑智驾ADS SE纯视觉方案,价格低至16.69万元。 图12.深蓝L07搭载华为乾崑ADS SE 2.2人形机器人:双目视觉可实现“类人眼”感知效果 双目视觉技术模仿人类双眼视差原理,能够提供丰富的三维空间信息与纹理细节,在人形机器人近距离环境感知中具有显著优势。激光雷达虽具备厘米级测距能力,但无法直接获取图像信息(如颜色、纹理等),且其体积、功耗和成本在人形机器人应用中受到较大限制。此外,由于人形机器人主要在低速状态下工作(如室内服务场景),其对远距离轮廓和毫米级精度的需求相对降低,而更依赖视觉系统对近距离目标的快速语义理解与响应。 当前人形机器人厂商采用的视觉传感器方案大致可以分为两类:一是纯视觉方案,这种方案依赖于摄像头和视觉算法进行环境感知,主要应用于特斯拉和小鹏等厂商的机器人;二是多传感器融合方案,该方案通过结合多个传感器(如深度相机、摄像头、RGB相机、激光雷达、ToF相机等)来增强机器人感知能力,应用于小米、智元、宇树、优必选等厂商。 表3.国外人形机器人视觉方案对比 表4.国内人形机器人视觉方案对比 特斯拉Optimus:沿用其智驾纯视觉路径。特斯拉Optimus