您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[民生证券]:机械一周解一惑系列:机器人大脑算法迭代对视觉方案的影响 - 发现报告

机械一周解一惑系列:机器人大脑算法迭代对视觉方案的影响

机械设备2025-05-09李哲民生证券杨***
机械一周解一惑系列:机器人大脑算法迭代对视觉方案的影响

证券研究报告12025年05月09日维持评级[Table_Author]李哲执业证书:S0100521110006lizhe_yj@mszq.com1.一周解一惑系列:真空镀膜设备国产化进程持续推进-2025/04/212.一周解一惑系列:高端磨床国产替代进程有望加速推进-2025/04/133.一周解一惑系列:SEMICON新品百花齐放,设备公司平台化发展-2025/04/014.一周解一惑系列:具身智能时代各本体公司最新进展-2025/03/245.一周解一惑系列:固态电池产业进展加速,设备企业有望受益-2025/03/16 推荐分析师邮箱:相关研究 目录1商业应用——3D视觉工作原理及应用场景..............................................................................................................31.1主要任务..............................................................................................................................................................................................31.2工作原理..............................................................................................................................................................................................31.3应用场景............................................................................................................................................................................................112 3D视觉算法.........................................................................................................................................................162.1 3D点云数据在机器人大模型中的优势.........................................................................................................................................162.2机器人视觉图像数据获取与3D传感器技术应用....................................................................................................................192.3 3D传感器算法框架..........................................................................................................................................................................216投资建议...............................................................................................................................................................247风险提示...............................................................................................................................................................24插图目录..................................................................................................................................................................25 本公司具备证券投资咨询业务资格,请务必阅读最后一页免责声明证券研究报告 2 本公司具备证券投资咨询业务资格,请务必阅读最后一页免责声明1商业应用——3D视觉工作原理及应用场景3D视觉是一个多学科交叉融合的领域,涉及计算图形学、计算视觉、人工智能等。它旨在让机器理解和处理三维空间中的信息,实现对物体和场景的深度感知、识别与理解。1.1主要任务1.1.13D重建3D场景的深度估计或者对物体表面的数字化采样,以及对3D数据的处理及展示;单目重建、双目重建、基于结构光的重建、基于激光的重建;大场景三维重建、移动端三维重建。1.1.2位姿感知对相机或物体在三维物理空间中的位置和朝向的计算、以及实时跟踪。1.1.33D理解物体的检测、识别、检索,以及对场景或者物体的分割和语义标记等。1.2工作原理3D视觉成像是工业机器人信息感知的一种最重要的方法,可分为光学和非光学成像方法。目前应用最多的还是光学方法。1.2.1飞行时间法(TOF)通过测量光从发射到接收的时间差来计算物体距离。以TOF相机为例,每个像素利用光飞行的时间差获取物体的深度。经典测量方法中,探测器系统发射光脉冲时启动探测接收单元计时,接收到目标光回波时存储往返时间,根据公式估算目标距离。分为直接TOF(DTOF)和间接TOF(I-TOF),DTOF通常用于单点测距系统,实现面积范围3D成像常需扫描技术;I-TOF从光强度的时间选通测量中间接外推时间往返行程,不需要精确计时,是目前基于TOF相机的电子和光混合器的商用化解决方案。TOF成像可用于大视野、远距离、低精度、低成本的3D图像采集,在智能无人系统(如机器人、无人车、无人机等)中用于环境感知。 本公司具备证券投资咨询业务资格,请务必阅读最后一页免责声明1.2.2结构光投影3D成像结构光投影三维成像目前是机器人3D视觉感知的主要方式。由投影仪向目标物体投射特定的结构光照明图案,如条纹、格雷码图案等,相机摄取被目标调制后的图像。由于物体表面的高低起伏,结构光图案在物体表面会发生变形。通过图像处理和视觉模型,对比变形前后的图案,分析图案的畸变情况,就可以计算出目标物体表面各点的三维坐标信息。在机器人手眼系统应用中,对于三维测量精度要求不高的场合(如码垛、拆垛、三维抓取等),投射伪随机斑点获取目标三维信息的方式比较受欢迎。这种方法常用于工业检测、3D建模等领域,能够快速获取物体表面的三维数据。结构光成像系统是由若干个投影仪和相机组成,常用的结构形式有:单投影仪-单相机、单投影仪-双相机、单投影仪-多相机、单相机-双投影仪和单相机-多投影仪等典型结构形式。结构光投影三维成像的基本工作原理是:投影仪向目标物体投射特定的结构光照明图案,由相机摄取被目标调制后的图像,再通过图像处理和视觉模型求出目标物体的三维信息。常用的投影仪主要有下列几种类型:液晶投影(LCD)、数字光调制投影(DLP:如数字微镜器件(DMD))、激光LED图案直接投影。根据结构光投影次数划分,结构光投影三维成像可以分成单次投影3D和多次投影3D方法。单次投影结构光主要采用空间复用编码和频率复用编码形式实现,常用的编码形式有:彩色编码、灰度索引、几何形状编码和随机斑点。目前在机器人手眼系统应用中,对于三维测量精度要求不高的场合,如码垛、拆垛、三维抓取等,应用较多的是投射伪随机斑点获得目标三维信息,其3D成像原理如下图所示。资料来源:中国机器视觉网,民生证券研究院 本公司具备证券投资咨询业务资格,请务必阅读最后一页免责声明多次投影3D方法主要采用时间复用编码方式实现,常用的图案编码形式有:二进制编码、多频相移编码τ35和混合编码法(如格雷码十相移条纹)等。条纹投影3D成像基本原理如下图所示,利用计算机生成结构光图案或用特殊的光学装置产生结构光,经过光学投影系统投射至被测物体表面,然后采用图像获取设备(如CCD或CMOS相机)采集被物体表面调制后发生变形的结构光图像,利用图像处理算法计算图像中每个像素点与物体轮廓上点的对应关系;最后通过系统结构模型及其标定技术,计算得到被测物体的三维轮廓信息。在实际应用中,常采用格雷码投影、正弦相移条纹投影或格雷码十正弦相移混合投影3D技术。对于粗糙表面,结构光可以直接投射到物体表面进行视觉成像测量;但对于大反射率光滑表面和镜面物体3D测量,结构光投影不能直接投射到被测则表面,3D测量还需要借助镜面偏折技术,如下图所示。资料来源:中国机器视觉网,民生证券研究院图3:多次投影3D成像工作原理资料来源:中国机器视觉网,民生证券研究院 本公司具备证券投资咨询业务资格,请务必阅读最后一页免责声明在这种方案中,条纹不是直接投影到被测则轮廓上,而是投射到一个散射屏上,或用液晶显示屏代替散射屏把条纹直接显示出来。相机通过光亮表面折返光路,获取被光亮表面曲率变化调制的条纹信息,然后解算出三维轮廓形貌。1.2.3扫描3D成像扫描3D成像方法可分为扫描测距、主动三角法、色散共焦法等。扫描测距是利用一条准直光束通过一维测距扫描整个目标表面实现3D测量。典型扫描测距方法有:单点飞行时间法,如连续波频率调制(FM-CW)测距、脉冲测距(激光雷达)等;激光散射干涉法,如基于多波长干涉、全息干涉、白光干涉散斑干涉等原理的干涉仪;共焦法,如色散共焦、自聚焦等。单点测距扫描3D方法中,单点飞行时间法适合远距离扫描,测量精度较低,一般在毫米量级。其他几种单点扫描方法有:单点激光干涉法、共焦法和单点激光主动三角法,测量精度较高,但前者对环境要求高;线扫描精度适中,效率高。比较适合于机械手臂末端执行3D测量的应是主动激光三角法和色散共焦法。主动三角法是基于三角测量原理,利用准直光束、一条或多条平面光束扫描目标表面完成3D测量的。光束常采用以下方式获得:激光准直、圆柱或二次曲面柱形棱角扩束,非相干光(如白光、LED光源)通过小孔、狭缝(光栅)投影或相干光衍射等。主动三角法可分为三种类型:单点扫描、单线扫描和多线扫描。目前商业化的用于机械手臂末端的产品大多数是单点和单线扫描仪。资料来源:中国机器视觉网,民生证券研究院 本公司具备证券投资咨询业务资格,请务必阅读最后一页免责声明在多线扫描方法中,条纹极数可靠识别是难点。为了准确识别条纹编号,通常采用两组垂直光平面高速交替成像,这样还可以实现“FlyingTriangulation”扫描,其扫描与三维重构过程如下图所示。多线条投影一次频闪成像产生一幅稀疏3D视图,通过纵横向条纹投影扫描生成若干幅3D视图序列,再通过三维图像准配生成高分辨率的完整致密的三维曲面模型。色散共焦似乎可以扫描测量粗糙和光滑的不透明和透明物体,如反射镜面、透明玻璃面等,目前在手机盖板三维检测等领域广受欢迎。色散共焦扫描有三种类型:单点一维绝对测距扫描、多点阵列扫描和连续线扫描,下图分别列出了绝对测距和