范志锋①②,闫春爱①②,李皓①②(①武昌工学院智能制造学院,湖北武汉430065;②绿色风机制造湖北省协同创新中心,湖北武汉430065) 摘要:齿轮是机器设备中常见的旋转机械部件,对其开展故障诊断是避免重大事故发生的重要手段,齿轮故障诊断必然成为学者研究的焦点,而机器视觉技术为开展齿轮故障诊断提供了新的思路。文章分析了机器视觉系统的基本原理,重点梳理了基于机器视觉的齿轮图像采集、齿轮图像处理和齿轮图像识别的研究现状,归纳总结了基于机器视觉的齿轮故障诊断研究存在的主要问题,提出开展动态齿轮图像采集工程化研究与应用、三维齿轮图像采集、图像增强与迁移学习技术应用、浅层学习与深度学习融合等方面的建议,为从事齿轮故障诊断相关领域的技术人员提供参考和借鉴。 关键词:齿轮;机器视觉;故障诊断;研究进展中图分类号:TH132.41,TP306+.3,TP391DOI:10.19287/j.mtmt.1005-2402.2025.01.013 文献标识码:A Research progress of machine vision technology for gear fault diagnosis FAN Zhifeng①②,YAN Chun’ai①②,LI Hao①② (①School of Intelligent Manufacturing, Wuchang Institute of Technology, Wuhan 430065, CHN;②Green Fan Manufacturing Collaborative Innovation Center in Hubei Province, Wuhan 430065, CHN) Abstract:Gear is a common rotating mechanical part in machinery and equipment, and its fault diagnosis is animportant means to avoid major accidents, and gear fault diagnosis is bound to become the focus ofscholars' research. Machine vision technology provides a new idea for gear fault diagnosis. This paperanalyzes the basic principle of machine vision system is analyzed, and the research status of gear imagecollection, gear image processing and gear image recognition based on machine vision is reviewed, themain problems of gear fault diagnosis based on machine vision are summarized. Some suggestions areput forward, such as the engineering research and application of dynamic gear image acquisition, three-dimensional gear image acquisition, the application of image enhancement and transfer learningtechnology, and the fusion of shallow learning and deep learning. It provides reference for technicalpersonnel engaged in gear fault diagnosis related fields. Keywords:gear; machine vision; fault diagnosis; research progress 法[1]、基于声音的故障诊断方法[2]、基于油液磨粒的故障诊断方法[3]以及基于温度的故障诊断方法[4]等。上述关于齿轮故障诊断方法中,目前研究比较成熟和热门的是基于振动的故障诊断方法。基于振动的齿轮故障诊断具有较好的实时性,但当前对齿轮进行故障的定量检测和不同故障类型的精准识别还存在一定难度[5]。 齿轮传动具有诸多优点,广泛应用于航空、航天、船舶、车辆和能源等领域。在长期运行过程中,齿轮会出现点蚀、磨损、裂纹和断齿等各类故障,随着故障的发展,最终会影响机器设备的正常运转,降低传动效率,甚至引发安全事故。对齿轮故障进行诊断在现代工业生产中具有重要的现实意义。齿轮故障诊断常见的方法包括基于振动的故障诊断方 随着计算机技术和人工智能的突飞猛进,机器视觉识别技术不断成熟。这种技术将图像识别从传统的人工识别模式升级为可以通过计算机辅助识别的模式,极大提高了识别效率和准确性。近年来,机器视觉技术在工业质量检测和故障诊断领域中得到了广泛应用[6−10]。 像定位与分割、图像特征提取和图像识别等操作,从而实现对被测对象的有效检测。总的来说,机器视觉系统主要完成3部分工作,即图像采集、图像处理和图像识别。图像采集由照明系统和成像系统完成。图像处理和图像识别由视觉信息处理设备完成。图像处理包括图像预处理、图像定位与分割、图像特征提取等操作。 机器视觉技术为齿轮故障诊断的研究提供了新的思路。当前,基于机器视觉技术的齿轮故障诊断的研究不多,尤其是对运转条件下齿轮故障诊断的研究相对较少。基于此背景,本文在阐述机器视觉系统基本原理的基础上,重点探讨机器视觉在齿轮故障诊断中的应用,力图揭示基于机器视觉的齿轮故障诊断研究存在的主要问题,并提出基于机器视觉的齿轮故障诊断研究的相关建议,为从事齿轮故障诊断相关领域的技术人员提供参考和借鉴。 2机器视觉在齿轮故障诊断中的应用 基于机器视觉技术对机器设备中的齿轮进行故障诊断,其工作流程包括齿轮图像采集、齿轮图像处理和齿轮图像识别。 2.1齿轮图像采集 齿轮图像采集是在照明系统和成像系统的配合下,输出齿轮的数字图像,输入视觉信息处理设备。齿轮图像采集是开展齿轮故障诊断的基础,输出图像质量最终会影响故障诊断的精度。 1机器视觉系统的基本原理 一个完整的机器视觉系统包括硬件和软件两部分组成。硬件包括照明系统、成像系统和视觉信息处理设备[11]。软件即视觉信息处理设备中使用的机器视觉分析软件。常见机器视觉系统的工作原理如图1所示。 齿轮图像采集分为静态齿轮和动态齿轮2种情况。目前的研究比较成熟的是静态齿轮图像采集。静态齿轮图像采集系统如图2所示[12]。 动态齿轮图像采集时,为拍摄旋转状态时啮合齿轮齿面的完整图像,需要重点考虑工业相机的安装位置和拍摄角度。图3所示为一种实验室状态下动态齿轮图像采集时工业相机的安装示意图[13],齿轮箱中安装有待测齿轮,为方便工业相机拍摄,齿轮箱的上方安装一块透明的有机玻璃板作为上盖板,工业相机安装在支架上,支架上有滑轨和转轴,可以调节工业相机的安装位置和拍摄角度。x为待测齿轮箱左侧与支架之间的距离,y为待测齿轮箱外壳与工业相机固定点的距离,α为工业相机的拍摄角度。 Fig. 1 Working principle diagram of machine vision system 照明系统发射外部光照亮被测对象,分开目标区和背景区,凸显被测对象的特定特征,提高图像的质量和对比度。工业相机通过镜头捕捉被测对象的图像信息。通过图像采集卡将被测对象的图像信息传送给视觉信息处理设备。视觉信息处理设备在机器视觉分析软件的配合下,完成图像预处理、图 动态齿轮图像采集时,工业相机可以采用偏心拍摄的方式对齿轮啮合面图像进行采集,工业相机的最佳拍摄位置如图4所示,其中最佳偏心距离h可利用文献[14]中的公式进行计算。 应形状的光源,并调节合适的亮度,才能获得较好的成像效果。 光源的照射方式主要包括前向照明和背光照明等。前向照明又包括明场照明和暗场照明。光源照射方式的优缺点见表2。 Fig. 4 The optimal shooting position for industrial camera 不同的照射方式适用于不同的应用场景,根据实际需要选择合适的照射方式才能获得最佳的拍摄效果。 由于LED光源具有颜色范围宽、寿命长、响应快、发热少和外形多样化等优点,因此齿轮图像采集系统中的照明系统通常选用LED光源[11]。光源的形状主要包括条形光源、环形光源、线形光源、面光源和同轴光源等。各种常见形状光源的优缺点见表1。 镜头和工业相机相当于人的眼睛,用于获取被测齿轮的模拟/数字图像。镜头是连接被测齿轮和工业相机之间的纽带,相当于眼睛中的晶状体,其作用是将待测齿轮图像成像在工业相机的光敏面上。常用的镜头有普通镜头和远心镜头。普通镜头的主光线与光轴不平行,导致成像时物体的外形和大小会失真[15],但其成本低。远心镜头的优点是放大倍数恒定,不随景深变化而变化,无视差,但其成本相对较高。静态齿轮图像采集系统中,由于被测齿轮是静止的,可以采用普通定焦镜头。动态齿轮图像采集系统中,由于齿轮处于旋转状态,啮合面不断在变化,加上安装轴误差会产生轴心跳动,导致拍摄过程中物距一直在变化,为保证齿轮图像的拍摄质量,可以采用远心镜头。 相对于传统的摄像机,工业相机具有图像稳定性好、传输能力高和抗干扰能力强等特点。工业相机的选择直接决定采集齿轮图像的分辨率和质量。按照感光类型不同,工业相机分为CCD和CMOS2种。按照传感器的结构特性,工业相机可以分为线阵和面阵2种。工业相机的选取通常要看其分辨率、像素深度、帧率、曝光方式、快门速度、像元 没有一种形状的光源能够适用于所有的测量环境与要求,需要结合被测齿轮的实际情况,选择相 尺寸、光谱相应特性以及与图像采集卡接口匹配类型。通常,面阵工业相机分辨率较高,而线阵工业相机分辨率较低但帧率更高,适用于捕捉快速运动对象的场景中使用[16]。动态齿轮图像采集时,宜选用高帧率的工业相机。 LIU D X等[20]提出了一种二维局部特征尺度分解方法对齿轮图像进行降噪处理,该方法将一幅齿轮图像从高到低的频率自适应地分解为若干个二维的本征尺度分量。 一般来说,降噪滤波后齿轮图像的边缘模糊,需要再对降噪滤波后的齿轮图像进行图像增强处理,使齿轮边缘变得清晰。常用的齿轮图像增强方法有灰度变换增强和直方图均衡化增强[21]。灰度变换增强对齿轮图像的每一个像素点进行单独处理,改变原始齿轮图像的灰度范围,使其在视觉上得到改善。直方图均衡化是通过改变齿轮图像直方图来改变齿轮图像内容各像素的灰度,用于增强动态化范围偏小的图像对比度。 2.2齿轮图像处理 由于受外部环境和设备本身性能的影响,成像系统输出的齿轮图像会存在畸变或噪声。另外,在对故障齿轮进行识别时,为避免消耗过多的内存和处理时间,通常只需要故障齿轮局部图像信息。为了消除和抑制齿轮图像的畸变或噪声、提高齿轮故障诊断的精度和速度,通常需要对成像系统输出的原始齿轮图像进行一系列运算和处理,这一系列过程称为齿轮图像处理,主要包括齿轮图像预处理、齿轮图像分割和齿轮图像特征提取等操作。 齿轮灰度图像的灰度值变化范围为0~255,黑色为灰度值0,白色灰度值为255。齿轮图像的二值化是指将齿轮图像中像素点灰度值设置为255或0,使图像非黑即白,没有黑白之间的过渡颜色。经二值化后的齿轮图像边缘更清晰。 2.2.1齿轮图像预处理 齿轮图像预处理是对采集的原始齿轮图像进行图像修正、灰度化、降噪、增强和二值化等一系列处理,突出齿轮图像中的有用信息,去除或弱化无用信息,增强可检测信息,最大限度简化数据,从而提高后续图像分割、特征提取和图像识别的可靠性