Multi-mode data augmentation and fault diagnosis of gearbox using improved ACGAN
-
摘要: 针对现有生成对抗网络(GAN)难以高效率生成多模式的故障样本和训练不稳定问题,提出了一种改进辅助分类生成对抗网络(ACGAN),并将其用于齿轮箱多模式数据增强和智能故障诊断,以确保运载工具的安全运行;引入独立的分类器构建新型ACGAN框架,改善了经典ACGAN的分类精度与判别精度之间的兼容性;使用Wasserstein距离定义具有平滑特性的新型对抗损失函数,以此克服GAN易出现模式崩塌和梯度消失的缺点;引入谱归一化方法替代权重裁剪,限制判别器的权重参数,提高对抗训练过程的稳定性;为验证改进ACGAN的有效性和优越性,对齿轮箱的6类健康状态样本进行试验分析。分析结果表明:改进ACGAN生成的故障样本在数据层面和特征层面取得了更好的质量评估结果,其中基于结构相似度的评估指标平均优于对比方法0.249 3,基于最大平均差异的评估指标平均优于对比方法0.696 6;改进ACGAN的训练过程更加稳定,其损失函数具有更优的收敛性,同时在多模式故障诊断情景下具有更高的效率,其训练时间缩减为对比方法的20%;针对故障样本缺失的情况,改进ACGAN的生成样本能有效辅助深度学习智能故障诊断模型的训练,可将诊断精度由75.34%提升至97.06%。Abstract: To address the problems that the existing generative adversarial network (GAN) was difficult to efficiently generate multi-mode fault samples, and its training was unstable, an improved auxiliary classification GAN (ACGAN) was proposed for multi-mode data augmentation and intelligent fault diagnosis of the gearbox to ensure the safe operation of the vehicle. The independent classifier was introduced to construct a new ACGAN framework, and the compatibility between the classification accuracy and discriminant accuracy of classic ACGAN was improved. Wasserstein distances were used to define new adversarial loss functions with smooth properties, so as to overcome the disadvantages of the GAN, such as mode collapse and gradient vanishing. In order to improve the stability during the adversarial training process, the spectral normalization was used to replace the weight clipping to constrain the weight parameters of the discriminator. In order to verify the effectiveness and superiority of the improved ACGAN method, experimental analysis was performed on gearbox samples under six health conditions. Analysis results show that the fault samples generated by the improved ACGAN achieve better quality evaluation results at the data level and feature level, among which the evaluation index based on the structural similarity outperforms the comparison method by 0.249 3 on average, and the evaluation index based on the maximum mean difference outperforms the comparison method by 0.696 6 on average. The training process for the improved ACGAN is more stable. Its loss function has better convergence, and it has higher efficiency in multi-mode fault diagnosis scenarios with its training time reduced to 20% of the comparison method. In the case of missing fault samples, the generated fault samples of the improved ACGAN can effectively assist the training of intelligent fault diagnosis models based on deep learning, which can improve the diagnosis accuracy from 75.34% to 97.06%.
-
0. 引言
齿轮箱作为高速列车、直升机等载运工具中不可缺少的传动部件,其安全性能受到广泛的关注[1-2]。齿轮箱在长期运行中受高负载以及高温、高压等恶劣工作环境的影响,容易发生各种故障,导致设备运行性能降低,严重时可造成重大经济损失和人员伤亡,因此,对于齿轮箱健康状态的诊断评估很有必要[3-4]。
随着传感器测量技术的高速发展和计算机性能的快速提升,设备健康监测进入了智能化的时代。由于强大的特征学习和端到端诊断能力,基于深度学习的智能故障诊断方法已成为近5年的研究热点。深度信念网络[5]、自动编码器[6]、卷积神经网络(Convolutional Neural Network, CNN)[7]和长短期记忆网络[8]等不同深度学习模型在故障诊断领域取得了巨大的成功[9-10]。但深层结构的故障诊断模型的训练往往需要充足的可用故障样本,换言之,故障样本的缺失将导致深度学习严重的过拟合问题[11-13]。由此,在实际工程场景中训练准确可靠的深度学习故障诊断模型是一个极具挑战性的难题。
生成对抗网络(Generative Adversarial Network, GAN)已成为当下的研究热点。作为一种无监督的数据增强方法,GAN通过对抗学习的方式学习原始样本的分布特征,从而生成更多新样本[14]。近3年,一些学者开始将GAN应用于智能故障诊断领域,以解决故障样本不足的问题。Wang等[15]用堆叠自动编码器替代GAN中的判别器,对行星齿轮箱的频谱信号进行生成,展现了良好的抗噪效果;何强等[16]将带梯度惩罚的Wasserstein GAN应用于轴承时频谱生成;戴俊等[17]用自动编码器结构设计生成对抗网络,实现了对齿轮箱疲劳状态振动信号的异常检测;Liu等[18]利用核最大平均差异对生成器的损失函数进行改进,实现了轴承振动频谱信号的高质量生成。
上述GAN在传动部件故障诊断中得到了良好的应用,但面对多模式故障的诊断场景时仍存在一定不足,即使用不同类别故障同时训练无监督GAN可能导致以下问题:1)故障类别特征易影响无监督GAN中判别器的二分类,且高维空间中的多模式故障特征混杂在一起,可能会导致生成样本质量下降[19];2) 生成器接收的是没有标签信息嵌入的随机噪声,导致最终生成故障样本的类别不可控[20]。综上所述,为稳定地生成多模式故障样本,需要按故障类别的数量反复训练多个GAN模型,一定程度上降低了诊断效率。
辅助分类生成对抗网络(Auxiliary Classification GAN, ACGAN)在生成器的输入噪声中嵌入标签信息,同时在判别器的输出层加入多分类输出,使得判别器同时识别样本的真假与类别[21],因此,ACGAN有望解决多模式故障样本生成和诊断难题。Shao等[22]使用卷积层构建的ACGAN实现了6种不同工况机械振动信号的同时生成;Guo等[23]针对轴承数据提出了一种泛化性强的ACGAN,提高了模型在不同工况下的训练鲁棒性;肖雄等[24]将轴承振动信号转换为二维图像,使用ACGAN对其进行生成;孙灿飞等[25]使用堆叠自动收缩自编码器对ACGAN中的判别器进行设计,实现了直升机齿轮裂纹故障样本的生成和诊断。但上述ACGAN仍存在以下几个局限亟待改进:1) 现有ACGAN的结构由生成器和判别器组成,其中判别器同时承担分类和判别2种功能,意味着ACGAN中分类与判别的全部超参数和权重是共享的[26],当判别器的任意一种功能出现错误的结果时,都可能会对最终生成样本的质量造成影响;2) ACGAN的损失函数多数基于JS(Jensen-Shannon)散度设计,由于其离散特性,在训练过程中易发生不稳定和梯度消失等现象;3) 由于对抗学习机制的特殊性,当判别器判别真假的能力太强时,生成器会倾向生成完全一样的样本,即模式崩塌。
综上所述,为有效实现齿轮箱多模式故障数据增强和智能诊断,提出了一种基于新型框架和损失函数的改进ACGAN。在现有ACGAN的框架上引入了一个独立的分类器,改善真假判断准确率和分类准确率之间的兼容性;基于Wasserstein距离设计新的ACGAN损失函数,解决模式崩塌和梯度消失的问题;对判别器进行谱归一化操作,提高训练稳定性。使用齿轮箱6类健康状态样本对改进ACGAN进行验证,结果表明,相比其他经典的GAN方法,改进ACGAN具有更优越的性能,能更高效地同时生成高质量和多样性的多模式故障样本,提升深度学习故障诊断模型的准确率和稳定性。
1. 理论基础
1.1 ACGAN
ACGAN是GAN的有监督改进模型,由生成器和判别器组成。与无监督的GAN不同,ACGAN在生成器的随机噪声输入中嵌入了标签信息,并对判别器的末端输出层进行分叉,使判别器除了判别样本的真假之外,还可以对样本的类别进行区分,其结构如图 1所示。
ACGAN的损失函数包括判别损失和分类损失,定义如下
LS=Ex∼Px{log2[D(x)]}+Ez∼Pz{log2[1−D(G(z,cg))]} (1) LC=Ex∼Px{−log2[P(c=cr∣x)]}+Ez∼Pz{−log2[P(c=cg∣G(z,cg))]} (2) 式中:LS为确保样本真实性的交叉熵;Ex~Px(·)为在真实样本x的分布Px下计算的期望;D(x)为判别器D将真实样本x识别为真的概率;Ez~Pz(·)为在随机高斯噪声z的分布Pz下计算的期望;D[G(z, cg)]为判别器D将生成样本G(z, cg)识别为真的概率,cg为生成样本代表的标签,将cg与z一起输入生成器G中可得到生成样本G(z, cg);LC为确保样本分类准确性的交叉熵;P(c=cr|x)为判别器当前识别真实样本x的类别为cr的概率,其中cr为真实样本代表的标签;P[c=cg|G(z, cg)]为判别器当前识别生成样本G(z, cg)的类别为cg的概率。
在对抗的训练过程中,判别器需要最大化LS+LC,而生成器需要最小化LC-LS。
1.2 Wasserstein距离
目标函数式(1)实际上是通过计算JS散度来衡量真假样本分布之间的距离,由于其离散特性,在训练过程中会导致梯度消失和模型崩溃。而Wasserstein距离具有更好的平滑特性,当2种分布在高维空间不重叠时,其同样能够提供有意义的梯度,因此,使用Wasserstein距离对目标函数进行定义可以有效地缓解训练过程出现的问题[27],其表达式为
W(Px,Py)=infγ∼Π(Px,Py)[E(x,y)∼γ(‖x−y‖)] (3) 式中:W(Px, Py)为真实样本x的分布Px和生成样本y分布Py的Wasserstein距离;infγ~∏(Px, Py)(·)表示对期望距离计算下确界的过程,其中∏(Px, Py)为Px和Py的联合概率分布γ的集合;E(x, y)~γ(‖x-y‖)为γ分布下x和y的期望距离。
在式(3)中,直接计算Wasserstein距离较为困难,需要通过Kantorovich-Rubinstein Duality定理将其转换为
W(Px,Py)=sup‖D‖Lip ⩽ (4) 式中:sup(·)为对期望距离取上确界;‖D‖Lip≤1表示对判别器D施加Lipschitz约束,使其权重参数满足1-Lipschitz连续。
2. 改进ACGAN
2.1 改进ACGAN的结构框架
在经典ACGAN中,判别器中分类的正确与否对生成样本的质量起到至关重要的影响。因为ACGAN中的判别器同时承担分类与判别真假的功能,意味着分类对应的神经网络和判别真假对应的神经网络有着完全相同的超参数和权重,当其中之一出现错误的结果时,都有可能对最终生成样本的质量造成影响。
为改善真假判断准确率和分类准确率之间的兼容性,对ACGAN的结构进行改进,引入一个独立的神经网络作为分类器,以实现多模式故障样本生成。采用Tensorflow框架提供的Embedding层在生成器的噪声输入Z中嵌入分类标签信息Y,控制生成样本的故障类别。判别器只判断样本的真假。同时通过分类器的输出对生成器施加分类结果影响,确保对应生成多模式的故障样本,具体如图 2所示。
由图 2可知:改进ACGAN的框架由3个独立的神经网络构成;其中生成器由全连接层和二维转置卷积层组成,通过上采样操作将输入噪声映射为生成样本;判别器和分类器由全连接层和二维卷积层设计;在每一个卷积层后采用Leaky修正线性单元(Leaky Rectified Linear Unit, LReLU)作为激活函数。为加快收敛速度以及避免过拟合,在生成器和分类器中引入批归一化层。此外,训练的优化器均采用Adam优化方法。所提出的改进ACGAN的网络结构参数如表 1所示(β1与β2分别为计算梯度一阶和二阶矩的指数衰减率)。
表 1 改进ACGAN结构参数Table 1. Structure parameters of improved ACGAN网络 结构参数 判别器 二维卷积层(5×5×32) 二维卷积层(3×3×64) 二维卷积层(3×3×128) 二维卷积层(3×3×256) 全连接层(1) 生成器 Embedding层(故障类别数量, 噪声维度) 全连接层(8 192) 二维转置卷积层(5×5×128) 二维转置卷积层(5×5×64) 二维转置卷积层(5×5×32) 二维转置卷积层(5×5×1) 分类器 二维卷积层(3×3×32)+最大池化层 二维卷积层(3×3×64) +最大池化层 二维卷积层(3×3×128) +最大池化层 二维卷积层(3×3×256) +最大池化层 全连接层(256) 全连接层(128) 全连接层(故障类别数量) 优化器 判别器(学习率为1.0×10-4,β1=0.5,β2=0.999) 生成器(学习率为1.0×10-4,β1=0.5,β2=0.999) 分类器(学习率为1.0×10-5,β1=0.9,β2=0.999) 2.2 基于Wasserstein距离和谱归一化的新型损失函数
使用Wasserstein距离代替JS散度设计ACGAN新型损失函数
\begin{aligned} L_{\mathrm{C}}= & \lambda_1 E_{x \sim P_x}\left\{-\log _2\left[P\left(c=c_{\mathrm{r}} \mid x\right)\right]\right\}+ \\ & \lambda_2 E_{z \sim P_z}\left\{-\log _2\left[P\left(c=c_{\mathrm{g}} \mid G\left(z, c_{\mathrm{g}}\right)\right)\right]\right\} \end{aligned} (5) L_{\mathrm{D}}=E_{x \sim P_x}[D(x)]-E_{z \sim P_z}\left\{D\left[G\left(z, c_{\mathrm{g}}\right)\right]\right\} (6) \begin{aligned} L_{\mathrm{G}}= & -E_{z \sim P_z}\left\{D\left[G\left(z, c_{\mathrm{g}}\right)\right]\right\}+ \\ & 0.5 E_{x \sim P_x}\left\{-\log _2\left[P\left(c=c_{\mathrm{r}} \mid x\right)\right]\right\}+ \\ & 0.5 E_{z \sim P_z}\left\{-\log _2\left[P\left(c=c_{\mathrm{g}} \mid G\left(z, c_{\mathrm{g}}\right)\right)\right]\right\} \end{aligned} (7) 式中:LD和LG分别为改进ACGAN的判别器和生成器的损失函数;λ1和λ2分别为分类器计算真实样本分类损失和生成样本分类损失的比例因子,旨在增加生成样本的影响,以避免训练初期出现生成样本分类精度过低的过拟合现象。
为满足式(6)、(7)中计算Ex~Px[D(x)]和Ez~Pz{D[G(z, cg)]}所需的Lipschitz连续性条件,一般通过权重裁剪将判别器的权重参数限制在一个常数范围内,但其往往导致网络参数收敛于裁剪常数的边界,无法获取所需的函数映射。同时权值裁剪会导致多层前向传播后的梯度消失或梯度爆炸,因此,可采用谱归一化方法控制判别器中各层权重矩阵的谱范数[28],以代替权重裁剪。对某线性层f(h)=Wh,其Lipschitz范数‖f(h)‖Lip为
\|f(\boldsymbol{h})\|_{\mathrm{Lip}}=\sup _{\boldsymbol{h}}\{\sigma[\nabla f(\boldsymbol{h})]\}=\sup _{\boldsymbol{h}}[\sigma(\boldsymbol{W})]=\sigma(\boldsymbol{W}) (8) \sigma(\boldsymbol{W})=\max\limits_{\boldsymbol{h} \neq 0}\left(\frac{\|\boldsymbol{W} \boldsymbol{h}\|_2}{\|\boldsymbol{h}\|_2}\right)=\max\limits_{\|\boldsymbol{h}\|_2 \leqslant 1}\left(\|\boldsymbol{W h}\|_2\right) (9) 式中:σ(\nablaf(h))为梯度\nablaf(h)的L2矩阵范数,h为线性层f(h)的输入向量;σ(W)为权重矩阵W的最大奇异值。
谱归一化之后,使最大奇异值σ(W)等于1。谱归一化的计算方式如下
\boldsymbol{W}_{\mathrm{SN}}(\boldsymbol{W})=\frac{\boldsymbol{W}}{\sigma(\boldsymbol{W})} (10) 式中: WSN(W)为谱归一化后得到的某一层的权重矩阵。
2.3 改进ACGAN的主要步骤
提出了一种改进ACGAN,用于齿轮箱的多模式故障数据增强和智能诊断,该方法的流程如图 3所示,包括如下主要步骤。
步骤1:采集齿轮箱在不同故障模式下的振动信号,并将振动信号转换为二维灰度图像,随后将其划分为少量的训练样本和充足的测试样本。
步骤2:基于新型结构框架和损失函数设计改进ACGAN,具体如下。
步骤2.1:引入独立分类器构建改进ACGAN新型结构框架。
步骤2.2:基于Wasserstein距离设计新损失函数。
步骤2.3:采用谱归一化策略在训练过程中限制判别器的权重参数。
步骤3:基于少量训练样本对改进ACGAN进行训练,使其学习训练样本的分布特征,在训练完成后,保存模型参数。
步骤4:向训练好的改进ACGAN中输入随机噪声和给定的标签,以生成多模式故障样本,同时利用定量指标和特征可视化技术对生成的样本进行质量评价。
步骤5:使用生成的多模式故障样本辅助少量训练样本对深度学习诊断模型进行训练,并利用测试样本验证性能。
3. 案例验证
试验运行环境描述如下:CPU为Core i5-10400F@2.90 GHz;内存为16 GB;操作系统为Windows 10;GPU为GTX1650;编程语言为Python 3.6;深度学习框架为TensorFlow 2.0;损失函数式(5)的比例因子λ1和λ2分别设置为1.0和0.1。
3.1 齿轮箱数据描述
采用直齿齿轮箱以验证改进ACGAN的有效性[29],其传动结构及齿轮参数如图 4所示。数据由齿轮、轴承、转轴等复合故障构成,在驱动电机的转动频率为40 Hz,采样频率为66.7 kHz,负载为高负载的条件下进行采集。齿轮箱的6类健康状态信息具体见表 2,每类健康状态的样本长度为4 096个数据点。为模拟实际工况下故障样本缺乏情景,选取每类健康状态样本50个作为训练集,100个作为故障诊断的测试集。
表 2 齿轮箱健康状态描述Table 2. Details of health states of gearbox健康状态标签 健康状态信息 C0 正常 C1 32齿齿轮纵向剥落,48齿齿轮点蚀 C2 48齿齿轮点蚀 C3 48齿齿轮点蚀,80齿齿轮断齿,轴承1滚动体故障 C4 32齿齿轮纵向剥落,48齿齿轮点蚀,80齿齿轮断齿,轴承1内圈故障,轴承2滚动体故障,轴承3外圈故障 C5 80齿齿轮断齿,轴承1内圈故障,轴承2滚动体故障,轴承3外圈故障,主动轴不平衡 采用一种信号图像转换方法[30]将一维振动信号转换为二维灰度图像,以增加状态之间的特征差异,该方法具有以下特点:1) 二维灰度图通过像素的差异呈现出的图像结构反映了振动信号的峰值、均值、标准差等统计特征;2)二维卷积核可以同时提取灰度图中代表一维振动信号不同时段的特征,而一维卷积核只能提取连续时域特征。转换方法定义为
P_{j, k}=\operatorname{int}\left\{\frac{L[(j-1) M+k]-\min (L)}{\max (L)-\min (L)} 255\right\} (11) 式中:Pj, k为转换后得到的二维灰度图像的第j行、第k列的元素;M为二维图像的边长;L为随机选择的长度为M×M个采样点的样本。
3.2 生成样本的质量评估以及与ACGAN的对比
在本案例中,生成6种类型的样本的过程见图 5。随后,采用相同的训练集对ACGAN进行训练并生成样本以进行对比。
首先,基于数据层面定量评估生成样本的质量,采用2个指标:结构相似度(Structural Similarity, SSIM)和最大平均差异(Maximum Mean Discrepancy, MMD)。质量评估所用的样本分别为每类健康状态随机选取的50个生成样本和训练集的50个真实样本。
SSIM从亮度、对比度和结构3个方面对2幅图像进行相似度的衡量[31],SSIM越大表示图像之间的相似度越高。取2 500次计算的平均值作为最终的评估值,改进ACGAN和ACGAN生成样本的SSIM评估结果对比见图 6。由图 6可知:改进ACGAN生成的6类健康状态样本的SSIM平均优于ACGAN 0.249 3,表明改进ACGAN的生成样本在个体层面更接近于真实的样本。
MMD在希尔伯特空间对生成样本和真实样本的分布差异进行度量[21]。与SSIM不同,MMD越小说明生成图片和真实图片的整体分布越接近。改进ACGAN和ACGAN生成样本的MMD对比结果见图 7。如图 7可知:改进ACGAN的生成样本的整体分布更接近真实样本,MMD平均优于ACGAN 0.696 6。
其次,基于特征层面定性评估生成样本的质量。使用充足的真实样本训练有效的CNN诊断模型,模型参数与表 1中的分类器完全相同。随后分别将改进ACGAN以及ACGAN的生成样本与真实样本以1:1混合作为测试集,使用特征降维方法对CNN提取的测试集的特征进行可视化如图 8所示。由图 8可知:改进ACGAN的同类生成样本与真实样本在特征空间中聚集在一起,而ACGAN的聚类效果不佳,充分说明改进ACGAN的生成样本与真实样本在特征层面更为相似。
同时,为体现改进ACGAN在训练中的优势,记录下改进ACGAN和ACGAN在训练过程中损失函数的变化曲线,见图 9,可知:在改进ACGAN训练的初始阶段,分类器损失迅速收敛到0左右,随着迭代次数的增加,判别器和生成器的损失函数曲线的波动范围逐渐减小,说明对抗训练过程逐渐进入均衡状态;而在相同初始条件下,ACGAN的损失函数曲线变化剧烈,约5 000次迭代后出现梯度爆炸。上述分析表明,Wasserstein距离和谱归一化策略可以提高训练的稳定性,使损失函数具有更好的收敛性。
3.3 基于CNN和生成样本的齿轮箱故障诊断
使用改进ACGAN生成的样本与少量的真实样本相结合,辅助CNN模型的训练,CNN模型参数与表 1中的分类器完全相同。为验证改进ACGAN的优越性,同时使用真实样本和3种基于GAN的数据增强方法包括改进ACGAN、带梯度惩罚的Wasserstein GAN[11](Wasserstein GAN with Gradient Penalty, WGAN-GP)和ACGAN进行对比, 其中测试集均为真实样本,数量为每类100个。
为避免偶然性,每组试验重复进行10次,对比试验的样本数量设置和试验结果见表 3和图 10,可知:在限定真实样本数量为50个的情况下,将改进ACGAN生成的样本与少量真实样本相结合辅助CNN进行训练,其准确率接近于使用相同数量的真实样本;WGAN-GP在提升故障诊断准确率方面的性能与改进ACGAN接近;ACGAN的准确率低于上述2种基于GAN的数据增强方法。
表 3 不同方法的故障诊断性能对比Table 3. Comparison of fault diagnosis performances of different methods真实样本数 添加生成样本数 故障诊断准确率/% 添加真实样本数 改进ACGAN WGAN-GP ACGAN 50 0 70.66±1.40 50 25 77.02±1.30 75.34±1.88 76.12±1.59 73.31±1.26 50 50 91.57±0.57 90.80±0.28 90.98±0.68 74.20±1.41 50 75 94.68±0.32 93.64±0.31 93.40±0.25 74.94±1.28 50 100 96.64±0.52 94.94±0.50 94.61±0.87 75.09±1.45 50 125 97.42±0.61 95.92±0.51 95.56±0.45 76.26±1.12 50 150 98.81±0.58 97.06±0.69 96.70±0.61 77.54±1.68 表 4记录了3种数据增强方法生成6类健康状态训练所用的时间,其中WGAN-GP需根据健康状态类别的数量反复训练6个模型;而改进ACGAN具有同时生成多模式故障样本的优势,所用时间约为WGAN-GP的20%,其模型训练效率要远高于WGAN-GP。
表 4 不同方法的训练时间对比Table 4. Comparison of training times of different methods数据增强方法 需训练的GAN模型数量 收敛时的迭代次数 总训练时间/s 改进ACGAN 1 20 000 5 240 WGAN-GP 6 15 000(平均) 26 736 ACGAN 1 不收敛 7 083(30 000次迭代) 4. 结语
(1) 基于新型框架和损失函数设计了改进ACGAN,改善了分类与判别的兼容性,解决了模式崩塌和梯度消失的问题,提高了训练稳定性和生成样本的质量。
(2) 基于齿轮箱故障数据验证了改进ACGAN的有效性,相较于ACGAN和WGAN-GP,改进ACGAN能更高效地同时生成高质量的多模式健康状态样本,辅助深度学习故障诊断模型进行训练。
(3) 虽然基于GAN的方法着眼于数据增强角度来解决小样本的故障诊断问题,但是运载工具实际运行时的故障数据通常受复杂多变的环境影响,因此,以GAN为主体的数据增强方法如何适应实际工况下诸如噪声、数据异常等影响还值得进一步探讨。
-
表 1 改进ACGAN结构参数
Table 1. Structure parameters of improved ACGAN
网络 结构参数 判别器 二维卷积层(5×5×32) 二维卷积层(3×3×64) 二维卷积层(3×3×128) 二维卷积层(3×3×256) 全连接层(1) 生成器 Embedding层(故障类别数量, 噪声维度) 全连接层(8 192) 二维转置卷积层(5×5×128) 二维转置卷积层(5×5×64) 二维转置卷积层(5×5×32) 二维转置卷积层(5×5×1) 分类器 二维卷积层(3×3×32)+最大池化层 二维卷积层(3×3×64) +最大池化层 二维卷积层(3×3×128) +最大池化层 二维卷积层(3×3×256) +最大池化层 全连接层(256) 全连接层(128) 全连接层(故障类别数量) 优化器 判别器(学习率为1.0×10-4,β1=0.5,β2=0.999) 生成器(学习率为1.0×10-4,β1=0.5,β2=0.999) 分类器(学习率为1.0×10-5,β1=0.9,β2=0.999) 表 2 齿轮箱健康状态描述
Table 2. Details of health states of gearbox
健康状态标签 健康状态信息 C0 正常 C1 32齿齿轮纵向剥落,48齿齿轮点蚀 C2 48齿齿轮点蚀 C3 48齿齿轮点蚀,80齿齿轮断齿,轴承1滚动体故障 C4 32齿齿轮纵向剥落,48齿齿轮点蚀,80齿齿轮断齿,轴承1内圈故障,轴承2滚动体故障,轴承3外圈故障 C5 80齿齿轮断齿,轴承1内圈故障,轴承2滚动体故障,轴承3外圈故障,主动轴不平衡 表 3 不同方法的故障诊断性能对比
Table 3. Comparison of fault diagnosis performances of different methods
真实样本数 添加生成样本数 故障诊断准确率/% 添加真实样本数 改进ACGAN WGAN-GP ACGAN 50 0 70.66±1.40 50 25 77.02±1.30 75.34±1.88 76.12±1.59 73.31±1.26 50 50 91.57±0.57 90.80±0.28 90.98±0.68 74.20±1.41 50 75 94.68±0.32 93.64±0.31 93.40±0.25 74.94±1.28 50 100 96.64±0.52 94.94±0.50 94.61±0.87 75.09±1.45 50 125 97.42±0.61 95.92±0.51 95.56±0.45 76.26±1.12 50 150 98.81±0.58 97.06±0.69 96.70±0.61 77.54±1.68 表 4 不同方法的训练时间对比
Table 4. Comparison of training times of different methods
数据增强方法 需训练的GAN模型数量 收敛时的迭代次数 总训练时间/s 改进ACGAN 1 20 000 5 240 WGAN-GP 6 15 000(平均) 26 736 ACGAN 1 不收敛 7 083(30 000次迭代) -
[1] 雷亚国, 许学方, 蔡潇, 等. 面向机械装备健康监测的数据质量保障方法研究[J]. 机械工程学报, 2021, 57(4): 1-9. https://www.cnki.com.cn/Article/CJFDTOTAL-JXXB202104001.htmLEI Ya-guo, XU Xue-fang, CAI Xiao, et al. Research on data quality assurance for health condition monitoring of machinery[J]. Journal of Mechanical Engineering, 2021, 57(4): 1-9. (in Chinese) https://www.cnki.com.cn/Article/CJFDTOTAL-JXXB202104001.htm [2] 朱海燕, 王超文, 邬平波, 等. 基于小滚轮高频激励的高速列车齿轮箱箱体振动试验[J]. 交通运输工程学报, 2020, 20(5): 135-150. doi: 10.19818/j.cnki.1671-1637.2020.05.011ZHU Hai-yan, WANG Chao-wen, WU Ping-bo, et al. High-speed train gearbox housing vibration test based on small roller high-frequency excitation[J]. Journal of Traffic and Transportation Engineering, 2020, 20(5): 135-150. (in Chinese) doi: 10.19818/j.cnki.1671-1637.2020.05.011 [3] 江星星, 宋秋昱, 朱忠奎, 等. 基于收敛趋势变分模式分解的齿轮箱故障诊断方法[J]. 交通运输工程学报, 2022, 22(1): 177-189. doi: 10.19818/j.cnki.1671-1637.2022.01.015JIANG Xing-xing, SONG Qiu-yu, ZHU Zhong-kui, et al. Gearbox fault diagnosis method based on convergent trend-guided variational mode decomposition[J]. Journal of Traffic and Transportation Engineering, 2022, 22(1): 177-189. (in Chinese) doi: 10.19818/j.cnki.1671-1637.2022.01.015 [4] SHAO Hai-dong, LIN Jing, ZHANG Liang-wei, et al. A novel approach of multisensory fusion to collaborative fault diagnosis in maintenance[J]. Information Fusion, 2021, 74: 65-76. doi: 10.1016/j.inffus.2021.03.008 [5] ZHAO Hui-min, LIU Jie, CHEN Hua-yue, et al. Intelligent diagnosis using continuous wavelet transform and gauss convolutional deep belief network[J]. IEEE Transactions on Reliability, 2020, 197: 105883. [6] 邵海东, 张笑阳, 程军圣, 等. 基于提升深度迁移自动编码器的轴承智能故障诊断[J]. 机械工程学报, 2020, 56(9): 84-90. https://www.cnki.com.cn/Article/CJFDTOTAL-JXXB202009011.htmSHAO Hai-dong, ZHANG Xiao-yang, CHENG Jun-sheng, et al. Intelligent fault diagnosis of bearing using enhanced deep transfer auto-encoder[J]. Journal of Mechanical Engineering, 2020, 56(9): 84-90. (in Chinese) https://www.cnki.com.cn/Article/CJFDTOTAL-JXXB202009011.htm [7] 张龙, 甄灿壮, 熊国良, 等. 基于深度时频特征的机车轴承故障诊断[J]. 交通运输工程学报, 2021, 21(6): 247-258. doi: 10.19818/j.cnki.1671-1637.2021.06.019ZHANG Long, ZHEN Can-zhuang, XIONG Guo-liang, et al. Locomotive bearing fault diagnosis based on deep time-frequency features[J]. Journal of Traffic and Transportation Engineering, 2021, 21(6): 247-258. (in Chinese) doi: 10.19818/j.cnki.1671-1637.2021.06.019 [8] 池永为, 杨世锡, 焦卫东. 基于LSTM-RNN的滚动轴承故障多标签分类方法[J]. 振动、测试与诊断, 2020, 40(3): 563-571, 629. https://www.cnki.com.cn/Article/CJFDTOTAL-ZDCS202003021.htmCHI Yong-wei, YANG Shi-xi, JIAO Wei-dong. A multi-label fault classification method for rolling bearing based on LSTM-RNN[J]. Journal of Vibration, Measurement and Diagnosis, 2020, 40(3): 563-571, 629. (in Chinese) https://www.cnki.com.cn/Article/CJFDTOTAL-ZDCS202003021.htm [9] SURENDRAN R, KHALAF O, ROMERO C. Deep learning based intelligent industrial fault diagnosis model[J]. Computers, Materials and Continua, 2022, 70(3): 6323-6338. doi: 10.32604/cmc.2022.021716 [10] CHEN Hong-tian, JIANG Bing, DING S, et al. Data-driven fault diagnosis for traction systems in high-speed trains: a survey, challenges, and perspectives[J]. IEEE Transactions on Intelligent Transportation Systems, 2022, 23(3): 1700-1716. [11] ZHAO Rui, YAN Ru-qiang, CHEN Zheng-hua, et al. Deep learning and its applications to machine health monitoring[J]. Mechanical Systems and Signal Processing, 2019, 115: 213-237. [12] 沈长青, 王旭, 王冬, 等. 基于多尺度卷积类内迁移学习的列车轴承故障诊断[J]. 交通运输工程学报, 2020, 20(5): 151-164. doi: 10.19818/j.cnki.1671-1637.2020.05.012SHEN Chang-qing, WANG Xu, WANG Dong, et al. Multi-scale convolution intra-class transfer learning for train bearing fault diagnosis[J]. Journal of Traffic and Transportation Engineering, 2020, 20(5): 151-164. (in Chinese) doi: 10.19818/j.cnki.1671-1637.2020.05.012 [13] 邵海东, 肖一鸣, 颜深. 仿真数据驱动的改进无监督域适应轴承故障诊断[J]. 机械工程学报, 2023, 59(3): 76-85. https://www.cnki.com.cn/Article/CJFDTOTAL-JXXB202303008.htmSHAO Hai-dong, XIAO Yi-ming, YAN Shen. Simulation data-driven enhanced unsupervised domain adaptation for bearing fault diagnosis[J]. Journal of Mechanical Engineering, 2023, 59(3): 76-85. (in Chinese) https://www.cnki.com.cn/Article/CJFDTOTAL-JXXB202303008.htm [14] GOODFELLOW I J, POUGET-ABADIE J, MIRZA M, et al. Generative adversarial networks[J]. Advances in Neural Information Processing Systems, 2014, 3: 2672-2680. [15] WANG Zi-rui, WANG Jun, WANG You-ren. An intelligent diagnosis scheme based on generative adversarial learning deep neural networks and its application to planetary gearbox fault pattern recognition[J]. Neurocomputing, 2018, 310(8): 213-222. [16] 何强, 唐向红, 李传江, 等. 负载不平衡下小样本数据的轴承故障诊断[J]. 中国机械工程, 2021, 32(10): 1164-1171, 1180. https://www.cnki.com.cn/Article/CJFDTOTAL-ZGJX202110004.htmHE Qiang, TANG Xiang-hong, LI Chuan-jiang, et al. Bearing fault diagnosis method based on small sample data under unbalanced loads[J]. China Mechanical Engineering, 2021, 32(10): 1164-1171, 1180. (in Chinese) https://www.cnki.com.cn/Article/CJFDTOTAL-ZGJX202110004.htm [17] 戴俊, 王俊, 朱忠奎, 等. 基于生成对抗网络和自动编码器的机械系统异常检测[J]. 仪器仪表学报, 2019, 40(9): 16-26. https://www.cnki.com.cn/Article/CJFDTOTAL-YQXB201909002.htmDAI Jun, WANG Jun, ZHU Zhong-kui, et al. Anomaly detection of mechanical systems based on generative adversarial network and auto-encoder[J]. Chinese Journal of Scientific Instrument, 2019, 40(9): 16-26. (in Chinese) https://www.cnki.com.cn/Article/CJFDTOTAL-YQXB201909002.htm [18] LIU Shen, CHEN Jing-long, QU Cheng, et al. LOSGAN: latent optimized stable GAN for intelligent fault diagnosis with limited data in rotating machinery[J]. Measurement Science and Technology, 2021, 32: 045101. [19] GONG Jia-liang, XU Xiao-dong, LEI Ying-ke. Unsupervised specific emitter identification method using radio-frequency fingerprint embedded InfoGAN[J]. IEEE Transactions on Information Forensics and Security, 2020, 15: 2898-2912. [20] RASTOGI R, GANGNANI R. Semi-supervised multi category classification with generative adversarial networks[C]//Springer. 2019 International Conference on Pattern Recognition and Machine Intelligence. Berlin: Springer, 2019: 286-294. [21] ODENA A, OLAH C, SHLENS J. Conditional image synthesis with auxiliary classifier GANs[C]//ACM. 2017 International Conference on Machine Learning. Sydney: ACM, 2017: 2642-2651. [22] SHAO Si-yu, WANG Pu, YAN Ru-qiang. Generative adversarial networks for data augmentation in machine fault diagnosis[J]. Computers in Industry, 2019, 106: 85-93. [23] GUO Qing-wen, LI Yi-bin, SONG Yan, et al. Intelligent fault diagnosis method based on full 1-D convolutional generative adversarial network[J]. IEEE Transactions on Industrial Informatics, 2020, 16(3): 2044-2053. [24] 肖雄, 肖宇雄, 张勇军, 等. 基于二维灰度图的数据增强方法在电机轴承故障诊断的应用研究[J]. 中国电机工程学报, 2021, 41(2): 738-749. https://www.cnki.com.cn/Article/CJFDTOTAL-ZGDC202102032.htmXIAO Xiong, XIAO Yu-xiong, ZHANG Yong-jun, et al. Research on the application of the data augmentation method based on 2D gray pixel images in the fault diagnosis of motor bearing[J]. Proceedings of the CSEE, 2021, 41(2): 738-749. (in Chinese) https://www.cnki.com.cn/Article/CJFDTOTAL-ZGDC202102032.htm [25] 孙灿飞, 王友仁, 夏裕彬. 基于SCAE-ACGAN的直升机行星齿轮裂纹故障诊断[J]. 振动、测试与诊断, 2021, 41(3): 495-502, 620-621. https://www.cnki.com.cn/Article/CJFDTOTAL-ZDCS202103012.htmSUN Can-fei, WANG You-ren, XIA Yu-bin. Fault diagnosis of helicopter planetary gear tooth crack based on SCAE-ACGAN[J]. Journal of Vibration, Measurement and Diagnosis, 2021, 41(3): 495-502, 620-621. (in Chinese) https://www.cnki.com.cn/Article/CJFDTOTAL-ZDCS202103012.htm [26] LEE M H, SEOK J H, Controllable generative adversarial network[J]. IEEE Access, 2019, 7: 28158-28169. [27] ARJOVSKY M, CHINTALA S, BOTTOU L. Wasserstein generative adversarial networks[C]//ACM. International Conference on Machine Learning. Sydney: ACM, 2017: 214-233. [28] XIA Wei-hao, ZHANG Yu-lun, YANG Yu-jiu, et al. GAN inversion: a survey[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2023, 45(3): 3121-3138. [29] ALATAT H, SIEGEL D, LEE J. A systematic methodology for gearbox health assessment and fault classification[J]. Journal of Prognostics and Health Management, 2011, 2(1): 16-22. [30] WEN Long, LI Xin-yu, GAO Liang, et al. A new convolutional neural network-based data-driven fault diagnosis method[J]. IEEE Transactions on Industrial Electronics, 2018, 65(7): 5990-5998. [31] 马燕, 余海军, 钟发生, 等. 基于残差编解码网络的CT图像金属伪影校正[J]. 仪器仪表学报, 2020, 41(8): 160-169. https://www.cnki.com.cn/Article/CJFDTOTAL-YQXB202008018.htmMA Yan, YU Hai-jun, ZHONG Fa-sheng, et al. CT metal artifact reduction based on the residual encoder-decoder network[J]. Chinese Journal of Scientific Instrument, 2020, 41(8): 160-169. (in Chinese) https://www.cnki.com.cn/Article/CJFDTOTAL-YQXB202008018.htm 期刊类型引用(2)
1. 王晓飞,罗振,王少华,潘玲,曾强. 平曲线要素对小客车运行碳排放的影响特征研究. 华南理工大学学报(自然科学版). 2025(02): 68-79 . 百度学术
2. 闫祥海,李宗召,徐立友,李敖. 纯电动汽车动力系统结构参数与整车控制参数集成优化. 现代制造工程. 2022(08): 65-70 . 百度学术
其他类型引用(4)
-