Content uploaded by Zhonghua Wang
Author content
All content in this area was uploaded by Zhonghua Wang on May 16, 2024
Content may be subject to copyright.
第 31 卷第 2 期
2024 年 4 月
工程设计学报
Chinese Journal of Engineering Design Vol. 31 No. 2
Apr. 2024
基于多判别器辅助分类器生成对抗网络的故障
诊断方法研究
叶子汉1,2, 王中华1,2, 姜 潮1,2, 吕 新1,2, 张 哲1,2
(1. 湖南大学 整车先进设计制造技术全国重点实验室, 湖南 长沙 410082;
2. 湖南大学 机械与运载工程学院, 湖南 长沙 410082)
摘 要:在强冲击、强辐射、极高温等极端恶劣的工作环境下,机械设备的故障模式复杂多样,获得充足且有
效的故障数据变得非常困难甚至难以实现,以致故障诊断的准确性受限,后续检修维护方案难以有效制定。针
对这一问题,提出了一种多判别器辅助分类器生成对抗网络的数据增强算法。通过设置 3个判别器、1个生成器
并添加独立的分类器,构建了新的辅助分类器生成对抗网络模型。针对在该模型训练中存在的不稳定性问题,
通过引入 Wasserstein距离构造新的损失函数,并采用稳定性更具优势的单边软约束正则化项替换原有的 L2梯度
惩罚项来解决模型崩溃问题;在此基础上,采用高效通道注意力机制来进一步提高模型的特征提取能力。将所
提出的模型应用于扩充机械设备故障数据集,辅助深度学习智能诊断模型的训练。多个故障数据集扩充实验表
明,与现有模型相比,新模型所生成数据的质量更高,故障诊断的准确率也得到进一步提高,因此具有较高的
应用价值。
关键词:多判别器辅助分类器生成对抗网络;高效通道注意力机制;Lipschitz(利普希茨)约束;数据增强;故障诊断
中图分类号:TP 277 文献标志码:A 文章编号:1006-754X (2024)02-0137-14
Research on fault diagnosis method based on multi-discriminator auxiliary
classifier generative adversarial network
YE Zihan1,2, WANG Zhonghua1,2, JIANG Chao1,2, LÜ Xin1,2, ZHANG Zhe1,2
(1. State Key Laboratory of Advanced Design and Manufacturing Technology for Vehicle, Hunan University, Changsha 410082,
China; 2. College of Mechanical and Vehicle Engineering, Hunan University, Changsha 410082, China)
Abstract: In extremely harsh working environments such as strong impacts, intense radiation and
extremely high temperature, the fault modes of mechanical equipment are complex and varied, and it is
very difficult to obtain sufficient and effective fault data, even difficult to achieve, so that the accuracy of
fault diagnosis is limited, and subsequent maintenance and repair programs are difficult to be effectively
developed. To solve this problem, a data enhancement algorithm for multi-discriminator auxiliary
classifier generative adversarial network was proposed. By setting up 3 discriminators, 1 generator and
adding independent classifier, a new auxiliary classifier generative adversarial network model was
constructed. Aiming at the instability issue in the model's training, the Wasserstein distance was
introduced to construct a new loss function, and the unilateral soft constraint regularization term with
doi:10.3785/j.issn.1006-754X.2024.03.212
收稿日期:2023‒10‒30 修订日期:2023‒12‒12 本刊网址·在线期刊:http://www.zjujournals.com/gcsjxb
基金项目:国防基础科研计划资助项目 (JCKY2020110C105);国家自然科学基金资助项目 (52205262);整车先进设计制
造技术全国重点实验室开放基金资助项目 (32175001)
作者简介:叶子汉 (1998—),男,湖南株洲人,硕士,从事复杂装备故障诊断研究,E-mail: 240014070@qq.com, https://
orcid.org/0009-0007-5011-2448
通信联系人:王中华 (1990—),男,安徽阜阳人,副研究员,博士,从事复杂装备可靠性分析与设计、抗辐射
加固设计等研究,E-mail: wangzh0946@hnu.edu.cn, https://orcid.org/0009-0003-3024-871X
工程设计学报 第 31 卷
more stability was used to replace the original L2 gradient penalty term to solve the problem of model
collapse. Building on this, an efficient channel attention mechanism was adopted to further improve the
model's feature extraction capability. The proposed model was applied to extend the fault data set of
mechanical equipment to assist the training of deep learning intelligent diagnosis model. Multiple fault
data set expansion experiments showed that compared with the existing model, the new model could
generate higher quality data, and the accuracy of fault diagnosis was further improved, so it had high
application value.
Key words: multi-discriminator auxiliary classifier generative adversarial network; efficient channel
attention mechanism; Lipschitz penalty; data augmentation; fault diagnosis
伴随着科技的快速发展及工业应用的不断进
步,现代工业中机械设备越来越精密,其自动化和
智能化水平越来越高。机械设备在实际工程中往往
处于极端恶劣的工作环境中,如超高速、大过载、
强辐射等,且其本身构造复杂,故障模式多样,导
致机械设备的运行安全问题日渐凸显。一旦发生故
障而引起事故,轻则造成经济损失,重则发生人员
伤亡,所以有必要对机械设备的健康状态进行诊断
与评估。
传统的故障诊断方法大多是通过研究设备运行
的物理机理来计算故障特征频率,或对运行数据进
行特征信号分解,来达到识别故障的目的。常用的
方法包括短时傅里叶变换 (short-time Fourier trans‐
form,STFT)[1]、小波变换[2]、经验模态分解[3]和变
分模态分解[4]等。采用上述方法对故障信号进行降
噪分离,在设备故障诊断中取得了较好的效果。然
而,其只能处理简单且充足的数据信号,且需要人
工干预以提取故障特征,难以处理复杂机械设备的
故障诊断问题。
近年来,人工智能成为学术界研究热点之一,
学者们将其中多种算法框架引入故障诊断中,而深
度学习方法凭借其强大的特征提取能力、多样化的
下游任务处理能力、端到端任务处理能力等优势,
成为故障诊断领域的主流工具之一。Zhang等[5]提出
了一种深度全卷积神经网络模型,可用以提取由振
动信号转换的光谱图数据特征而完成故障分类;
Wang 等[6]基于卷积神经网络 (convolutional neural
network, CNN) 提出了一种多尺度学习神经网络,
提高了故障数据特征的提取能力;He等[7]利用 STFT
得到频谱矩阵,采用优化的大容量记忆存储与检索
模型完成了故障诊断。虽然采用上述诊断方法都取
得了一定效果,但都是以具有质量好且样本充足的
故障数据为前提的[8]。在实际工程中,工况环境复
杂,机械设备的故障诊断数据难以充分获取,深度
学习模型的泛化能力大大降低[9],导致出现过拟合
等问题。因此,利用少量的故障样本训练出能够精
确识别故障类别的深度学习智能诊断模型,是故障
诊断研究中的重点课题[10]。
因此,诸多学者提出了一系列方法。如:Ren
等[11]采用过采样方法,通过直接复制数据生成更多
的样本,在一定程度上解决了数据量小的问题,但
由于没有引入新的数据信息,同样会导致模型过拟
合、泛化能力差等问题;陈保家等[12]、吴定会等[13]
利用迁移学习方法,采用相近源域的数据依次对模
型进行预训练,采用目标域数据对预训练模型进行
微调,来提高识别目标域的精度,但不一定能找到
相近源域的数据集;Goodfellow等[14]提出了生成对
抗 网 络 (generative adversarial nets, GAN) 模 型 ,
通过生成器与判别器的相互对抗训练,拟合真实样
本的数据分布,并且通过生成器生成与真实数据相
似的新数据,为解决故障诊断中的小样本问题提供
了一种新的手段;Gao 等[15] 采用带有梯度惩罚的
Wasserstein GAN (WGAN) 模型来降低训练的不稳
定性,补充故障数据量不足的数据集;Han 等[16]将
对抗性学习作为正则化条件加入 CNN中,用于提高
训练模型的泛化能力;Zhou 等[17]基于自动编码器设
计生成器,用故障特征与诊断误差指导生成器训练;
Liu 等[18]提出了一种基于稀疏半监督学习的 GAN 模
型,可以利用大量未标记的数据提高标记训练部分
的准确率。上述生成算法对故障数据集的扩充有较
好的效果,但是在实际工况下机械设备的故障种类
复杂,由于鉴别器的特性,上述算法只能做二分类
即判断数据是真实的还是生成的,不能区分数据所
属的故障模式,导致生成器很难拟合不同种类的数
据分布,同样也不能控制生成的数据模式。因此,
针对多种故障模式的数据集,需要根据具体的数据
种类调整超参数来训练多个模型,这大幅降低了故
障诊断的效率。
针对上述问题,学者们引入辅助分类器生成对
抗网络 (auxiliary classifier GAN,ACGAN)[19]模型
·· 138
第 2 期 叶子汉, 等: 基于多判别器辅助分类器生成对抗网络的故障诊断方法研究
来扩充多模故障数据集,将标签信息嵌入生成器的
输入噪声中,并扩展了判别器的能力,使判别器既
能进行真假判别,又可对数据进行类别分类。由于
有标签信息嵌入,生成器可以生成带标签信息的数
据,对于多模故障数据集,可以将其一次性输入模
型中,生成对应故障模式的数据。Shao 等[20]开发了
一种基于 ACGAN的框架,用于从机械故障信号中
学习并生成近似的一维原始数据,以扩充原始数据
集;卢锦玲等[21]将梯度惩罚引入 ACGAN模型,并
在判别器中引入池化层,提升了 ACGAN模型的学
习稳定性和特征提取能力,用于补充平衡风电机组
的轴承故障数据;Huang 等[22]提出了一种改进的鲁
棒多标签 GAN,提高了模型的泛化能力,用于扩充
风力机齿轮箱的故障数据。上述方法将 ACGAN模
型用于多模故障数据集的扩充,改善了原有诊断模
型泛化能力差的状况。然而,GAN及其变体的网络
都应用于图像领域,上述方法主要将GAN 模型应用
于一维信号数据的扩充,并不能很好地发挥GAN模
型生成数据的能力[23]。在图像领域,Yang 等[24]为了
解决火灾图片数据集难以获取的问题,基于信息最
大化生成对抗网络 (information maximizing GAN,
InfoGAN) 和 ACGAN提出了一种用于生成火灾图
像的 GAN 模型;Dharanya等[25]针对人脸表情识别,
提出了一种基于 ACGAN的新模型,该模型的生成
器采用 U-Net 架构,鉴别器采用胶囊网络,以提高
特征提取能力,采用该模型可对多种表情进行分类;
Li 等[27]将Wassertein 距离引入损失函数中,改善了
模型训练问题,并添加了独立的分类器,构建了新
的ACGAN框架,用于旋转机械部件的故障诊断,
但随着类别数的增加,ACGAN生成样本的质量与
多样性都会降低,限制了其对大规模数据的处理
能力。
虽然 ACGAN模型可以很好地解决多模数据生
成问题,但由于其框架自身的缺陷,当训练数据较
少时仍然会出现训练不稳定甚至崩溃等情况。因此,
作者提出了一种多判别器辅助分类器生成对抗网络
(multi-discriminator ACGAN,MDACGAN) 模型,
用于提高小样本条件下机械设备的故障数据扩充和
诊断能力。主要研究工作如下:
1) 通过引入 3个判别器和 1个独立的分类器,
构建新的 ACGAN框架,避免生成器拟合出欺骗判
别器的特殊条件,提高标签识别精度,从而提高数
据的生成质量并增强其多样性;
2) 通过引入 Wasserztein 距离构造一种新的
ACGAN 损失函数,同时将 Wasserstein 的L2 梯度
惩罚项强制约束条件替换为 LP (Lipschitz penalty,
利普希茨约束),以提高训练的稳定性;
3) 引入高效通道注意力 (efficient channel at‐
tention, ECA) 机制,通过动态调整每个通道的权重
来强调重要特征,这种针对性的加权机制可以进一
步提高模型的特征提取能力。
1 GAN 及其变体的原理
1.1 WGAN 和改进 WGAN的原理
原始的 GAN是一类由 2个对抗训练模型构成的
深度学习算法,一个模型是生成器 (generator),另
一个模型是判别器 (discriminator)。GAN 的框架如
图1(a)所示。生成器的目标是最大程度地拟合逼近
真实样本的数据分布,即生成与训练样本相似的数
据;判别器的目标是区分数据是真实样本还是生成
器生成的伪数据样本。两者相互博弈训练,最终达
到一种纳什均衡状态。
GAN的目标函数表示如下[14]:
min
Gmax
DL(D, G) = Ex~Pr
log D(x)
+
Ez~Pz
log
1-D
G(z)
(1)
式中:E
[ ]
⋅为期望函数,Pr为真实样本 x的数据分
布,Pz为噪声样本 z的数据分布,D(x)为判别器的
输出值,G(z)为生成器的输出结果。
生成器和判别器的目标函数分别为[21]:
min
GL(G) = Ey~Pg
log
1-D(y)
(2)
max
DL(D) = Ex~Pr
log D(x)
+
Ey~Pg
log
1-D
y
(3)
式中:Pg为生成样本y的数据分布。
由式 (2)和 式 (3) 可知,生成器的目标是生成
尽可能真实的数据来欺骗判别器,判别器的目
标是最大化目标函数,即尽可能区分样本的真
假源。
在模型的实际训练中存在着梯度消失和模型
崩溃的问题,其原因是式(1)的度量模式为 Jensen-
Shannon divergence (JS散度)。在训练之初,Pr与
Pg在高维空间产生重叠,导致 JS 散度无法产生梯
度,即梯度消失,从而导致模型无法得到训练。
为此,Arjovsky 等[27]将Wasserstein 距离引入目标函
数,提出了 WGAN,以解决 JS 散度度量模式无法
提供训练梯度的问题。Wasserstein 距离的定义
如下[27]:
W(Pr, Pg) = inf
γ~∏(Pr, Pg)E(x, y)~γ
x-y
(4)
·· 139
工程设计学报 第 31 卷
式中:∏
(
Pr, Pg
)
为Pr与Pg联合分布的集合,inf表
示下确界,γ为联合分布,
‖ ‖
x-y为样本距离。
式(4)表示在所有可能的联合分布中取到期望值
的下界。
但由于 inf
γ~∏(Pr, Pg)不能直接求解,须截断以限制判
别器网络权值的取值范围,即满足 Lipschitz 连续条
件,以近似计算 Wasserstein距离。采用权值截断会
使大部分权值落在截断的边界上,导致无法获得梯
度,进而可能导致模式崩溃[28]。改进 WGAN 即
WGAN-GP[29]采用由 L2梯度惩罚项替换权值截断的
方法解决上述问题。L2 梯度惩罚项满足 WGAN 中
的Lipschitz 连续性条件,同时避免了权值截断导致
的权重集中在边界上的问题,提高了模型的训练稳
定性和灵活性。
L2梯度惩罚项定义为[29]:
GP=λEPx
∇x
D
x
2-1
2
(5)
式中:GP为梯度惩罚项,λ为比例因子,
‖ ‖
·2为二范
数, ∇表示梯度,Px
为x
的数据分布,x
=ty+(1 -
t)x, 0≤t≤1。
WGAN-GP的目标函数如下[29]:
L=E
x~Pr
D
x
-E
y~Pg
D(y)
+
λE
x
~Px
∇x
D
x
2-1
2
(6)
1.2 ACGAN的原理
ACGAN是GAN的一种变体,同时具有条件生
成对抗网络 (conditional GAN, CGAN)[30]和半监督
学习生成对抗网络 (semi-supervised learning GAN,
SGAN)[31] 的特点,能够在生成符合特定条件的数
据时输出其所属的类别。ACGAN的框架如图 1(b)
所示。生成器的输入噪声嵌入了标签信息,因此能
够生成带标签的数据;判别器可判别真假数据源和
区分数据类别信息。由于引入了标签信息,AC‐
GAN 的目标函数包含两个部分,分别如式(7)和
式(8)所示[19]:
Lsource =E
x~Pr
log D(x) + E
z~Pz
log
1-D
G(z)
(7)
Lclass =Ec~Pr
log D(c) + Ec~Pz
log
1-D(G(c) )
(8)
式中:Lsource 为数据真假判别引起的损失,Lclass 为标
签类别判断引起的损失,c为标签数据。
对于生成器而言,需要最大化
(
Lclass -Lsource
)
;
对于判别器,则最大化损失函数
(
Lsource +Lclass
)
。
2 MDACGAN 原理
2.1 模型框架设计
ACGAN将标签信息嵌入生成器的输入噪声中,
同时进一步扩展了判别器的判别与分类能力。然而,
与原始 GAN一样,ACGAN 同样存在训练不稳定、
模型崩溃等问题。模型崩溃即生成器学习到了某种
特殊的条件参数,此时生成器生成的假样本可以轻
松骗过判别器。实际上生成器并不是真正地拟合真
实的数据分布,而仅仅是某种特殊条件促使其生成
相同的样本,可能会导致生成样本模式的缺失[32]。
因此,本文提出了 MDACGAN模型,通过设计多
个判别器来避免生成器学习到欺骗判别器的特殊条
件,以解决模型崩溃问题。MDACGAN框架如图 2
所示。模型设计细节如下:
1) 构造 3个不同的判别器网络和 1个生成器网
络,进行对抗训练。3个判别器网络分别为 2个卷积
神经网络和1个全连接神经网络。由于3个网络模型
的结构不尽相同,可避免生成器学习到欺骗判别器
的特殊条件。
2) 在原 始的 ACGAN 中,判 别 器包含了判断
真假源和分类标签两个功能,并且判断与分类部
分共享了网络权重。新框架构建了 3个判别器网
络,若按照原始框架处理,则有 3个分类器网络,
而设计多判别器的目的主要是为了避免生成器学
习到欺骗判别器的特殊条件,即其主要功能是真
假源的判断。故 MDACGAN模型中判别器的分类
功能被独立出去,通过构建分类神经网络来处理
标签分类问题。构造了独立的分类器后,既能减
轻网络模型的冗余度,同时可以按照深度学习对
分类模型的设计思路设计分类器,增强模型的可
图1 GAN和ACGAN 框架
Fig. 1 Frames of GAN and ACGAN
·· 140
第 2 期 叶子汉, 等: 基于多判别器辅助分类器生成对抗网络的故障诊断方法研究
拓展性。
3) 为了进一步提高模型提取特征的能力,在
分类器中添加了 ECA[33]。该模块的特点是参数量相
比其他注意力模块少。
4) 在激活函数方面,判别器采用 Leaky ReLU
函数,生成器和分类器采用 ReLU激活函数。此外,
判别器和生成器采用 RMSProp 优化器来更新网络参
数,以提高收敛速度,且避免梯度消失。分类器采
用Adam 优化器,用来高效处理稀疏梯度,提高训
练的效率和稳定性。分类器的输出层采用 Softmax
函数处理多分类目标。
2.2 损失函数设计
如上文所述,原始的 ACGAN 存在训练不稳
定、模型崩溃等问题,而 MDACGAN模型通过设
计多判别器的方式解决了模型崩溃的问题。本小
节通过对目标函数优化设计来解决模型训练不稳
定的问题。
WGAN 即基于 Wasserstein 距离重新设计了
GAN的目标函数,WGAN-GP则用梯度惩罚机制代
替权重截断以满足 LP,进一步优化了模型。这 2次
改进基本解决了原始 GAN模型训练不稳定的问题。
基于上述方法的优越性,将 Wasserstein距离与梯度
惩罚机制引入 ACGAN模型的目标函数中。改进的
目标函数如下:
LD0 =-E
x~Pr
D(x)
+E
y~Pg
D(y)
+
λE
x
~Px
∇x
D
x
2-1
2
(9)
LG=-1
3
E
y~Pg
D0(y) + E
y~Pg
D1(y) +
E
y~Pg
D2(y) + LCg(10)
LCr=E
x~Pr
-log P
c=cr|x
(11)
LCg=E
y~Pg
-log P
c=cg|y
(12)
LC=1
2
LCr+LCg(13)
式中:LD、LG和LC分别为判别器、生成器和分类器
的损失函数,LCr和LCg分别为分类真实样本与生成
样本的交叉熵损失函数。其中,LD0、LD1 和LD2 的表
达式形式相同,这里只给出了 LD0 的表达式,LD1 和
LD2 的表达式可类似获得。
后续经过实验发现,随着样本类别数量的增
加,生成样本的质量会急剧下降,训练不稳定等情
况会出现。Petzka 等[34]改进了梯度惩罚机制,提出
了单边惩罚方法,只惩罚梯度范数大于 1的部分,
其定义如下[34]:
LP=λEpx
max
0,
∇x
D
x
2-1
2
(14)
该方法将原 GP的硬约束替换为单边软约束,进
一步提升了训练的稳定性,并且降低了对超参数的
敏感性。MDACGAN将LP引入判别器的目标函数
中,最终判别器的目标函数如下:
LD0 =-E
x~Pr
D(x)
+E
y~Pg
D(y)
+
λE
x
~Px
max
0,
∇x
D
x
2-1
2
(15)
2.3 模型训练流程
MDACGAN模型中 3个判别器和 1个生成器均
采用 RMSProp优化器, 分类器采用 Adam 梯度下降
算法,损失函数采用交叉熵损失函数。网络模型的
结构和超参数是在 ACGAN模型的基础上进行实验
后得到的结果,其结构如表 1所示。其中生成器学
习率为 0.000 2,分类器学习率为 0.000 02,模型梯
度惩罚项的惩罚系数为 10,批量尺寸为 10,输入生
成器的噪声维度为100。
模型训练流程为:
1) 生成器将嵌入了标签信息的随机噪声生成
带标签的数据,生成数据和真实数据输入 3个判别
器中进行数据源判断,同时计算判别器网络损失函
数,采用优化器更新网络参数。
2) 生成器生成的数据和真实数据同样输入分
类器中进行分类,并计算分类器损失,更新分类器
的网络参数。
3) 训练判别器和分类器后,进行组合结构训
练。保持判别器和分类器的权重参数不变,基于生
成器的损失函数计算损失,并更新参数。
图2 MDACGAN框架
Fig. 2 Frame of MDACGAN
·· 141
工程设计学报 第 31 卷
训练完生成器后,即结束了一个轮次训练,进
入下一轮迭代。通过足够多的迭代训练,生成器和
判别器模型收敛而达到纳什均衡状态,分类器也达
到收敛状态。此时,生成器生成的带标签的数据即
可用于扩充数据集。
3 实验验证
实验所用 PC (personal computer,个人电脑)
的中央处理器采用 AMD Ryzen 7 4800HS with Rade‐
on Graphics,显存为 6 GB 的NVIDIA GeForce
RTX2060 with Max-Q GPU。MDACGAN 模型基于
深度学习框架Tensorflow2.7构建。
3.1 实验 1 基于凯斯西储大学轴承故障数据集的模
型验证
3.1.1 数据集介绍与预处理
采用美国凯斯西储大学 (Case Western Reserve
University,CWRU) 公开的轴承故障数据集[35]。该
数据集包含 3种电火花引起的轴承损伤数据,损伤
表1 MDACGAN模型的结构
Table 1 Structure of MDACGAN model
网络
Discriminator0
Discriminator1
Discriminator2
Generator
Classifier
Optimizer of Discriminator0
Optimizer of Discriminator1
Optimizer of Discriminator2
Optimizer of Generator
Optimizer of Classifier
结构
Conv2D(32,3,2,same)+MaxPool2D(2,1,same)
Conv2D(64,3,2,same)+MaxPool2D(2,1,same)
Conv2D(128,3,2,same)+MaxPool2D(2,1,same)
Conv2D(256,3,2,same)+MaxPool2D(2,1,same)
GlobalAvgpool2D()
Dense(1)
Conv2D(64,3,2,same)+MaxPool2D(2,1,same)
Conv2D(128,3,2,same)+MaxPool2D(2,1,same)
Conv2D(256,3,2,same)+MaxPool2D(2,1,same)
Conv2D(512,3,2,same)+MaxPool2D(2,1,same)
GlobalAvgpool2D()
Dense(1)
Flatten()
Dense(256)+Dropout(0.2)
Dense(128)+Dropout(0.2)
Dense(64)+Dropout(0.2)
Dense(1)
Dense(8192)
Conv2Dtranspose(128,5,2,same)+BN()
Conv2Dtranspose(64,5,2,same)+BN()
Conv2Dtranspose(32,5,2,same)+BN()
Conv2Dtranspose(1,5,2,same)
Conv2D(32,3,2,same)+BN()+MaxPool2D(2,2,same)
Conv2D(64,3,2,same)+BN()+MaxPool2D(2,2,same)
Conv2D(128,3,2,same)+BN()+MaxPool2D(2,2,same)
Conv2D(256,3,2,same)+BN()+MaxPool2D(2,2,same)
ECA_block()
GlobalAvgpool2D()
Dense(8)
RMSprop(0.0002,0.5)
RMSprop(0.0002,0.5)
RMSprop(0.0002,0.5)
RMSprop(0.0002,0.5)
Adam(0.00002,0.5)
·· 142
第 2 期 叶子汉, 等: 基于多判别器辅助分类器生成对抗网络的故障诊断方法研究
直径分别为 0.178,0.356,0.533 mm,损伤点设置
在3点钟、6点钟、12点钟等 3个位置,包含内圈、
滚动体、外圈等 3种故障模式及 0级、1级、2级、
3级等 4级负载。振动信号由 16 通道数据记录仪采
集得到,采样频率分别为12, 48 kHz。
本次实验选取了 8类驱动端轴承损伤数据,
包含内圈、滚动体、外圈等 3种故障模式,选取
3个不同损伤位置以及 0级、1级负载,如表 2所
示。从每种数据类型中,随机抽取连续的 4 096 个
数据点作为一个样本,选取 50 个样本用于
MDACGAN 模型的训练以生成新的样本扩充数
据,另取 100 个样本作为测试集,用于验证该方
法的有效性。
本文采用一种由一维振动信号转换成二维灰度
图的数据预处理方法[36]。由于将数据信号由一维转
换为二维,可以采用在图像领域表现优异的二维卷
积核对原始数据进行特征提取。该转换方法可以表
示为[36]:
P(j, k) =
round
N
(j-1) × M+k- m in N
max N- m in N× 255 (16)
式中:P
(
j, k
)
为转换完成后灰度图矩阵中
(
j, k
)
位
置的值;M为图像的长度,转换后图像大小为 M×
M;N为选择的原始数据点个数;round
(
⋅
)
为四舍
五入函数,用于保证原始数据值归一化为 0~255后
仍是整数,0~255即整个灰度图的像素值。
在处理中,将原始数据转换为 64×64大小的灰
度图,作为 MDACGAN的输入。部分故障数据灰
度图如图3所示。
3.1.2 实验结果对比
实验所采用的模型结构如表 1所示。MDAC‐
GAN 模型生成的部分样本如图4(a)所示。由图可
知,生成样本与真实样本相似但不完全相同,说明
生成模型拟合到逼近真实的样本分布,而不是学习
到能够欺骗判别器的特殊条件。ACGAN和ACW‐
GAN-GP模型所生成的图片分别如图 4(b)和 图 4(c)
所示。
表2 实验 1的数据标签及故障类型
Table 2 Data labels and their fault types of experiment 1
标签
0
1
2
3
4
5
6
7
故障类型
12k_Drive_End_B007_0
12k_Drive_End_B021_1
12k_Drive_End_IR007_0
12k_Drive_End_IR021_1
12k_Drive_End_OR007@3_0
12k_Drive_End_OR007@6_0
12k_Drive_End_OR007@12_0
12k_Drive_End_OR021@3_1
图3 实验 1的部分故障数据灰度图
Fig. 3 Gray scale of partial fault data in experiment 1
图4 不同模型对 CWRU 轴承故障数据集生成的样本
Fig. 4 Samples generated by different models on CWRU bearing fault data set
·· 143
工程设计学报 第 31 卷
当然,肉眼的评判并不全面客观,本文采用
弗雷歇感知距离 DFI[37]和最大均值差异 DMM[38]两种评
价指标来评判所生成图片的质量,同时与 AC‐
GAN、ACWGAN-GP[24]两种模型所生成的图片进
行对比。
DFI 为真实图片与生成图片在特征层面的距离,
本质上是采用均值和协方差矩阵计算 2个分布之间
的距离。DFI表示为[37]:
DFI =
μr-μg
2+
Tr
∑
r+∑
g-2
∑
r∑
g
1
2(17)
式中:μr为真实图片特征的均值;μg为生成图片特
征的均值;Tr表示矩阵对角线上元素的总和,在矩
阵论中称为迹 (Trace);∑r 为真实图片特征的协
方差矩阵;∑g 为生成图片特征的协方差矩阵。
生成图片与真实图片的特征越相近,其均
值之差的平方越小,协方差越小,DFI 值也就越小。
较 小 的 DFI 值 意 味 着 2个分布之间更接近,生
成图片的质量较高,多样性更好。ACGAN、
ACWGAN-GP、MDACGAN 等3种模型以相同训
练集作为输入,生成相同数量的数据样本,其 DFI
值如表 3所示。
同时,引入另一种度量分布差异的指标 DMM,
其在希尔伯特空间度量 2个分布的差异。所以,可
以用 DMM 度量真实训练数据集分布 Pr与生成数据集
分布 Pg之间的距离。DMM 值越小,则 2个分布越接
近,从而反映模型的生成效果越好。DMM 表
示为[38]:
DMM (F, Pr, Pg) = sup
fH≤1
EPr
f(x)-EPg[f(y) ] (18)
式中:F为所有可能函数的集合,sup表示取映射函
数f在给定范围的上确界即最大值,
‖ ‖
fH≤1表示函
数f在再生希尔伯特空间中的范数小于等于 1。
同样地,3种模型的DMM值如表 4所示。
由表 3和表 4可知,MDACGAN模型的 DFI 值和
DMM值比其他 2种模型小得多,虽然标签2对应的 DFI
值明显比其他类高,但根据 DMM 值及其与其他 2种
模型的比较,可知该类生成质量仍然较高。
ACGAN模型的 DFI 值和 DMM 值均较大,DFI 值基本相
同,且通过对比可知真实样本图片与生成样本图片
相差甚大,但生成的图片基本一样,说明原始的
ACGAN模型在训练小样本、多类别数据时会发生
崩溃,难以提取特征进行对抗生成工作。虽然
ACWGAN-GP模型在目标函数中引入了 Wasserstein
距离和梯度惩罚项,相比 ACGAN模型,其训练稳
定性有所改善,但在完成多类别任务中表现效果较
差,所生成图片的质量与多样性不高,这进一步验
证了对本文所提出的 MDACGAN模型框架以及损
失函数改进的有效性。
为了进一步验证生成样本与真实样本的相似
性,本文采用 t分布随机邻域嵌入 (t-distributed sto‐
chastic neighbor embedding,t-SNE)[39] 方法对生成
样本和真实样本进行降维可视化。ACGAN模型训
练时发生崩溃,生成了相同的图片,因此没有进行
比较分析。生成样本和真实样本的可视化结果如
图5所示。图中,R_class n表示第 n类真实样本
(训练样本),G_class n表示第 n类生成样本。由图
可知,MDACGAN模型生成样本与真实样本的特征
更具有相似性。
生成模型训练完成后,即可生成伪样本扩充故
障数据集。CWRU 轴承故障数据集的扩充和划分如
表5所示。训练集共划分了7个数据集,其中:数据
表3 CWRU 轴承故障数据集真实样本与生成样本之间的 DFI 值
Table 3 DFI values between real samples and generated samples of CWRU bearing fault data set
模型
ACGAN
ACWGAN-GP
MDACGAN
类别
0
532.10
179.08
34.31
1
532.11
326.34
79.47
2
532.10
488.76
220.25
3
532.11
171.87
62.28
4
532.01
236.83
68.20
5
532.10
199.66
82.71
6
532.11
220.80
88.68
7
532.11
532.00
147.58
表4 CWRU 轴承故障数据集真实样本与生成样本之间的 DMM 值
Table 4 DMM values between real samples and generated samples of CWRU bearing fault data set
模型
ACGAN
ACWGAN-GP
MDACGAN
类别
0
4.330 5
0.340 6
0.149 0
1
4.873 7
0.412 0
0.145 6
2
4.661 9
0.419 7
0.152 3
3
5.337 8
0.343 7
0.153 2
4
4.445 5
0.702 4
0.112 4
5
4.761 7
0.352 2
0.146 3
6
5.637 8
0.603 9
0.155 3
7
5.071 2
0.635 6
0.155 7
·· 144
第 2 期 叶子汉, 等: 基于多判别器辅助分类器生成对抗网络的故障诊断方法研究
集1和数据集 7为真实样本;数据集 2至数据集 6为
混合数据集,即由生成样本与真实样本混合产生,
真实样本的基数为 50个。采用普通的 CNN 模型对
上述数据集进行测试,其中 CNN 模型的结构与
MDACGAN模型中 Classifier 模块的网络结构相同。
同样由于 ACGAN模型所生成图片的问题,只对比
了MDACGAN 和ACWGAN-GP 模型扩充的数据
集。其分类结果如表6所示。
由表 6可知:数据集的数据量对故障诊断的准
确率产生了影响,即使是普通的深度学习模型,在
数据量充足的情况下,仍能取得较好的分类效果;
通过 MDACGAN模型生成数据样本扩充的数据集 6
已有 98.00%的准确率,非常接近数据集 7的99.75%
的准确率。结果表明,生成对抗网络模型对于故障
诊断具有较好的辅助作用,且本文提出的 MDAC‐
GAN 模型具有很好的拟合真实样本数据分布的
能力。
3.2 实验 2 基 于 XJTU-SY滚动轴承加速寿命试验
数据集的模型验证
3.2.1 数据集介绍与预处理
XJTU-SY 数据集是西安交通大学雷亚国教授团
队联合浙江长兴昇阳科技有限公司而制作[40]。该数
据集包含了 3种工况下滚动轴承全寿命周期振动信
号。试验中传感器采样频率为 25.6 kHz,采样间隔
为1 min,采样时长为1.28 s。
本文实验从 XJTU-SY 数据集中选取了 3种工况
下的 6种故障数据,包含外圈故障、保持架故障和
内圈故障等 3种故障模式。其数据标签及故障类型
如表 7所示。从每种类型的数据样本中,选取水平
方向振动信号作为实验数据,数据预处理方法与对
CWRU 数据集的处理方法相同。将随机抽取连续
的4 096 个数据点转换为灰度图作为一个样本,选
取50 个样本用于生成对抗模型的训练,另外选取
100 个样本作为测试集,用于验证本文方法的有
效性。
3.2.2 实验结果对比
与实验 1相比,本次实验所采用的模型结构及
表6 CWRU 轴承故障数据集分类结果
Table 6 Classification result of CWRU bearing fault data
set
模型
ACWGAN-GP
MDACGAN
准确率/%
数据
集1
78.37
78.37
数据
集2
89.37
90.25
数据
集3
92.62
93.75
数据
集4
91.12
95.62
数据
集5
93.85
97.13
数据
集6
94.87
98.00
数据
集7
99.75
99.75
表5 CWRU 轴承故障数据集扩充和划分
Table 5 Expansion and division of CWRU bearing fault
data set
类型
测试集
训练集
数据集
数据集 0
数据集 1
数据集 2
数据集 3
数据集 4
数据集 5
数据集 6
数据集 7
样本总数/个①
100
50(0)
100(50)
150(100)
200(150)
250(200)
350(300)
200(0)
①“()”内为生成样本数量。
表7 实验 2的数据标签及故障类型
Table 7 Data labels and their fault types of experiment 2
标签
0
1
2
3
4
5
工况
1
2
3
故障类型
Bearing1_1
Bearing1_4
Bearing2_1
Bearing2_2
Bearing3_3
Bearing3_5
失效位置
外圈
保持架
内圈
外圈
内圈
外圈
图5 CWRU 轴承故障数据集生成样本和训练样本 t-SNE 可视化结果
Fig. 5 Generated samples and training samples t-SNE visualization results of CWRU bearing fault data set
·· 145
工程设计学报 第 31 卷
其参数除了类别和数量不同外,其余完全相同,旨
在通过采用不同的数据类别来进一步验证 MDAC‐
GAN模型对于多故障模式数据样本的生成能力。由
于ACGAN模型难以满足本任务要求,只对 MDAC‐
GAN 和ACWGAN-GP 模型的生成结果进行对比。
2种模型生成的数据样本如图 6所示。同样地,采用
DFI 和DMM 指标对生成结果进行测试,结果如表 8和
表9所示。生成样本和真实样本的可视化结果如图 7
所示。
图6 不同模型对 XJTU-SY 数据集生成的样本
Fig. 6 Samples generated by different models on XJTU-SY data set
表8 XJTU-SY 数据集真实样本与生成样本之间的 DFI 值
Table 8 DFI values between real samples and generated samples of XJTU-SY data set
模型
ACWGAN-GP
MDACGAN
类别
0
270.87
141.37
1
223.04
178.31
2
220.84
144.87
3
69.56
60.16
4
116.89
110.65
5
111.72
66.07
表9 XJTU-SY 数据集真实样本与生成样本之间的 DMM 值
Table 9 DMM values between real samples and generated samples of XJTU-SY data set
模型
ACWGAN-GP
MDACGAN
类别
0
0.233 8
0.164 8
1
0.352 9
0.198 2
2
0.310 9
0.160 2
3
0.239 0
0.115 0
4
0.339 3
0.178 9
5
0.213 3
0.122 8
图7 XJTU-SY 数据集生成样本和训练样本 t-SNE 可视化结果
Fig. 7 Generated samples and training samples t-SNE visualization results of XJTU-SY data set
·· 146
第 2 期 叶子汉, 等: 基于多判别器辅助分类器生成对抗网络的故障诊断方法研究
由图 6可知,2种模型均较好地拟合了真实样
本的数据分布,生成的数据样本与真实样本较为
接近。由表 8和表 9可知,MDACGAN模型的多故
障模式数据样本生成能力优于 ACWGAN-GP模型。
由图 7可知:ACWGAN-GP 模型的生成样本与真
实样本的二维特征各类别之间存在混合现象,没
有得到很好区分;MDACGAN 模型的生成样本与
真实样本较好地得到分类,各类别之间也具有差
异性。
本次故障诊断实验的数据集划分与 CWRU 数
据集划分模式相同,采用的故障诊断模型仍为
CNN 模型,网络结构与实验 1的诊断任务相同,
分类结果如表 10 所示。由表可知,数据集的扩充
对分类精度有明显的提升作用,同时 MDACGAN
模型扩充数据集的分类准确率明显高于 ACW‐
GAN-GP模型。
3.3 实验 3 基于 IMS 轴承数据集的模型验证
3.3.1 数据集介绍与预处理
IMS 轴承数据集是美国辛辛那提大学李杰教授
团队公开的数据集[41]。该数据集包含了3组试验数
据。每组试验均测试 4个轴承,固定转速为 2 000
r/min,试验台记录了轴承整个寿命周期的实测数
据。当失效试验结束时,试验1中轴承 3出现了内圈
缺陷,轴承 4出现了滚子元件缺陷;试验 2中轴承 3
发生外圈失效;试验3中轴承3发生外圈失效。本实
验选取 试验 1和试验 2的各 2组数据、试验 3的3组
数据,共 7组数据。其数据标签及数据类型如表 11
所示。数据预处理方法与上述实验相同。将随机抽
取的连续 4 096 个数据点转换为灰度图作为一个样
本,选取 50个样本用于生成对抗模型的训练,另选
取100个样本作为测试集,用于验证本文方法的有
效性。
3.3.2 实验结果对比
与上述实验相比,本次实验所采用的模型结构
及其参数除了类别数量不同外,其余完全相同。由
于ACGAN模型难以满足本任务要求,只对 MDAC‐
GAN 和ACWGAN-GP 模型的生成结果进行对比。
2种模型生成的数据样本如图 8所示。同样地,采用
DFI和DMM 指标对生成结果进行测试,结果如表 12 和
表13 所示。生成样本和真实样本的可视化结果如
图9所示。
由图 8可知,2种模型生成的数据样本与真实
样本都比较接近,ACWGAN-GP 模型的某些类别
生成数据与真实样本还存在一定差异。由表 12 和
表13 可知,MDACGAN 模型的生成能力优于 AC‐
WGAN-GP模型。由图 9可知,ACWGAN-GP 模型
的生成样本与真实样本的各类别二维特征并没有
很好地聚合在一起,MDACGAN 模型的样本区分
做得更好。
表10 XJTU-SY 数据集分类结果
Table 10 Classification result of XJTU-SY data set
模型
ACWGAN-GP
MDACGAN
准确率/%
数据
集1
75.00
75.00
数据
集2
83.16
85.86
数据
集3
83.50
88.21
数据
集4
87.33
89.66
数据
集5
90.12
91.83
数据
集6
92.16
95.50
数据
集7
99.66
99.66
表11 实验 3的数据标签及故障类型
Table 11 Data labels and their fault types of experiment 3
标签
0
1
2
3
4
5
6
试验序号
1
2
3
测试的轴承
轴承 3
轴承 4
轴承 1
轴承 2
轴承 1
轴承 3
轴承 4
失效位置
内圈
滚动体
外圈
—
—
外圈
—
表12 IMS数据集真实样本与生成样本之间的 DFI 值
Table 12 DFI values between real samples and generated samples of IMS data set
模型
ACWGAN-GP
MDACGAN
类别
0
255.29
120.00
1
148.21
23.40
2
515.00
337.67
3
195.62
141.61
4
173.14
88.01
5
237.86
90.92
6
106.51
77.35
表13 IMS数据集真实样本与生成样本的 DMM值
Table 13 DMM values between real samples and generated samples of IMS data set
模型
ACWGAN-GP
MDACGAN
类别
0
0.366 8
0.180 5
1
0.323 6
0.141 5
2
0.321 6
0.213 3
3
0.344 2
0.134 2
4
0.311 2
0.144 3
5
0.332 4
0.197 0
6
0.324 5
0.116 3
·· 147
工程设计学报 第 31 卷
本次故障诊断实验的数据集划分与上述实验相
同,采用的故障诊断模型除分类类别不同外,其余
基本相同,分类结果如表 14 所示。由表可知,
MDACGAN模型所生成样本扩充数据的数据集对分
类精度的提升幅度高于 ACWGAN-GP模型扩充的
数据集对分类精度的提升幅度。
本文选用 3个故障数据集来对比本文所提方法
与其他方法的实验效果,其中故障类别包含了 8类、
7类和 6类等 3种,来验证模型对多种类故障数据分
布的拟合能力。从上述实验结果可知,本文所提出
的MDACGAN模型具有较好的故障数据分布拟合
能力,能生成与真实样本逼近的数据,从而可以扩
充数据集以辅助故障诊断,有效提高了故障诊断的
准确率。
4 总 结
针对机械设备故障诊断中存在的故障模式复
杂、样本缺乏的问题,作者提出了一种多判别器辅
助分类器生成对抗网络的数据增强算法。构建了
3个判别器、1个生成器和 1个分类器作为网络的整
体框架;多判别器的设置减小了模型崩溃问题出现
的概率;分类器的设置既减小了模型的冗余度,同
时进一步增强了分类器的可拓展性。引入 Wasser‐
stein 距离和 LP 正则化方法用于设计网络的损失函
数,解决了模型训练不稳定的问题;将 ECA机制引
表14 IMS数据集分类结果
Table14 Classification result of IMS data set
模型
ACWGAN-GP
MDACGAN
准确率/%
数据
集1
75.28
75.28
数据
集2
86.85
86.71
数据
集3
88.71
88.85
数据
集4
91.00
92.71
数据
集5
89.01
93.14
数据
集6
91.85
95.57
数据
集7
97.28
97.28
图8 不同模型对 IMS数据集生成的样本
Fig. 8 Samples generated by different models on IMS data set
图9 IMS数据集生成样本和训练样本 t-SNE可视化结果
Fig. 9 Generated samples and training samples t-SNE visualization results of IMS data set
·· 148
第 2 期 叶子汉, 等: 基于多判别器辅助分类器生成对抗网络的故障诊断方法研究
入分类器,进一步提高了模型的特征提取能力。3
个数据集扩充的实验结果表明,MDACGAN模型的
数据生成效果优于其他同类型模型,可以用于扩充
故障数据集,提高诊断精度。此外,本文所提方法
具有较好的拓展性,对于判别器的设计,本文只采
用了 CNN网络和多层感知器网络,分类器直接采用
了CNN网络。对于该网络的设计,可以尝试采用其
他深度学习算法,以得到能够满足多种需求的数据
生成效果。
作者在未来的研究中,将针对 MDACGAN 模
型在少样本学习和数据不平衡情况下的处理能力进
行深入研究,使得其在数据量极少的条件下也能生
成较高质量的伪样本,增强模型在特定任务中的有
效性。
参考文献:
[1] ZHONG J, HUANG Y. Time-frequency representation
based on an adaptive short-time Fourier transform[J].
IEEE Transactions on Signal Processing, 2010, 58(10):
5118-5128.
[2] TSE P W, PENG Y H, YAM R. Wavelet analysis and
envelope detection for rolling element bearing fault
diagnosis: Their effectiveness and flexibilities [J].
Journal of Vibration and Acoustics, 2001, 123(3):
303-310.
[3] HUANG N E, SHEN Z, LONG S R, et al. The empirical
mode decomposition and the Hilbert spectrum for
nonlinear and non-stationary time series analysis[J].
Proceedings of the Royal Society of London Series A:
Mathematical, Physical and Engineering Sciences, 1998,
454: 903-995.
[4] DRAGOMIRETSKIY K, ZOSSO D. Variational mode
decomposition[J]. IEEE Transactions on Signal Processing,
2013, 62(3): 531-544.
[5] ZHANG W, ZHANG F, CHEN W, et al. Fault state
recognition of rolling bearing based fully convolutional
network[J]. Computing in Science & Engineering, 2019,
21(5): 55-63.
[6] WANG D, GUO Q, SONG Y, et al. Application of
multiscale learning neural network based on CNN in
bearing fault diagnosis[J]. Journal of Signal Processing
Systems, 2019, 91(10): 1205-1217.
[7] HE M, HE D. Deep learning based approach for bearing
fault diagnosis[J]. IEEE Transactions on Industry Applications,
2017, 53(3): 3057-3065.
[8] RUAN D, SONG X, GÜHMANN C, et al. Collaborative
optimization of CNN and GAN for bearing fault diagnosis
under unbalanced datasets[J/OL]. Lubricants, 2021,
9(10) : 105 [2023-10-20]. https://doi. org/10.3390/
lubricants9100105.
[9] XIAO D, HUANG Y, QIN C, et al. Transfer learning
with convolutional neural networks for small sample size
problem in machinery fault diagnosis[J]. Proceedings of
the Institution of Mechanical Engineers Part C: Journal of
Mechanical Engineering Science, 2019, 233(14): 5131-
5143.
[10] 崔旭浩,郗欣甫,孙以泽 .数据驱动的经编机横移机构
故障检测方法研究[J].工程设计学报,2022,29(3):
263-271.
CUI X H, XI X F, SUN Y Z. Research on data-driven
fault detection method of traverse mechanism of warp
knitting machine[J]. Chinese Journal of Engineering De‐
sign, 2022, 29 (3): 263-271.
[11] REN S, ZHU W, LIAO B, et al. Selection-based
resampling ensemble algorithm for nonstationary
imbalanced stream data learning[J]. Knowledge-Based
Systems, 2019, 163: 705-722.
[12] 陈保 家,陈 学力,肖 文荣,等 .小样本下滚动轴承故障的
多源域迁移诊断方 法[J].电子测量与 仪器学报,2022,
36(2): 219-228.
CHEN J B, CHEN X L, XIAO W R, et al. Multi-source
domain transfer diagnosis method for rolling bearing
faults under small samples[J]. Journal of Electronic Mea‐
surement and Instrumentation, 2022, 36(2): 219-228.
[13] 吴定会 ,方钦 ,吴楚宜 .基于数据生成与迁移学习的轴承
小样本故障诊断[J].机械传动,2020,44(11):139-144.
WU D H, FANG Q, WU C Y. Bearing small sample
fault diagnosis based on data generation and transfer
learning [J]. Journal of Mechanical Transmission, 2020,
44(11): 139-144.
[14] GOODFELLOW I, POUGET-ABADIE J, MIRZA M,
et al. Generative adversarial nets[C]//Proceedings of the
27th International Conference on Neural Information
Processing Systems. Montreal, Canada: MIT Press,
2014: 2672-2680.
[15] GAO X, DENG F, YUE X. Data augmentation in fault
diagnosis based on the Wasserstein generative adversarial
network with gradient penalty[J]. Neurocomputing,
2020, 396: 487-494.
[16] HAN T, LIU C, YANG W, et al. A novel adversarial
learning framework in deep convolutional neural network
for intelligent diagnosis of mechanical faults [J].
Knowledge-Based Systems, 2019, 165: 474-487.
[17] ZHOU F, YANG S, FUJITA H, et al. Deep learning
fault diagnosis method based on global optimization
GAN for unbalanced data [J]. Knowledge-Based
Systems, 2020, 187: 104837.
[18] LIU S, CHEN J, QU C, et al. LOSGAN: Latent
optimized stable GAN for intelligent fault diagnosis with
·· 149
工程设计学报 第 31 卷
limited data in rotating machinery[J]. Measurement
Science and Technology, 2021, 32(4): 045101.
[19] ODENA A, OLAH C, SHLENS J. Conditional image
synthesis with auxiliary classifier GANS [EB/OL].
[2023-10-20]. https://doi.org/10.48550/arXiv.1610.09585.
[20] SHAO S, WANG P, YAN R. Generative adversarial
networks for data augmentation in machine fault
diagnosis [J]. Computers in Industry, 2019, 106: 85-93.
[21] 卢锦 玲,张 祥国,张 伟,等 .基于改进辅助分类生成对抗
网络的风机主轴承故障诊断[J].电力系统自动化,
2021, 45(7):148-154.
LU J L, ZHANG X G, ZHANG W, et al. Fault diagno‐
sis of main bearing of wind turbine based on improved
auxiliary classifier generative adversarial network[J].
Automation of Electric Power System, 2021, 45(7):
148-154.
[22] HUANG N, CHEN Q, CAI G, et al. Fault diagnosis of
bearing in wind turbine gearbox under actual operating
conditions driven by limited data with noise labels[J].
IEEE Transactions on Instrumentation and Measurement,
2021, 70: 1-10.
[23] 何强 ,唐向 红,李传 江,等 .负载不平衡下小样本数据的
轴承故障诊断[J].中国机械工程,2021,32(10):1164-
1171.
HE Q, TANG X H, LI C J, et al. Bearing fault diagnosis
method based on small sample data under unbalanced
loads[J]. China Mechanical Engineering, 2021, 32
(10): 1164-1171.
[24] YANG Z K, BU L P, WANG T, et al. Fire image
generation based on ACGAN[C]//The 31th Chinese
Control and Decision Conference, Nanchang, Jiangxi,
Jun., 3-5, 2019.
[25] DHARANYA V, JOSEPH RAJ A N, GOPI V P. Facial
expression recognition through person-wise regeneration
of expressions using auxiliary classifier generative
adversarial network (AC-GAN) based model [J].
Journal of Visual Communication and Image
Representation, 2021, 77: 103110.
[26] LI W, ZHONG X, SHAO H, et al. Multi-mode data
augmentation and fault diagnosis of rotating machinery
using modified ACGAN designed with new framework
[J]. Advanced Engineering Informatics, 2022, 52:
101552.
[27] ARJOVSKY M, CHINTALA S, BOTTOU L.
Wasserstein generative adversarial networks[C]//34th
International Conference on Machine Learning, Sydney,
Australia, Aug. 6-11, 2017.
[28] 王正龙,张保稳 .生成对抗网络研究综述[J].网络与信
息安全学报,2021,7
(4):68-85.
WANG Z L, ZHANG B W. A survey of research on gen‐
erative adversarial network[J]. Chinese Journal of Net‐
work and Information Security, 2021, 7(4): 68-85.
[29] GULRAJANI I, AHMED F, ARJOVSKY M, et al.
Improved training of Wasserstein GANS [EB/OL].
[2023-10-20]. https://doi.org/10.48550/arXiv.1704.00028.
[30] MIRZA M, OSINDERO S. Conditional generative
adversarial nets[J]. Computer Science, 2014: 2672-2680.
[31] ODENA A. Semi-supervised learning with generative
adversarial networks[EB/OL]. [2023-10-20]. https://
arxiv.org/ pdf/1606.01583.pdf.
[32] MORDIDO G, YANG H, MEINEL C. Dropout-GAN:
Learning from a dynamic ensemble of discriminators[J].
arXiv preprint arXiv:180711346, 2018.
[33] WANG Q, WU B, ZHU P, et al. ECA-Net: Efficient
channel attention for deep convolutional neural networks
[C]//2020 IEEE/CVF Conference on Computer Vision
and Pattern Recognition, Seattle, Washington, USA,
Jun. 14-19. 2020.
[34] PETZKA H, FISCHER A, LUKOVNICOV D. On the
regularization of Wasserstein GANS[J]. arXiv preprint
arXiv:170908894, 2017.
[35] SMITH W A, RANDALL R B. Rolling element bearing
diagnostics using the Case Western Reserve University
data: A benchmark study [J]. Mechanical Systems and
Signal Processing, 2015, 64/65: 100-131.
[36] WEN L, LI X, GAO L, et al. A new convolutional
neural network-based data-driven fault diagnosis
method[J]. IEEE Transactions on Industrial Electronics,
2018, 65(7): 5990-5998.
[37] HEUSEL M, RAMSAUER H, UNTERTHINER T,
et al. GANS trained by a two time-scale update rule
converge to a local Nash equilibrium[C]//NIPS'17:
Proceedings of the 31st International Conference on
Neural Information Processing Systems, Long Beach,
CA, USA, Dec. 4-9, 2017.
[38] GRETTON A, BORGWARDT K M, RASCH M J,
et al. A kernel two-sample test[J]. The Journal of
Machine Learning Research, 2012, 13(1): 723-773.
[39] PEZZOTTI N, LELOEVELDT B P, VAN DER
MAATEN L, et al. Approximated and user steerable
tSNE for progressive visual analytics [J]. IEEE
Transactions on Visualization and Computer Graphics,
2016, 23(
7): 1739-1752.
[40] 雷亚国,韩天宇,王彪,等 .XJTU-SY 滚动轴承加速寿命
试验数据集解读[J].机械工程学报,2019,55(16):1-6.
LEI Y G, HAN T Y, WANG B, et al. XJTU-SY rolling
element bearing accelerated life test datasets: A
tutorial [J]. Journal of Mechanical Engineering, 2019,
55(16): 1-6.
(下转 第 159页)
·· 150
第 2 期 冀炳晖, 等: 基于遗传算法-模糊 PID 的双喷头 FDM 型3D 打印机温度控制方法
tive PID control for fused deposition modeling 3D printer
heating system[J]. Journal of Jilin University (Engineer‐
ing and Technology Edition), 2020, 50(1): 77-83.
[13] 王自立 .电动汽车电机驱动控制系统研究[D].南宁:广
西大学,2020:18-26.
WANG Z L. Research on electric vehicle motor drive
control system [D]. Nanning: Guangxi University,
2020: 18-26.
[14] 张宝 峰,张燿 ,朱 均超,等 .基于模糊 PID 的高精度温度
控制系统[J].传感技术学报,2019,32(9):1425-1429.
ZHANG B F, ZHANG Y, ZHU J C, et al. High preci‐
sion temperature control system based on fuzzy PID[J].
Chinese Journal of Sensors and Actuators, 2019, 32(9):
1425-1429.
[15] 樊宁 .面向熔融混合材料 3D 打印的过程控制系统设计
与实现[D].南京:南京师范大学,2021:48-61.
FAN N. Design and implementation of process control
system for 3D printing of fused mixed materials[D].
Nanjing: Nanjing Normal University, 2021: 48-61.
[16] SAHOO B P, PANDA S. Improved grey wolf optimization
technique for fuzzy aided PID controller design for power
system frequency control[J]. Sustainable Energy, Grids and
Networks, 2018, 16: 278-299.
[17] GOLDBERG D E. Genetic algorithms in search,
optimization and machine learning [M]. Boston:
Addison-Wesley Longman Publishing Co., Inc., 1989:
1-191.
[18] 王婷 婷,王 宏志,刘 清雪,等 .遗传算法优化的无刷直流
电机模糊 PID 控制器设计[J].吉林大学学报(理学版),
2020,58(6):1421-1428.
WANG T T, WANG H Z, LIU Q X, et al. Design of
fuzzy PID controller for brushless DC motor optimized
by GA[J]. Journal of Jilin University (Science Edition),
2020, 58(6): 1421-1428.
[19] 孙嘉梁,符 晓 .遗传算法优化的移相全桥变换器模糊
PID控制[J].测控技术,2022,41(5):113-118.
SUN J L, FU X. Fuzzy PID control of phase shift full-
bridge converter optimized by genetic algorithm[J]. Mea‐
surement & Control Technology, 2022, 41(5): 113-118.
[20] CHEN J, LU Q, BAI J, et al. A temperature control
method for microaccelerometer chips based on genetic
algorithm and fuzzy PID control[J]. Micromachines,
2021, 12(12): 1511-1524.
[21] 刘金琨 .先进 PID 控制 MATLAB 仿真[M].3 版.北京 :
电子工业出版社,2011:288-296.
LIU J K. MATLAB simulation of advanced PID control
[M]. 3rd ed. Beijing: Electronic Industry Press, 2011:
288-296.
[41] GOUSSEAU W, AANTONI J, GIRARDIN F, et al.
Analysis of the rolling element bearing data set of the
center for intelligent maintenance systems of the
university of Cincinnati[EB/OL]. [2023-10-20]. https://
api.semanticscholar.org/CorpusID:186201938.
■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■
(上接 第 150页)
·· 159