基于重采样降噪与主成分分析的宽卷积深度神经网络风机故障诊断方法
1.
2.
Fault Diagnosis Method of Wind Turbines Based on Wide Deep Convolutional Neural Network With Resampling and Principal Component Analysis
1.
2.
收稿日期: 2023-03-29
| 基金资助: |
|
Received: 2023-03-29
作者简介 About authors
针对数据驱动的风机故障诊断面临的数据量少、信号噪声干扰等问题,提出了一种基于宽卷积深度神经网络的故障诊断方法。该方法采用了重采样、小波阈值去噪等信号预处理方式,既增加了信息密度,又保证了信息的完整性,结合主成分分析法(principal component analysis,PCA)替代人工经验进行数据通道的选取。利用卷积神经网络的强大特征提取能力,通过较少的数据训练即可对风机机组在时域上的故障信号进行有效的特征提取,从而可以对风机进行精确的故障诊断。基于某真实风机机组数据的实验结果,验证了该方法的有效性。
关键词:
Fault diagnosis of wind turbines suffers from less training data and noises. A method based on wide deep convolutional neural network with resampling and principal component analysis was presented for the diagnosis of mechanical faults (that is the main fault component of wind turbines). The method adopted a variety of signal preprocessing methods such as resampling wavelet threshold denoising and principal component analysis to increase the information density and ensure the integrity of the information. After being trained with small amount of data, the network which has a powerful feature extraction capability could extract the fault signal in the time domain which will be further used for fault diagnosis. Experimental results were verified based on the real wind turbine data, demonstrating the effectiveness of this method.
Keywords:
本文引用格式
刘展, 包琰洋, 李大字.
LIU Zhan, BAO Yanyang, LI Dazi.
0 引言
针对风电机组的故障诊断问题,本文基于时域分析方法,通过对原始风机现场数据进行多种信号预处理,并采用宽卷积深度神经网络(wide deep convolutional neural network,WDCNN)进行信号特征提取。此方法受风机的机械转速差异等因素影响较小,在真实诊断场景中具有很好的泛化性与实用性。
1 宽卷积深度神经网络
宽卷积深度神经网络 是卷积神经网络(convolutional neural network,CNN)的一种[19],其最显著的特点在于首层卷积层所使用的卷积核为宽卷积核。卷积神经网络中卷积核的大小决定了感受野的大小,即所提取信息的全局性。宽卷积深度神经网络所使用的宽卷积核在基于时域分析的故障诊断问题中可有效捕获周期性或波动性故障信号,避免了普通的卷积神经网络所使用的窄卷积核容易出现的无法将此类故障信号完全纳入感受野的问题。在使用宽卷积的首层卷积层将故障信息完全截取之后,再经过多层使用窄卷积核的卷积层对信息进行深层语义剖析,进一步提取其特征。
WDCNN共有4层组成,其基本结构如图1所示。
图1
第1层为卷积层,该层用于提取输入信息的特征,而其中的卷积核可看作滤波器,其提取特征的全局性与其感受野有关,也即与卷积核的大小有关。一般来说,经过的卷积层越多,提取的特征越深层。卷积后将输出进一步通过一个激活函数即非线性映射,以满足网络非线性的要求。卷积层的输出表示为
式中:
第2层为池化层,该层一般位于卷积层之后,对卷积层的输出降维。一方面使经过卷积层得到的特征图进一步变小,降低计算复杂度;另一方面对特征进一步压缩,提取主要特征,去除冗余信息,加快网络收敛,防止过拟合现象的发生。
第3层为全连接层,该层的作用是将网络学习所得到的分布式特征进行连接,将其映射到样本标记空间,用于接下来的分类任务。
第4层为归一化层,该层中使用的Softmax函数可将网络全连接层的输出结果归一化为故障的概率分布,该层的输出结果可直接用于故障诊断。
神经网络中用损失函数来表示真实值与预测值之间的差距,并在网络中进行反向传播,指导网络参数的训练,使网络在训练后预测值尽可能接近真实值,从而提高预测精度,在故障诊断问题中也即提高诊断结果的可靠性。
本文提出的方法中所用的WDCNN共有5层卷积层,其中第1层卷积核的尺寸为16×16,其余4层卷积核的尺寸为3×3,所使用的非线性激活函数为Relu函数。
2 基于WDCNN的故障诊断方法框架
2.1 基于信号频率的重采样方法
对采集得到的风机原始振动信号数据进行分析时,由于原始数据中包含了多台风机的数据,不同风机的机械转速等都有所差别,常常导致通过信号分析所得到的不是故障状态的特征,而是有关特征转速、频率等的差异所导致的特征,背离了故障诊断的要求。
为了减小转速差异对特征提取的影响,本文在数据预处理中采用了基于信号频率与机械转速的重采样方法。信号重采样间隔表示为
式中:
重采样倍数常量
图2
图2
某机组高速轴断齿振动信号重采样示意图
Fig. 2
Diagram of resampling vibration signal of high-speed shaft tooth breakage in a certain unit
该重采样方法一方面减少了数据中关于转速等因素的冗余信息,增大了数据中关于故障状态特征的信息密度,有利于后续的特征提取与网络训练;另一方面增大了数据量,起到了对训练集与测试集进行数据增强的效果。
2.2 小波阈值去噪
原始风机振动信号数据除了受到转速、频率的影响,还混合了环境中的自然噪声,仅仅依靠重采样无法消除噪声的影响。WDCNN的输入为时域上的信号数据,需要避免对噪声的特征进行无效提取,消除噪声是保证其有效性的重要步骤。
由于风机振动信号本身具有时变性,因此本文在信号重采样之后采用了小波阈值去噪的方法,以得到特征性更强的信号,其原理如下。
将包含噪声的原始数据在各尺度上与
保留在大尺度(低分辨率)下的所有分解值,即保留信号主体的时频域特征;对小尺度(高分辨率)下的分解值设定一个阈值,保留小波系数高于该阈值的分解值,舍弃小波系数低于该阈值的分解值,即去除幅值相较于原始信号较小的突变噪声信号。最后对处理过后的信号进行逆小波变换,重构出去除噪声后的振动信号数据。
图3
2.3 主成分分析降维
现场风机机组的一个部件上往往会包含多个传感器测点,因此得到的振动信号数据包含了多个通道的数据。这些不同通道数据彼此具有强相关性而又包含了不同的特征。目前在工程领域会凭借人工经验选择某个或某几个通道的数据进行使用,这种依赖先验知识的做法会降低方法的泛化性与可迁移性,同时也具有不可靠性。而将所有通道数据都参与网络模型训练的做法一方面引入了不必要的特征,另一方面计算量过大,拖慢训练时间。
图4
图4
某机组高速轴振动信号PCA降维前后频域图
Fig. 4
Frequency domain diagram of high-speed shaft vibration signal of a certain unit before and after PCA dimensionality reduction
2.4 特征参数选择
风机机组的振动信号数据不仅具有鲜明的时域特征,而且在频域上故障信号与正常信号也会有所区别。图5为某风电机组高速轴在正常与故障时的振动信号数据在频域上的对比。
图5
图5
某风机机组高速轴振动信号频域数据
Fig. 5
Frequency domain data of high-speed shaft vibration signal for a certain unit
本文所提出的方法不仅选取了时域上常用的15个特征参数(如平均值、方差、峰峰值、峭度等),还选取了频域上的5个特征参数(如基频等),以全面描述振动信号的特征。
2.5 用于风机故障诊断的卷积神经网络设计
本文所提出的方法利用了卷积神经网络通过自身的训练能自适应地从信号中提取有关故障特征的优点,减少了采样频率、转速等因素对特征提取的影响,降低了信号预处理的复杂度与参数的敏感性,且网络训练所需的数据量较少,实现了故障诊断的自动化与泛用化。
基于宽卷积神经网络的方法结构如图6所示,其主要步骤如下:
图6
1)利用风机上的传感器采集振动信号数据。
2)将采集得到的原始振动信号数据按照设置的步长间隔进行重采样处理,即对随后的网络训练中作为训练集与验证集的数据进行数据增强;并进行小波阈值去噪。将预处理后的数据进行PCA降维。
3)对预处理后的数据按照设置的切片数目与长度进行切片,作为接下来WDCNN的输入,并提取时频域特征作为标签。
4)按照初始化的参数,先后经过一层宽卷积核的卷积层与多层窄卷积核的卷积层,每次通过卷积层后都通过一个池化层进行压缩,以此对数据的深度特征信息进行提取。
5)经过全连接层与归一化层将网络输出转化为故障的概率分布。
6)按照根据真实值与预测值之间的差距所设计的损失函数进行反向传播,更新网络参数。网络收敛同时在验证集上达到预计的准确率后,保存训练所得到的模型。
7)将在线数据经过重采样与切片后输入到训练好的WDCNN中,对数据的深度特征信息进行提取。
8)在经过卷积神经网络模型之后,经过全连接层与归一化层输出故障的概率分布即对故障的分类结果,完成在线故障诊断。
3 实验结果与分析
3.1 发电机故障诊断实验
风力发电机是风电机组中最重要的部件,但也常出现机械故障。本节通过分析风力发电机的数据进行诊断实验,所采用的数据为实际采集的某风电机组数据。
实验数据分为2组,分别是发电机驱动端数据与发电机非驱动端数据。其中,发电机驱动端数据包含发电机驱动端正常与发电机驱动端磨损2种状态,某个通道2种状态的振动信号数据分别如图7(a)、(b)所示。发电机非驱动端数据包含发电机非驱动端正常与发电机非驱动端磨损2种状态,某个通道2种状态的振动信号数据分别如图8(a)、(b)所示。分别从编号为39的风机机组的发电机驱动端数据与非驱动端数据中取出20组具有相同转速的数据用于网络训练,每组包含6个数据通道,每个通道有65 536个振动信号数据,故障数据与正常数据各占一半,其中70%的数据用作训练集,剩余30%的数据用作预测集。网络训练完成后分别用其他机组的50组具有相同转速的数据进行测试。实验结果如表1所示。
图7
图8
表 1 相同转速下风机发电机故障诊断结果
Tab. 1
| 类别 | 测试样本 | 分类准确率/% |
|---|---|---|
| 发电机驱动端 | 50 | 100 |
| 发电机非驱动端 | 50 | 98 |
从表1可以看到,当机械转速相同时,用较少数据训练得到的网络有相当高的诊断准确率,其中风机发电机驱动端的故障分类准确率达到100%,发电机非驱动端的故障分类准确率达到98%。
为检验转速因素对本文提出方法的影响,分别从编号为46的风机机组的发电机驱动端数据与非驱动端数据中取出30组包含不同转速的数据用于网络训练,每组包含6个数据通道,每个通道有65 536个振动信号数据,故障数据与正常数据各占一半,其中70%的数据作为训练集,30%的数据作为预测集。网络训练完成后分别用其他机组的50组包含不同转速的数据进行测试。实验结果如表2所示。
表 2 不同转速下风机发电机故障诊断结果
Tab. 2
| 类别 | 测试样本 | 分类准确率/% |
|---|---|---|
| 发电机驱动端 | 50 | 98 |
| 发电机非驱动端 | 50 | 96 |
从表2中可以看出,转速的差异对网络的特征提取与诊断能力影响较小,风机发电机驱动端与非驱动端的故障分类准确率分别达到了98%与96%。
3.2 齿轮箱故障诊断实验
齿轮箱是风电机组中另一个较为重要的部件,该部件信号受齿轮数差异的影响较大,信号中干扰特征较多。本节通过分析齿轮箱的数据进行诊断实验。
所采用的数据为实际采集的某风电机组数据,共包含齿轮箱正常与齿轮箱断齿2种状态,其中某个通道2种状态的振动信号数据如图9所示。
图9
实验中共从编号为4的风机机组中取出20组数据用于网络训练,每组包含6个数据通道,每个通道有131 072个振动信号数据,故障数据与正常数据各占一半,其中70%的数据作为训练集,30%的数据作为预测集。用训练好的网络对编号为30的风机机组的50组数据进行测试,分类准确率为98%,说明对于信号差异较大的齿轮箱数据,本文提出的方法仍有较好的诊断效果。实验结果表明,本文提出的方法对转速差异等因素具有良好的抗干扰能力,对状态特征具有优秀的特征提取能力。
3.3 消融实验
针对本文所采用的预处理方法进行了消融实验,设置了4组实验来验证所采用方法的有效性。4组实验所采用的数据均为某风机机组驱动端振动信号数据。
第1组实验设置为进行重采样,未进行小波阈值降噪。第2组实验设置为进行小波阈值降噪,未进行重采样。第3组实验设置为进行重采样与小波阈值降噪。前3组实验均未进行PCA降维,均按人工经验选取数据通道。第4组实验设置为同时进行了重采样、小波阈值降噪与PCA降维。
表3为消融实验结果,可以看出,未进行重采样或小波阈值降噪的网络性能均会有所下降,证明了本文所采用预处理方法的有效性。另外,采用PCA降维后的实验结果基本能接近人工经验选择的网络训练结果,考虑到该方法具有更好的灵活性与泛化性,综合评估下与PCA结合的方法具有一定的可行性。
表3 消融实验结果
Tab. 3
| 风机编号 | 训练集 | 测试集 | ||||||
|---|---|---|---|---|---|---|---|---|
| 第1组 | 第2组 | 第3组 | 第4组 | 第1组 | 第2组 | 第3组 | 第4组 | |
| 01 | 0.956 | 0.942 | 0.998 | 0.985 | 0.956 | 0.948 | 0.984 | 0.976 |
| 02 | 0.957 | 0.949 | 0.997 | 0.987 | 0.949 | 0.943 | 0.988 | 0.975 |
| 03 | 0.957 | 0.937 | 0.998 | 0.992 | 0.956 | 0.941 | 0.989 | 0.978 |
| 04 | 0.952 | 0.938 | 0.998 | 0.989 | 0.956 | 0.945 | 0.983 | 0.973 |
| 05 | 0.954 | 0.951 | 0.996 | 0.986 | 0.965 | 0.941 | 0.984 | 0.974 |
| 06 | 0.968 | 0.949 | 0.998 | 0.983 | 0.957 | 0.938 | 0.987 | 0.972 |
| 07 | 0.953 | 0.943 | 0.996 | 0.987 | 0.954 | 0.946 | 0.985 | 0.974 |
| 08 | 0.959 | 0.942 | 0.998 | 0.985 | 0.955 | 0.942 | 0.982 | 0.975 |
| 09 | 0.951 | 0.945 | 0.997 | 0.988 | 0.953 | 0.943 | 0.986 | 0.968 |
| 10 | 0.957 | 0.943 | 0.997 | 0.990 | 0.955 | 0.943 | 0.984 | 0.973 |
4 结论
针对风电机组的故障诊断问题,基于时域分析给出了一种使用WDCNN来进行特征提取并完成自动诊断的方法。此方法在风机轴承转速不同的情况下,采用重采样处理数据,并使用小波阈值降噪的方法去除伪分量。另外,针对现场风机数据所含通道数较多的情况,结合PCA进行降维,选取合适的数据通道。最后,训练好的神经网络可有效提取出风电振动信号所包含的故障特征。在风电场中的风机数据表明,此方法通过较少的风机数据即可训练出具有较强特征提取与故障诊断能力的网络,同时不受风机轴承转速改变的影响。所提出的方法在保证较高诊断准确率的同时具有数据需求量少、训练时间短与限制条件少等优点,在实际工程中有着较大的应用价值。
参考文献
Energy storage in distribution system planning and operation:current status and outstanding challenges
[J].
“双碳”目标下“能源三要素”再思考
[J].
Rethinking of the “three elements of energy” toward carbon peak and carbon neutrality
[J].
风电并网价值分析
[J].
Value analysis of wind power integration
[J].
China’s roadmap for renewable energy development 2050
[EB\OL].(
0a79563c1ec4dad77e.html?_wkts_=16914621
MW级变速变桨风力发电机组系统振动故障诊断技术与减振降载方法研究
[D].
Study on vibration fault diagnosis technology and vibration reduction and load reduction method of MW variable speed variable pitch wind turbine system
[D].
基于深度小世界神经网络的风电机组异常检测
[J].
Anomaly detection of wind turbines based on deep small-world neural network
[J].
基于DRS与改进Autogram的风电齿轮箱复合故障特征提取
[J].
Compound fault feature extraction of wind power gearbox based on DRS and improved autogram
[J].
风电场次同步振荡等值建模方法研究
[J].
Equivalent modeling method of sub-synchronous oscillation in wind farm
[J].
我国风力发电发展现状和问题分析
[J].
Status quo and problems analysis of wind power generation in China
[J].
风电机组状态识别的非机理性建模方法
[J/OL].
Non-mechanical modeling method for state identification of wind turbines
[J/OL].
A wurvey on wind turbine condition monitoring and fault diagnosis-part I:components and subsystems
[J].
Fault diagnosis of hoist gearbox based on time-domain analysis of EMD and fuzzy clustering
[J].
Intelligent fault diagnosis and prognosis approach for rotating machinery integrating wavelet transform, principal component analysis,and artificial neural networks
[J].
A new noise-controlled second-order enhanced stochastic resonance method with its application in wind turbine drivetrain fault diagnosis
[J].
Generator bearing fault diagnosis for wind turbine via empirical wavelet transform using measured vibration signals
[J].
A review of artificial intelligence techniques in image steganography domain
[J].
A CBA-KELM-based recognition method for fault diagnosis of wind turbines with time-domain analysis and multisensor data fusion
[J].
A novel fault diagnosis technique for wind turbine gearbox
[J].
Imagenet classification with deep convolutional neural networks
[J].
/
| 〈 |
|
〉 |