联合循环发电站电力输出预测
Electrical Power Output Prediction of Combined Cycle Power Station
收稿日期: 2022-06-02
| 基金资助: |
|
Received: 2022-06-02
作者简介 About authors
为了使联合循环发电站利润最大化,准确预测其满负载电力输出非常重要。联合循环发电站运行时,前一级产生的废气被用来驱动下一级热机,以此来推动发电机,其满负载电力输出受到环境温度、大气压强、相对湿度和废气气压的影响。为此,首先,采用核主成分分析(kernel principle component analysis,KPCA)对电站发电相关的特征进行特征组合降维完成特征提取;然后,采用极端梯度提升(extreme gradient boosting,XGBoost)算法进行特征重要性评分,并结合序列前向选择法(forward selection,FS)获取最优特征子集;最后,构建了KPCA-XGB-FS模型用于联合循环发电站满负载下小时电力输出预测。通过对某联合发电站的真实数据进行实验,并与使用相同数据的已有研究方法进行对比,结果表明,所提出方法能够有效对电力输出进行预测,预测结果优于已有的研究方法。
关键词:
In order to maximize the profit of a combined cycle power plant, it is important to accurately predict its full load power output. When a combined cycle power plant operates, the exhaust gas produced by the previous stage is used to drive the next stage heat engine to drive the generator, and its full-load electrical output is affected by ambient temperature, atmospheric pressure, relative humidity and exhaust pressure. Firstly, the kernel principle component analysis (KPCA) was used to perform feature combination dimensionality reduction for power generation related features to complete feature extraction. Then, the extreme gradient boosting algorithm (XGBoost) was used to score feature importance and the optimal feature subset was obtained by forward selection (FS). Finally, a KPCA-XGB-FS model was constructed for the prediction of hourly power output under full load of combined cycle power plants. By experimenting with real data from a combined power station and comparing with existing research methods using the same data, it is found that the method proposed in this paper can effectively predict the power output, and is better than the existing research methods.
Keywords:
本文引用格式
陈代俊, 陈里里, 李阳涛.
CHEN Daijun, CHEN Lili, LI Yangtao.
0 引言
目前,有大量的学者采用机器学习的方法对发电站的电力输出进行建模预测,但存在未充分挖掘特征信息或模型简单导致的精度不高等问题。文献[5]采用主成分分析(principle component analysis,KPCA)方法降低气象因素维度,提取互不相关的综合性评价指标,通过主成分分析法提取的特征建立多元线性回归模型。文献[6]采用线性回归算法分析了各特征之间的相关性以及特征与发电量之间的相关性。文献[7]采用模糊C均值聚类算法生成新的样本,并构建支持向量机模型对发电量进行预测。文献[8]利用与日发电量具有高相似度的历史数据构建支持向量机模型对发电量进行预测。文献[9]提出了基于深度信念网络的短期发电量预测方法,并对真实的相关特征及历史发电量进行了预测算例分析。文献[10]基于改进神经网络和能量守恒法的计算方法,利用遗传算法优化相关参数,构建了发电量预测模型。文献[11]采用K均值聚类算法对历史数据进行聚类,并以逆向传播(back propagation,BP)神经网络为基础,引入小波分析构建小波神经网络,同时利用遗传算法对网络参数进行寻优,并以此构建了光伏电站发电量预测模型。文献[12]采用多个神经网络提取特征并进行特征融合以实现超短期风电功率预测。
本文针对上述方法未充分挖掘环境温度、环境压力和环境相对湿度等对电力输出的影响以及电力输出预测误差大等问题,采用核主成分分析算法(kernel principle component analysis,KPCA)与极端梯度提升(extreme gradient boosting,XGBoost)算法特征重要性评分,充分分析各相关特征对电力输出的单一和交叉影响,以XGBoost算法作为回归模型对电力输出进行预测。通过某联合循环发电站收集的实际数据进行实验,并与其他方法进行对比,验证了本文所提方法的有效性。
1 核主成分分析
1.1 核主成分分析原理
设
其特征方程为
式中:
由式(
式中
对于
分别将式(
式中:
式中
1.2 核函数选择
RBF在计算过程中涉及到2个向量的欧式距离计算[17],本文采用的高斯核函数公式为
式中
通过将不同个数的特征输入KPCA,从而挖掘出多个组合特征。这些组合特征中,包含了绝大多数原始特征的有用信息,且去除了一部分噪声信息。从这些组合特征中选取出对预测标签具有较大影响因子的特征,能有效提高模型预测效果。
2 XGBoost算法原理
XGBoost算法是梯度提升树(gradient boosting decision tree,GBDT)的一种改进模型,其基学习器可以选择线性分类以及非线性的树模型。XGBoost在GBDT的目标函数上加上正则项,减少了过拟合的可能性且加快了收敛速度[20]。目标函数如下:
式中:
XGBoost的损失函数可以根据泰勒公式二阶导数来对其进行展开,这样其目标函数就会拥有一个更快的收敛速度和更高的准确性[21]。此时目标函数为
式中:
1)基于权重的特征重要性,即在所有树中每一个特征被用来分裂数据的次数。
2)基于覆盖的特征重要性,即在所有树中每一个特征被用来分裂数据的次数,且统计有多少样本点通过这个分裂点。
3)基于增益的特征重要性,即计算每一个特征分裂时平均损失的减少量。
本文基于增益的XGBoost特征重要性与前向选择法提出了XGB-FS特征选择算法。该算法基于XGBoost特征选择重要性评分对所有特征进行排序,采用前向选择法依次将特征输入模型,采用训练集的平均绝对误差(mean absolute erro,MAE)作为评价指标,找到MAE值最小的最优特征子集。
3 基于KPCA-XGB-FS的电力输出预测
本文提出的基于KPCA-XGB-FS的联合发电站电力输出预测方法流程如下:首先,对原始样本的4个特征遍历2个、3个和4个依次组合,通过KPCA算法对各组合的特征进行非线性信息提取,共生成了11个特征;其次,对所有的特征进行对数变换,使其更加满足高斯分布;然后,基于XGB-FS特征选择算法从原始的4个特征和生成的11个特征中选择最优特征子集;最后,直接将最优特征子集输入XGBoost模型进行训练,构建联合循环发电站电力输出预测模型。在实际的应用场景中,输入模型的环境相关特征可通过当地气象局提前获取,从而对未来的电力输出进行预测。
本文实现电力输出预测的方法是基于机器学习中的回归算法。使用对燃气轮机和蒸汽涡轮机负载造成影响的相关特征进行一系列的特征信息提取,然后通过提取的新特征建立电力输出预测模型。具体方法的流程如图1所示。
图1
4 实验与分析
4.1 实验数据
本文使用来自公开数据集网站UCI中的联合循环发电站数据集来验证所提方法的有效性。该循环发电站由2个燃气轮机、1个蒸汽涡轮机和2个双压热回收蒸汽发生器组成。燃气轮机能够产生电力并用它的废气余热产生蒸汽,再通过蒸汽涡轮机产生额外的电力。实验数据集由某联合循环发电站在674 d满载工作状态下采集的9 568个数据样本,输入特征是每小时从传感器接收的数据平均值,包括每小时平均环境温度(ambient temperature,AT)、平均大气压强(atmospheric pressure,AP)、平均相对湿度(relative humidity,RH)和平均废气气压(V),预测目标为燃气轮机和蒸汽涡轮机每小时净电力输出(electrical energy output,EP)。燃气轮机负载对AT、AP和RH敏感,蒸汽涡轮机负载对V敏感。各特征和EP的平均值、方差、最小值和最大值如表1所示,AT、V、AP、RH均为连续型数值变量。随机选取原始样本数量的70%(6 697例)作为训练集用以训练KPCA-XGB-FS模型,剩余的30%(2 871例)样本作为测试集用以评价模型预测效果。
表1 各特征统计值
Tab. 1
| 统计值 | AT/℃ | V/kPa | AP/kPa | RH/% | EP/MW |
|---|---|---|---|---|---|
| 平均值 | 19.65 | 72.23 | 101.326 | 73.31 | 454.37 |
| 方差 | 7.45 | 16.90 | 0.594 | 14.60 | 17.07 |
| 最小值 | 1.81 | 33.73 | 99.289 | 25.56 | 420.26 |
| 最大值 | 37.11 | 108.47 | 103.330 | 100.16 | 495.76 |
4.2 评价指标
为了衡量所建立模型对测试集的预测效果,本文使用平均绝对误差(mean absolute error,MAE)、平均相对误差(mean relative error,MRE)、均方根误差(root mean squared error,RMSE)和平均绝对百分比误差(mean absolute percentage error,MAPE) 4个评价指标计算模型预测值与真实值的误差,从而对模型预测效果进行评估。4个评价指标分别表示如下:
式中:
4.3 基于KPCA的特征提取
对原始数据中的AT、V、AP、RH特征进行不同的组合,然后采用KPCA对各组合的特征进行非线性降维,每一个组合生成一列新的特征。如图2所示,从原始数据中使用11个不同特征的组合并基于KPCA提取11个融合了各特征信息的新特征。新特征融合了原有特征中重要的信息并且舍弃了原特征中的噪声影响。
图2
4.4 核心影响特征选择
将基于KPCA提取的11个新特征与原数据的4个特征通过XGBoost特征重要性评分得到每一个特征的重要性。如图3所示,ATVAP、ATVRH、ATV 3个特征都表现出比原始特征更高的特征重要性评分。因此,本文提出的特征提取方法能有效提取出比原数据更为有效的特征。基于FS算法按照特征重要性评分的排序,从一个特征开始依次增加特征个数,分别计算训练集不同特征个数下10倍交叉验证的MAE平均值。如图4所示,当特征个数为8时,训练集10倍交叉验证下的MAE值为2.422 4。MAE值越小,代表预测值与真实值之间的误差越小,因此,ATVAP、ATVRH、ATV、ATAP、VAP、AT、V、AP共8个特征为挑选的最优特征子集。
图3
图4
4.5 不同方法效果比较
表2 各方法性能
Tab. 2
| 方法 | MAE | RMSE | MAPE | ME |
|---|---|---|---|---|
| 文献[23] | 2.818 | 3.787 | — | — |
| 原始特征+XGBoost | 2.252 | 3.086 | 0.497% | -0.019 |
| KPCA-XGB-FS | 2.021 | 2.846 | 0.446% | -0.02 |
图5
5 结论
采用KPCA算法对电力预测相关数据进行了非线性特征组合与提取,得到了更多的组合特征;采用XGB-FS特征选择方法筛选最佳特征子集并建立XGBoost联合循环发电站电力输出预测模型。所提方法能够充分挖掘发电相关数据中的线性与非线性信息,去除数据噪声,获得较好的预测效果。为这项研究提供数据集的联合循环发电站已经开始使用这种预测模型来预测第2天每小时的电力输出,预测计算时该联合循环发电站使用的是该州气象研究所给出的第2天的温度预报作为模型输入。所提出的方法也可以使用发电站当地第2天的温度预报作为模型输入进行电力输出预测。
在今后的工作中,将进一步研究如何更加精确地获取未来时间的环境变量以完善预测模型的输入,并对不同发电站更多的数据进一步研究。
参考文献
关于发展燃气-蒸汽联合循环发电的探讨
[J].
Discussion on the development of gas-steam combined cycle power generation
[J].
基于“双碳”目标的中国火力发电技术发展路径研究
[J].
Research on the development path of China’s thermal power generation technology based on the goal of “carbon peak and carbon neutralization”
[J].
塔式太阳能辅助燃气蒸汽联合循环钙基碳捕集系统设计
[J].
Design of calcium-based carbon capture system for gas-steam combined cycle assisted by solar thermal tower
[J].
天然气联合循环电厂燃烧后CO2捕集一体化技术经济评价
[J].
Economic evaluation of post-combustion CO2 capture integration technology in natural gas combined cycle power plant
[J].
基于主成分回归分析的气象因子对光伏发电量的影响
[J].
Influence of meteorological factors on photovoltaic power generation based on principal component regression analysis
[J].
多因素耦合对光伏发电性能影响的实验研究
[J].
Experimental study on the effect of multi-factor coupling on photovoltaic power generation performance
[J].
基于模糊支持向量机的光伏发电量预测
[J].
Prediction of photovoltaic power generation based on fuzzy support vector machine
[J].
基于改进相似日的光伏系统日发电量预测
[J].
Daily power generation forecast of photovoltaic system based on improved similar days
[J].
基于深度信念网络的光伏电站短期发电量预测
[J].
Short-term power generation forecast of photovoltaic power station based on deep belief network
[J].
基于改进神经网络和能量守恒法的热电联产机组发电量计算
[J].
Calculation of power generation of cogeneration units based on improved neural network and energy conservation method
[J].
基于数据挖掘和遗传小波神经网络的光伏电站发电量预测
[J].
Prediction of photovoltaic power plant power generation based on data mining and genetic wavelet neural network
[J].
碳中和背景下多通道特征组合超短期风电功率预测
[J].
Ultra-short-term wind power prediction with multi-channel feature combination under carbon neutrality
[J].
基于KPCA与混合蛙跳算法的并网光伏电站发电量预测模型研究
[J].
Research on power generation forecast model of grid-connected photovoltaic power station based on KPCA and hybrid leapfrog algorithm
[J].
主成分分析法与核主成分分析法在机械噪声数据降维中的应用比较
[J].
Application comparison of principal component analysis method and kernel principal component analysis method in dimension reduction of mechanical noise data
[J].
基于KPCA-WOA-KELM的岩爆烈度预测
[J].
Rockburst intensity prediction based on KPCA-WOA-KELM
[J].
Conceptual and empirical comparison of dimensionality reduction algorithms (PCA,KPCA,LDA,MDS,SVD,LLE,ISOMAP,LE,ICA,t-SNE)
[J].
Performance analysis of dimensionality reduction using PCA,KPCA and LLE for ECG signals
[C]//
A method for speeding up feature extraction based on KPCA
[J].
基于改进EEMD、KPCA与RBF结合的变负载下滚动轴承故障程度识别
[J].
WU T,GAO C X,FU Z Y,Fault degree identification of rolling bearing under variable load based on the combination of improved EEMD,KPCA and RBF
[J].
基于多模型融合Stacking集成学习方式的负荷预测方法
[J].
Load forecasting method based on multi-model fusion stacking ensemble learning method
[J].
基于Prophet与XGBoost混合模型的短期负荷预测
[J].
Short-term load forecasting based on Prophet and XGBoost hybrid model
[J].
XGBoost算法在风机主轴承故障预测中的应用
[J].
Application of XGBoost algorithm in fault prediction of fan main bearing
[J].
Prediction of full load electrical power output of a base load operated combined cycle power plant using machine learning methods
[J].
/
| 〈 |
|
〉 |