发电技术, 2025, 46(1): 135-144 DOI: 10.12096/j.2096-4528.pgt.23005

发电及环境保护

基于K-Means聚类与Ridge回归算法的煤炭发热量预测研究

乔世超, 陈衡, 李博, 潘佩媛, 徐钢

热电生产过程污染物监测与控制北京市重点实验室(华北电力大学),北京市 昌平区 102206

Research on Coal Calorific Value Prediction Based on K-Means Clustering and Ridge Regression Algorithm

QIAO Shichao, CHEN Heng, LI Bo, PAN Peiyuan, XU Gang

Beijing Key Laboratory of Emission Surveillance and Control for Thermal Power Generation (North China Electric Power University), Changping District, Beijing 102206, China

收稿日期: 2023-11-15   修回日期: 2024-03-09  

基金资助: 国家自然科学基金青年项目.  52106008
国家自然科学基金创新研究群体项目.  51821004

Received: 2023-11-15   Revised: 2024-03-09  

作者简介 About authors

乔世超(2000),男,硕士研究生,研究方向为电站大数据优化,Gregory_Qiao@outlook.com

陈衡(1989),男,博士,副教授,研究方向为热力系统优化,本文通信作者,heng@ncepu.edu.cn

摘要

目的 煤炭发热量是衡量煤质的重要评价标准之一,也是动力用煤计价的主要依据。为了能够在降低预测成本的前提下实现对煤炭发热量的高精度快速预测,提出了一种新的预测方法。 方法 采用K-Means聚类算法对相似煤种进行聚类,样本数据来源于山东某电厂自备煤场近6年的4 269条入场化验信息。在聚类的基础上,分别建立工业分析数据低位发热量的Ridge回归模型,以此作为煤炭发热量的预测模型。 结果 所建立的K-Means聚类与Ridge回归混合模型在预测效果上表现出色。与传统的多元线性回归模型相比,该混合模型可将平均绝对值误差最高减少30.525%,均方根误差最高降低60.054%,相关系数最高提高2.320%。 结论 K-Means聚类与Ridge回归混合模型不仅降低了煤炭发热量的预测成本,还提高了预测的精度和速度,为煤炭发热量的预测提供了一种新思路。

关键词: 燃煤电厂 ; 煤炭发热量 ; 工业分析 ; 预测 ; K-Means聚类 ; Ridge回归

Abstract

Objectives The calorific value of coal is one of the important evaluation criteria for measuring coal quality, and is also the main basis for valuation of power coal. In order to realize high-precision and rapid prediction of coal calorific value while reducing prediction costs, a new prediction method is proposed. Methods The K-Means clustering algorithm is used to cluster similar coal types. The sample data comes from 4 269 entry testing information from a self-contained coal yard of a power plant in Shandong in the past 6 years. On the basis of clustering, Ridge regression models are established from industrial analysis data to received base calorific value, which is used as a prediction model for coal calorific value. Results The established K-Means clustering and Ridge regression hybrid model exhibits excellent prediction performance. Compared with the traditional multiple linear regression model, this hybrid model can reduce the mean absolute error by up to 30.525%, reduce the root mean square error by up to 60.054%, and increase the correlation coefficient by up to 2.320%. Conclusions The mixed model of K-Means clustering and Ridge regression reduces the prediction cost of coal calorific value, and also improves the accuracy and speed of prediction, providing a new idea for predicting coal calorific value.

Keywords: coal-fired power plants ; calorific value of coal ; proximate analysis ; prediction ; K-Means clustering ; Ridge regression

PDF (9159KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

乔世超, 陈衡, 李博, 潘佩媛, 徐钢. 基于K-Means聚类与Ridge回归算法的煤炭发热量预测研究. 发电技术[J], 2025, 46(1): 135-144 DOI:10.12096/j.2096-4528.pgt.23005

QIAO Shichao, CHEN Heng, LI Bo, PAN Peiyuan, XU Gang. Research on Coal Calorific Value Prediction Based on K-Means Clustering and Ridge Regression Algorithm. Power Generation Technology[J], 2025, 46(1): 135-144 DOI:10.12096/j.2096-4528.pgt.23005

0 引言

2021年,我国煤炭消费量占能源消费总量的56.0%[1],鉴于我国富煤、贫油、少气的能源结构,我国以煤炭为主体的能源消费结构在短时间内不会改变[2-4]。随着碳达峰、碳中和目标的提出,促进能源行业向清洁化、低碳化演进已经成为迫切需要解决的问题。综合考虑政策倾向以及我国独特的能源资源禀赋,对传统能源进行技术优化是解决能源行业有序转型问题最经济高效的路径[5]。因此,对煤炭特性的分析与研究对我国能源行业的发展具有重要意义。

发热量反映了单位质量煤炭完全燃烧时所能释放的能量,是衡量煤炭品质的重要指标,也是动力用煤计价的主要依据。因此,对于发热量的高效准确测量成为了重要的研究课题。

目前,一般采用实验的方法来测定煤的发热量,包括氧弹热量计法、恒温式热量计法、绝热式热量计法等[6-8]。但由于需要经过严格的程序和专业技术人员的操作,测量周期较长[9],这就导致测试结果有一定滞后性。近年来,用于煤炭发热量快速测定的瞬发伽马中子活化分析已在实际生产中小范围应用[10],但这种测试方法存在辐射危害、设备昂贵、运行维护成本高等问题[11]

随着计算机技术的发展,许多学者利用机器学习算法对燃煤参数与发热量之间的关系进行了研究,建立了一系列发热量预测模型。谭鹏等[12]建立了非线性支持向量机的煤质发热量预测模型,研究表明,该预测模型比线性模型具备更精准的预测能力。焦发存等[13]建立了基于灰分和固定碳含量的发热量预测模型,以实现对淮南矿区煤炭发热量的快速估算。李大虎等[14]采用最大信息系数特征变量选择与粒子群优化-BP神经网络相结合方法,实现了煤炭发热量非线性预测,总体预测效果较优。

鉴于煤的全元素分析需要专业设备、耗时较长、成本较高[15],因此多数煤场一般只进行煤的工业分析和硫元素、氢元素分析[16],这给发热量的预测造成了一定程度的阻碍。煤炭工业分析具有操作简单、成本低廉、响应时间快的特点,本文依据煤种的工业分析数据,利用K-Means聚类算法对全部批次煤炭进行分类,并采用多元线性回归算法,对性质相似的煤种分别建立发热量关于工业分析数据的预测模型,实现对发热量更高精度的预测。

1 煤样情况

本文以我国北方某电厂自备煤场为研究对象,该煤场燃煤主要来自太原、阳泉、寿阳、榆林等地。煤场内化学实验室每天对不同批次来煤进行化验,并将化验结果录入到SQL Server数据库中。本文选取近6年的4 269条入场化验信息作为样本,建立工业分析与煤炭发热量的多元线性回归模型。由于工业分析中4个参数总和为100%,所以仅需选取其中3个参数作为输入变量。有研究[17-18]表明,挥发分含量对发热量影响相对较小,且我国锅炉计算一般采用低位发热量作为衡量指标[19],故本文选取收到基水分质量分数Mar、收到基灰分质量分数Aar以及收到基固定碳质量分数FC,ar作为输入变量,收到基低位发热量Qnet,ar作为输出变量。经统计,数据集基本情况如表1所示,全部样本数据的分布情况如图1所示。

表1   数据集基本情况

Tab. 1  Basic information of the dataset

参数最小值最大值平均值
收到基低位发热量Qnet,ar/(MJ⋅kg-1)14.1428.1821.13
收到基水分质量分数Mar/%2.1529.099.55
收到基灰分质量分数Aar/%4.4148.5224.96
收到基固定碳质量分数FC,ar/%31.4671.0347.08

新窗口打开| 下载CSV


图1

图1   样本数据的分布情况

Fig. 1   Distribution of the sample data


2 K-Means聚类算法

2.1 数据归一化

在K-Means聚类算法中,需要采用数据归一化方法减小数据中较大和较小的初始数据所占距离比重对聚类效果的影响,提高模型的收敛速度和计算精度[20]。数据归一化是将数据按比例缩放,针对一个数据维度中全部数据范围缩放至[0,1]的操作。由此可以降低由于数据的量纲不同或量级差距大对模型的不良影响。本文采用最大-最小值归一化算法,对数据进行归一化处理,用公式表示其原理如下:

x'=x-xminxmax-xmin

式中:x'为归一化后数据;x为归一化前原始数据;xmax为数据最大值;xmin为数据最小值。

K-Means算法是一种源于信号处理的向量量化方法,现在则更多地用在聚类分析中,并广泛应用于数据挖掘领域[21],是一种经典的分割式分群聚类算法。该算法主要目标是将样本中N个点按照相似度聚集到k个聚簇当中,将每个点都分配到离他最近的均值(即聚类中心)对应的聚簇,以之作为聚类的标准。最终,簇内相似度高,簇间相似度低,从而完成聚类。

K-Means算法采用了迭代优化的思想,通常被称为劳埃德算法[22]。该算法可分为4个步骤:

1)选择初始质心。已知共有n条数据,每个元素都是d维向量,全部数据集合为X,确定聚类簇数k,将全部数据随机分为k个集合,故有X=X1X2∪…∪Xk,每个集合内元素个数为Ni,并从每个子集中随机选择一个初始聚类中心m=(m1, m2, …, mk )。

2)初始化完成后,将每个样本观测值x分配到其最近的集群,并计算出每个观测值到聚类中心mi 的欧氏距离平方和,将该值命名为组内平方和(within-cluster sum of squares,WCSS),其表达式为

WCSS=i=1kxXix-mi2

3)对先前各个聚簇内所有样本分别取平均值,将其设定为新的质心mi*,质心公式为

mi*=1NixX1x

4)计算旧质心和新质心之间的欧氏距离。算法重复最后2个步骤,直到分配方案不再改变,此时可认为算法达到收敛,组内平方和不再减小,质心不再显著移动,数值上表现为最新一次迭代所获得的质心与上一次迭代所获得的质心间的欧氏距离小于给定阈值。

2.2 最佳聚类数的选取方法

K-Means算法是一种非监督学习算法[23],聚类不需要对数据进行训练和学习,而是人为规定聚类数,再通过聚类分析将数据聚合成几个群体。不同的聚类数对最终聚类效果有很大的影响,所以需要采用评价指标辅助确定最佳聚类数,以下是评价聚类效果的3种常用方法。

2.2.1 手肘法

在聚类分析中,手肘法是一种用于确定数据集中聚类数量的方法,由美国心理测量学家罗伯特⋅拉德⋅桑代克于1953年首次提出[24],其原理是:设定聚类范围,随着聚类簇数k的增大,样本划分会更加细致,每个簇的聚合程度会逐渐提高,那么WCSS自然会逐渐变小。当k值小于最佳聚类簇数时,k值的不断增大会使每个簇的聚合程度大幅度增加,故WCSS的下降幅度会很大。当k到达最佳聚类数时,再增加k所得到的聚合程度会迅速变小,组内平方和的数值变化也趋于平缓。WCSS与k的关系图是近似于手肘的形状,而这个肘部对应的k值就是数据的最佳聚类数[25]

图2是不同聚类数对应的WCSS值,在聚类数k为3时,该点的斜率变化率(前后2段折线斜率比值)最大,此时WCSS值变化最为剧烈,因此将模型聚类数设定为3最为合理。

图2

图2   手肘法判断最佳聚类数

Fig. 2   Elbow method to determine the optimal number of clustering


2.2.2 轮廓系数法

在机器学习与数据挖掘领域,轮廓系数法是一种反映数据聚类结果一致性的方法,可以用于评估聚类后簇与簇之间的离散程度[26]

对于某一个属于簇Ci 的样本i,记为iCi,设d(i, j)为样本ij之间的欧式距离,并求算样本i与簇内其他样本之间的平均距离,将其命名为凝聚度,记为a(i),它反映了样本i当前聚类结果的优劣,公式定义如下:

a(i)=1Ci-1jCi,ijd(i,j)

然后定义样本i与其他簇Ck 全部样本之间的平均距离,将最小平均距离命名为分离度,记作b(i):

b(i)=minki1CkjCkd(i,j)

综合式(1)—(5),定义样本i的轮廓系数公式为

s(i)=b(i)-a(i)max{a(i),b(i)}

当轮廓系数达到最大值时,可认为对应k值为最佳聚类数。图3为不同聚类数对应的轮廓系数值,当k值为3时,轮廓系数取值最大,对于本研究数据情况,将模型聚类数设定为3最为合理。

图3

图3   轮廓系数法判断最佳聚类数

Fig. 3   Silhouette coefficient method to determine the optimal number of clustering


2.2.3 卡林斯基-哈拉巴斯指数法

卡林斯基-哈拉巴斯(Calinski-Harabasz,CH)指数是由Calinski和Harabasz于1974年引入的一种可用于在非监督学习中评估聚类模型的指标[27]。CH指数(也称为方差比标准)通过计算所有集群的集群间离散度总和与集群内离散度总和的比率来对聚类效果进行评价,其定义如下:

CH(k)=Tr(Bk)Tr(Wk)×N-kk-1
Wk=i=1kxXi(x-mi)(x-mi)T
Bk=ikni(mi-m0)(mi-m0)T

式中: Bk 为组间色散矩阵,计算的是组间协方差; Wk 为群内色散矩阵,计算的是组内协方差;N为全部样本数;ni 表示i类中的样本数; m0表示数据集的中心点。

当CH指数达到最大时,说明模型用尽量少的类别聚类了尽可能多的样本,因此聚类效果最优,与之对应的簇数即为最佳聚类数。

图4是不同聚类数对应的CH指数值,在k值为3时,CH指数值最大,因此针对本研究,将模型聚类数设定为3最为合理。

图4

图4   卡林斯基-哈拉巴斯系数法判断最佳聚类数

Fig. 4   Calinski-Harabasz index method to determine the optimal number of clustering


2.3 K-Means聚类模型的构建

根据2.2节研究,可以确定最佳聚类数k为3。入场煤MarAar以及FC,ar经过归一化后,利用K-Means算法进行聚类分析。将聚类结果利用Python中Axes3D模块绘制出三维图像,最终聚类结果如图5所示。根据聚类结果图像,可将红色簇内的煤种命名为高固定碳煤,蓝色簇内的煤种命名为高灰分煤,绿色簇内的煤种命名为高水分煤。3类煤的参数范围如表2所示。

图5

图5   入场煤聚类结果

Fig. 5   Clustering results for the coal entered the yard


表2   煤种参数范围 (%)

Tab. 2  Range of coal type parameters

煤种MarAarFC,ar
高固定碳煤2.12~15.9011.94~33.9146.99~71.03
高灰分煤3.63~19.5118.14~48.5231.46~49.76
高水分煤9.12~29.034.40~23.5834.17~54.95

新窗口打开| 下载CSV


3 多元线性回归模型

3.1 基本原理

回归是监督学习的一个典型问题,可以用于预测输入变量和输出变量之间的关系[28]。输出变量的值随输入变量值的变化而变化,回归模型正是表示从输入变量到输出变量映射的函数。

在统计学中,线性回归是利用线性回归方程的最小平方函数对一个或多个自变量(输入变量)和因变量(输出变量)之间关系进行建模的一种回归分析[29]。其中,大于一个自变量情况的叫作多元线性回归分析[30],其基本原理如下:

对于一个有n个输入变量的样本i而言,回归目标函数为

yi=ω0+ω1xi1+ω2xi2++ωnxin+ε

式中:ω0为模型的截距;ω1—ωn 为模型的回归系数;ε为随机误差;yi 为样本i的目标变量;xi1—xin 为样本i上的不同特征。

考虑到一个数学模型有m个样本,回归结果可以表示为

y1=ω0+ω1x11+ω2x12++ωnx1n+ε1  y2=ω0+ω1x21+ω2x22++ωnx2n+ε2  ym=ω0+ω1xm1+ω2xm2++ωnxmn+εm

则该回归模型可用矩阵表示为

Y=1x11x1n1x21x2n1xm1xmnω0ω1ωn+ε1ε2εm

Y=Xω+ε

式中: Y 是包含m个全部样本回归结果的列向量; X 为变量矩阵; ω 为截距矩阵; ε 为误差矩阵。

3.2 多元线性回归算法

3.2.1 最小二乘法回归算法

最小二乘法(ordinary least squares,OLS)回归是最常见的,也是最简单的回归分析方法。相关回归分析、方差分析和线性模型理论等数理统计学的几大分支都以最小二乘法为理论基础[31]。其基本原则是使所有残差平方和,即样本点与到线性模型超平面的欧氏距离平方和最小。故定义残差平方和为代价函数C(ω),其表达式为

C(ω)=i=1n(yi-ω0-ω1xi1--ωnxin)2

最小二乘法多元线性回归的任务,就是找到参数ω的估计值,使得残差平方和达到最小。根据多元函数求极值原理,在估计值处的代价函数关于回归系数的偏导数应等于0:

C(ω)ωω=ω^=0

当( XTX )-1存在时,回归参数的最小二乘估计为

ω^=(XTX)-1XTY

由此即可得到要求解的回归方程:

y^=ω^0+ω^1x1+ω^2x2++ω^nxn

3.2.2 OLS回归算法改进

在处理较为复杂数据的回归问题时,OLS线性回归算法通常会出现预测精度不够的问题,导致解得的模型与实际偏差较大。因此,引入复杂度惩罚因子,通过正则项来约束需要优化的参数,从而实现避免过拟合的目的。常用的正则项可以使用L1范数、L2范数或将二者结合,3种方法对应的算法分别为Lasso回归,Ridge回归和Elastic Net回归[32],其代价函数分别为:

C1(ω)=i=1n(yi-ω0-ω1xi1--ωnxin)2+λω1
C2(ω)=i=1n(yi-ω0-ω1xi1--ωnxin)2+λω22
C3(ω)=i=1n(yi-ω0-ω1xi1--ωnxin)2+
λρω1+λ(1-ρ)2ω22

式中λ、ρ表示惩罚系数。

3.3 回归模型建立

以4 269条数据作为样本,随机选取其中70%的样本作为训练集进行回归拟合,其余的30%作为测试集验证模型准确度,数据集划分情况如图6所示。然后分别利用OLS回归算法、Lasso回归算法、Ridge回归算法和Elastic Net回归算法对训练集数据进行建模,并在测试集中进行验证。图7为预测值与实际值的对比图。

图6

图6   数据集的划分

Fig. 6   Division of the data set


图7

图7   发热量实际值与预测值对比

Fig. 7   Comparison between the predicted heat value and actual heat value


为了使对模型泛化能力的评价更加直观可信,本文引入几个常用的统计学评价指标,对不同回归算法的优劣进行量化评价。

常见的回归算法评估指标有平均绝对值误差δMAE、均方根误差δRMSE、决定系数R2等。其中,误差指标越小,代表预测值与真实值越接近;决定系数能够度量因变量变异中可由自变量解释部分所占的比例,以此来判断回归模型的解释力,决定系数越大,说明模型的解释力越强。上述评价指标对应的公式如下:

δMAE=1ni=1ny^i-yi
δRMSE=1ni=1n(y^i-yi)2
R2=1-i=1n(yi-y^i)2i=1n(yi-y¯i)2

式中:y^i为预测值;yi为真实值;y¯i为真实值平均值;n为测试集样本数量。

由此计算出不同方法对应的评价指标数值,回归方程及评价指标结果如表3所示。

表3   不同回归算法对应的模型评价指标

Tab. 3  Model evaluation indicators corresponding to different regression algorithms

回归算法回归方程δMAEδRMSER2
OLS回归Qnet,ar=26.569 84-0.337 03Mar-0.291 47Aar+0.103 11FC,ar0.270 360.628 380.942 94
Lasso回归Qnet,ar=21.542 41-0.150 61Mar-0.222 05Aar+0.133 61FC,ar0.464 600.792 840.909 16
Ridge回归Qnet,ar=26.569 15-0.337 01Mar-0.291 46Aar+0.103 12FC,ar0.248 450.592 630.945 63
Elastic Net回归Qnet,ar=23.358 12-0.220 51Mar-0.247 72Aar+0.123 42FC,ar0.358 700.696 540.929 89

新窗口打开| 下载CSV


表3可以看出,相较于传统的OLS回归模型,Lasso回归模型和Elastic Net回归模型的平均绝对值误差δMAE分别增加了71.472%和32.674%,均方根误差δRMSE分别增加了26.172%和10.848%,决定系数R2均有一定程度的下降。但采用Ridge回归算法构造回归模型,误差参数有所减小,决定系数也有所提高。

结合图7来看,采用Ridge回归算法的模型,其测试数据关于零误差线分布更加紧密,说明在4种回归算法中,Ridge回归算法预测效果最优。综上所述,从运行结果上来看,采用Ridge回归算法拟合效果更好。

Ridge回归一种以放弃无偏性、降低精度为代价,以解决病态矩阵问题的回归方法,这种方法在自变量高度相关的情况下有更好的拟合效果。统计学中一般采用方差膨胀系数(variance inflation factor,VIF)来衡量多元线性回归模型中多重共线性的严重程度。方差膨胀系数表示回归系数估计量的方差与假设自变量间不线性相关时方差的比值,其表达式如下:

VIF=11-R2

一般地,当5<VIF<10时,认为模型输入变量有一定多重共线性;当VIF≥10时,认为模型输入变量多重共线性很强。采用Ridge回归模型对MarAar以及FC,ar进行多重共线性分析,结果如表4所示。

表4   输入变量方差膨胀系数

Tab. 4  Variance inflation factors of input variables

输入变量MarAarFC,ar
VIF6.095 279.974 0516.879 13

新窗口打开| 下载CSV


表4可知,本文研究模型输入变量间多重共线性较强,与Ridge回归算法的使用场景相符。

综上所述,Ridge回归模型的误差较小,决定系数相对较大;且由于模型自变量之间多重共线性较强,Ridge回归在该情况下对回归方程的拟合有更好的表现效果。综合不同回归模型误差结果对比和Ridge回归算法特性理论推导,确定本文选用Ridge回归算法对煤场数据进行构建多元线性回归模型。

4 K-Means聚类-Ridge回归混合模型

建立K-Means聚类-Ridge回归混合模型,来对分类后的煤种逐一进行回归计算,其流程如图8所示。

图8

图8   模型的建立流程

Fig. 8   Process of building model


对燃煤数据建立K-Means聚类-Ridge回归混合模型,得到相似煤种各自的回归方程及相关评价指标,如表5所示。不同煤种预测模型的实际值与预测值对比如图9所示。由表5图9可以看出,聚类后回归效果较聚类前有明显的改善,其中高固定碳煤最为明显,可将平均绝对值误差降低30.525%,均方根误差降低60.054%,决定系数提高2.320%。

表5   K-Means聚类后对应不同煤种的回归模型评价指标

Tab. 5  Model evaluation indicators of regression models corresponding to different coal types after K-Means clustering

煤炭种类回归方程δMAEδRMSER2
全部煤Qnet,ar=26.569 15-0.337 01Mar-0.291 46Aar+0.103 12FC,ar0.248 450.592 630.945 63
高固定碳煤Qnet,ar=28.753 18-0.345 87Mar-0.315 47Aar+0.076 18FC,ar0.172 610.236 730.967 57
高灰分煤Qnet,ar=24.843 48-0.301 57Mar-0.276 01Aar+0.125 64FC,ar0.224 370.348 470.963 36
高水分煤Qnet,ar=28.329 07-0.404 50Mar-0.299 58Aar+0.089 79FC,ar0.247 840.409 610.957 69

新窗口打开| 下载CSV


图9

图9   聚类后不同煤种发热量实际值与预测值对比

Fig. 9   Comparison between actual calorific value and predicted calorific value of different coal types after clustering


由上述分析可知,采用K-Means聚类-Ridge回归混合模型能在一定程度上提高根据工业分析预测煤炭发热量的准确度,结果与预期效果一致。

5 结论

1)相较几种实测法测定煤炭发热量,采用建立燃煤线性回归模型的方法可以节省大量的人力与物力,并且可以实现煤炭发热量的在线快速预测。

2)由于煤炭的工业分析数据间有很强的多重共线性,因此相较传统的最小二乘法回归方法以及其他改进方法,Ridge回归方法在煤炭工业分析发热量的预测中有更好的准确性和可信度。

3)与未经聚类的全部煤样对应的回归模型相比,经过K-Means聚类后的煤样预测模型的平均绝对值误差δMAE和均方根误差δRMSE分别最高减少30.525%和60.054%,决定系数R2最高增加2.320%,一定程度上提高了预测的精度。

参考文献

国家统计局

中华人民共和国2021年国民经济和社会发展统计公报

[EB/OL].(2022-02-16)[2024-03-24].. doi:10.3969/j.issn.1002-4557.2003.03.003

[本文引用: 1]

National Bureau of Statistics

Statistical bulletin on national economic and social development of the People’s Republic of China in 2021

[EB/OL].(2022-02-16)[2024-03-24].. doi:10.3969/j.issn.1002-4557.2003.03.003

[本文引用: 1]

王小洋李先国

能源革命背景下我国煤炭运输通道的发展趋势及对策

[J].中国流通经济,201933(10):67-75

[本文引用: 1]

WANG X YLI X G

The development trend of China’s coal transportation in the context of energy revolution and the countermeasures

[J].China Business and Market,201933(10):67-75

[本文引用: 1]

冯伟忠李励

“双碳”目标下煤电机组低碳、零碳和负碳化转型发展路径研究与实践

[J].发电技术,202243(3):452-461doi:10.12096/j.2096-4528.pgt.22061

FENG W ZLI L

Research and practice on development path of low-carbon,zero-carbon and negative carbon transformation of coal-fired power units under “double carbon” targets

[J].Power Generation Technology,202243(3):452-461doi:10.12096/j.2096-4528.pgt.22061

张全斌周琼芳

基于“双碳”目标的中国火力发电技术发展路径研究

[J].发电技术,202344(2):143-154doi:10.12096/j.2096-4528.pgt.22092

[本文引用: 1]

ZHANG Q BZHOU Q F

Research on the development path of China’s thermal power generation technology based on the goal of “carbon peak and carbon neutralization”

[J].Power Generation Technology,202344(2):143-154doi:10.12096/j.2096-4528.pgt.22092

[本文引用: 1]

刘志强李建锋潘荔

中国煤电机组改造升级效果分析与展望

[J].中国电力,202457(7):1-11

[本文引用: 1]

LIU Z QLI J FPAN Let al

Analysis and prospect of transformation and upgrading effects of coal-fired power units in China

[J].Electric Power,202457(7):1-11

[本文引用: 1]

袁翠翠杜政烨茌方

氧弹热量计性能验收方法实践

[J].煤炭加工与综合利用,2022(3):86-90

[本文引用: 1]

YUAN C CDU Z YCHI Fet al

Practice of guide for performance acceptance of oxygen bomb calorimeter

[J].Coal Processing & Comprehensive Utilization,2022(3):86-90

[本文引用: 1]

张利萍

恒温式热量计测定煤炭发热量的探讨

[J].化工设计通讯,201743(1):145-147

ZHANG L P

Discussion on the determination of calorific value of coal by constant temperature calorimeter

[J].Chemical Engineering Design Communications,201743(1):145-147

李莉于磊王超

煤发热量测定方法优化

[J].山东电力技术,201542(2):72-75

[本文引用: 1]

LI LYU LWANG C

Optimization of calorific value determination of coal

[J].Shandong Electric Power,201542(2):72-75

[本文引用: 1]

郑忠宋万利

基于主成分分析的中煤发热量的检测研究

[J].煤炭技术,201433(6):218-220

[本文引用: 1]

ZHENG ZSONG W L

Detection research of calorific value of middlings based on principal component analysis

[J].Coal Technology,201433(6):218-220

[本文引用: 1]

SONG WHOU ZGU Wet al

Industrial at-line analysis of coal properties using laser-induced breakdown spectroscopy combined with machine learning

[J].Fuel,2021306121667doi:10.1016/j.fuel.2021.121667

[本文引用: 1]

YAO SQIN HWANG Qet al

Optimizing analysis of coal property using laser-induced breakdown and near-infrared reflectance spectroscopies

[J].Spectrochimica Acta Part A:Molecular and Biomolecular Spectroscopy,2020239118492doi:10.1016/j.saa.2020.118492

[本文引用: 1]

谭鹏李鑫张小培

基于工业分析的煤质发热量预测

[J].煤炭学报,201540(11):2641-2646

[本文引用: 1]

TAN PLI XZHANG X Pet al

Prediction of coal heating value based on proximate analysis

[J].Journal of China Coal Society,201540(11):2641-2646

[本文引用: 1]

焦发存刘涛武成利

淮南矿区煤炭发热量预测模型研究

[J].煤矿机械,202243(1):27-29

[本文引用: 1]

JIAO F CLIU TWU C Let al

Study on prediction model of coal calorific value in Huainan mine area

[J].Coal Mine Machinery,202243(1):27-29

[本文引用: 1]

李大虎李秋科王文才

基于MIV特征选择与PSO-BP神经网络的煤炭发热量预测

[J].煤炭工程,202052(11):154-160

[本文引用: 1]

LI D HLI Q KWANG W Cet al

Prediction of coal calorific value based on MIV characteristic variable selection and PSO-BP neural network

[J].Coal Engineering,202052(11):154-160

[本文引用: 1]

刘福国刘景龙张绪辉

基于高斯过程的煤元素分析全成分含量预测研究

[J].中国测试,202147(8):38-43

[本文引用: 1]

LIU F GLIU J LZHANG X Het al

Prediction of comprehensive elemental compositions of coal based on Gaussian process

[J].China Measurement & Test,202147(8):38-43

[本文引用: 1]

赵虹沈利杨建国

利用煤的工业分析计算元素分析的DE-SVM模型

[J].煤炭学报,201035(10):1721-1724

[本文引用: 1]

ZHAO HSHEN LYANG J Get al

The model for calculating ultimate analysis of coal by its proximate analysis based on DE-SVM

[J].Journal of China Coal Society,201035(10):1721-1724

[本文引用: 1]

谢良才

基于BP神经网络的数据挖掘技术探究及其在煤热转化数据规律分析中的应用

[D].西安西北大学2021

[本文引用: 1]

XIE L C

Research on data mining technology based on BP neural network and its application in data law analysis of coal thermal conversion

[D].Xi’anNorthwest University2021

[本文引用: 1]

王惠新陈致远王永红

贵州煤发热量与工业分析指标预测模型

[J].洁净煤技术,202026(S1):112-115

[本文引用: 1]

WANG H XCHEN Z YWANG Y Het al

Prediction model of Guizhou coal calorific value and industrial analysis

[J].Clean Coal Technology,202026(S1):112-115

[本文引用: 1]

樊泉桂锅炉原理[M].北京中国电力出版社2004

[本文引用: 1]

FAN Q GBoiler principle[M].BeijingChina Electric Power Press2004

[本文引用: 1]

崔家俊

基于K-means聚类算法的专变用户负荷模式识别方法研究

[D].天津河北工业大学2020

[本文引用: 1]

CUI J J

Research on load pattern recognition method of transformer users based on K-means clustering algorithm

[D].TianjinHebei University of Technology2020

[本文引用: 1]

DUBEY ACHOUBEY A

A systematic review on k-means clustering techniques

[J].International Journal of Scientific Research Engineering and Technology,20176(6):1456-1475

[本文引用: 1]

XU JLANGE K

Power k-means clustering

[C]//International Conference on Machine LearningTaiyuan,ChinaIEEE20196921-6931

[本文引用: 1]

SHANG RARA BZADA Iet al

Analysis of simple K-mean and parallel K-mean clustering for software products and organizational performance using education sector dataset

[J].Scientific Programming,20215156-173doi:10.1155/2021/9988318

[本文引用: 1]

THORNDIKE R L

Who belongs in the family?

[J].Psychometrika,195318(4):267-276doi:10.1007/bf02289263

[本文引用: 1]

MEHMOOD RZHANG GBIE Ret al

Clustering by fast search and find of density peaks via HD

[J].Neurocomputing,2016208210-217doi:10.1016/j.neucom.2016.01.102

[本文引用: 1]

DINH D TFUJINAMI THUYNH V N

Estimating the optimal number of clusters in categorical data clustering by silhouette coefficient

[C]//International Symposium on Knowledge and Systems ScienceSingaporeSpringer20191-17doi:10.1007/978-981-15-1209-4_1

[本文引用: 1]

CALINSKI THARABASZ J

A dendrite method for cluster analysis

[J].Communications in Statistics,19743(1):1-27doi:10.1080/03610927408827101

[本文引用: 1]

HASSAN M A SASSAD UFAROOQ Uet al

Dynamic price-based demand response through linear regression for microgrids with renewable energy resources

[J].Energies,202215(4):1385-1391doi:10.3390/en15041385

[本文引用: 1]

束洪春代月安娜

基于线性回归的柔性直流电网纵联保护方法

[J].电工技术学报,202237(13):3213-3226

[本文引用: 1]

SHU H CDAI YAN Net al

Pilot protection method of flexible DC grid based on linear regression

[J].Transactions of China Electrotechnical Society,202237(13):3213-3226

[本文引用: 1]

SARKODIE S AOZTURK I

Investigating the environmental Kuznets curve hypothesis in Kenya:a multivariate analysis

[J].Renewable and Sustainable Energy Reviews,2020117109481doi:10.1016/j.rser.2019.109481

[本文引用: 1]

贾小勇徐传胜白欣

最小二乘法的创立及其思想方法

[J].西北大学学报(自然科学版),200636(3):507-511

[本文引用: 1]

JIA X YXU C SBAI X

The invention and way of the thinking on least squares

[J].Journal of Northwestern University (Natural Science Edition),200636(3):507-511

[本文引用: 1]

RANSTAM JCOOK J A

LASSO regression

[J].Journal of British Surgery,2018105(10):1348-1348doi:10.1002/bjs.10895

[本文引用: 1]

/