发电技术, 2022, 43(2): 313-319 DOI: 10.12096/j.2096-4528.pgt.21006

智能电网

基于Logistic快速最小误差熵算法的配电变压器停电预测

许中1, 栾乐1, 莫文雄1, 罗思敏1, 叶宗林2, 陈超2, 赖轩达2, 解明辉2

1.广东电网有限责任公司广州供电局, 广东省 广州市 510000

2.西安交通大学电气工程学院, 陕西省 西安市 710049

Distribution Transformer Outage Prediction Based on Logistic Fast Minimum Error Entropy Algorithm

XU Zhong1, LUAN Le1, MO Wenxiong1, LUO Simin1, YE Zonglin2, CHEN Chao2, LAI Xuanda2, XIE Minghui2

1.Guangzhou Power Supply, Guangdong Power Grid Co. , Ltd. , Guangzhou 510000, Guangdong Province, China

2.School of Electrical Engineering, Xi’an Jiaotong University, Xi’an 710049, Shaanxi Province, China

收稿日期: 2021-06-30  

基金资助: 中国南方电网责任有限公司科技项目.  GZHKJXM20180068

Received: 2021-06-30  

作者简介 About authors

许中(1986),男,硕士,高级工程师,主要研究方向为电能质量,348867958@qq.com

栾乐(1982),女,硕士,高级工程师,主要研究方向为设备状态评价,149529958@qq.com

莫文雄(1971),男,硕士,教授级高级工程师,主要研究方向为电气工程,gzmwx@139.com

罗思敏(1988),男,硕士,高级工程师,主要研究方向为智能配电网,本文通信作者,rushlsm@163.com

叶宗林(1990),男,博士,主要研究方向为数据挖掘、过程控制和工业自动化,yezonglin1990@gmail.com

陈超(1995),男,硕士研究生,主要研究方向为配电网大数据分析与态势感知研究,610825983@qq.com;

赖轩达(1999),男,硕士研究生,主要研究方向为电力大数据,lxd593@stu.xjtu.edu.cn

解明辉(1998),男,硕士研究生,主要研究方向为电力大数据,619425976@qq.com

摘要

为了提高配电变压器停电预测的速度和准确性,提出了一种基于Logistic快速最小误差熵算法的配变停电预测方法。在最小熵回归算法的基础上,提出了快速最小误差熵算法,基本保持了最小熵回归的回归效果,并且显著地减少了算法的运行时间;针对配变停电预测适用Logistic回归的情况,提出了基于Logistic的快速最小误差熵回归算法,选取配电变压器重过载时长、最大有功负载率、平均有功负载率、平均三相不平衡度以及重三相不平衡度作为配变停电预测的特征变量数据,建立了配电变压器停电预测模型,实验预测结果优于Logistic回归。

关键词: Logistic快速最小误差熵 ; 配电变压器 ; 停电预测

Abstract

In order to improve the speed and accuracy of distribution transformer outage prediction, a distribution transformer outage prediction method based on Logistic fast minimum error entropy algorithm was proposed. Aiming at the problem that the basic minimum entropy regression algorithm runs too slowly, a fast minimum error entropy algorithm was proposed, which can keep the same regression effect as the minimum entropy regression, and greatly reduce the running time of the algorithm. In view of the application of Logistic regression in outage prediction, a fast minimum error entropy regression algorithm based on logistic was proposed, and the weight of distribution transformer was selected. The overload duration, maximum active load rate, average active load rate, average three-phase unbalance degree and heavy three-phase unbalance degree were used as the characteristic variable data of distribution transformer outage prediction. A distribution transformer outage prediction model was established, and the effect was found to be better than Logistic regression in the comparative experiment.

Keywords: Logistic fast minimum error entropy ; distribution transformer ; outage prediction

PDF (1635KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

许中, 栾乐, 莫文雄, 罗思敏, 叶宗林, 陈超, 赖轩达, 解明辉. 基于Logistic快速最小误差熵算法的配电变压器停电预测. 发电技术[J], 2022, 43(2): 313-319 DOI:10.12096/j.2096-4528.pgt.21006

XU Zhong, LUAN Le, MO Wenxiong, LUO Simin, YE Zonglin, CHEN Chao, LAI Xuanda, XIE Minghui. Distribution Transformer Outage Prediction Based on Logistic Fast Minimum Error Entropy Algorithm. Power Generation Technology[J], 2022, 43(2): 313-319 DOI:10.12096/j.2096-4528.pgt.21006

0 引言

配电网是指从输电网或地区发电厂接受电能,通过配电设施就地分配或按电压逐级分配给各类用户的电力网[1]。近年来,随着我国经济的快速发展,电力负荷的增长明显加快,对城市配电网的供电能力、电能质量、供电可靠性都有了更高的要求[2-5]。配电网作为与用户直接相连的电力网,不仅规模庞大、设备繁多,且供电环境复杂,据统计,80%以上的停电事故由配电网故障引起[6]。因此,研究一种精确、高效的配电变压器停电预测方法具有重要的实际意义。

目前配电网停电预测方法的研究主要集中在配电网可靠性评估[7-12]和基于大数据技术的配电网停电预测方面。文献[13]分析了配电网故障数据之间的关联性,并基于Logistic分类算法建立故障识别模型进行停电预测。文献[14]针对极端天气下配电网停电问题,利用历史灾损记录和灾害数值模拟数据,构建灾害时间贝叶斯网络模型进行停电预测。文献[15]针对台风灾害,综合考虑气象、电网及地理因素,提出一种基于随机森林算法的用户停电区域预测评估方法。文献[16]针对超高温、暴雨等恶劣天气条件,采用XGBoost算法建立了线路停电数量预测模型。文献[17]提出建立贝叶斯网络预测飓风情况下的配电网停电概率。文献[18]考虑配电网下面的植被情况和雷达检测数据,通过建立随机森林模型来提高停电预测结果的准确性。

本文将基于配变运行数据得到的停电预测特征之外的因素作为误差因素,采用最小误差熵估计[19]。针对基本的最小熵回归算法运行时间较长的问题,提出了快速最小误差熵算法;然后针对停电预测适用Logistic回归的情况,提出了基于Logistic的快速最小误差熵回归算法,建立了配电网变压器特征变量数据的配网停电预测模型,以实际数据为例验证了所提方法的有效性。

1 传统最小误差熵算法

最小误差熵算法通过最小化回归算法中误差所包含的信息量从而使得回归模型所包含的信息量最大化。最小误差熵算法采用二阶Renyi熵[20]来表示模型误差中所包含的信息量:

H(E)=-logEP(pE)=-logpE2(e)de

式中:E为回归误差的随机变量;H(E)E的熵;pE(e)E的概率密度函数;e为设定的概率密度函数自变量取值;EP(·)为对应随机变量的期望。利用Parzen窗方法[21]E的概率密度函数p̂E(e)可以表示为

p̂E(e)=1ni=1nKh(e-ei)

式中:n为随机变量E的采样样本数;K为核函数;ei为样本值;h为带宽。一般情况下,选择高斯核函数作为核函数,即Kh(z)=22πhexp(-z22h2)。则随机变量的信息熵的估计量Ĥ(f)

Ĥ(f)=-log1n2i=1nj=1nKh(ei-ej)

由于对数函数单调递增,实际应用中,最小化Ĥ(f)时可以将其移除而不影响最小化的结果。故变换后的随机变量对应的信息熵的估计量为

Ĥ(f)=-1n2i=1nj=1nKh(ei-ej)

对于线性回归模型,y=wTx+e需要从数据样本中估计出 w。由于ei=yi-wTxi,则对应的变换后的误差信息熵的估计量为关于 w 的函数:

R̂(w)=-1n2i=1nj=1nKh[(yi-wTxi)-(yj-wTxj)]

估计量R̂(w)可以通过用梯度下降法极小化式(5)来求解。由于式(5)中含有二重求和运算,最小误差熵算法的时间复杂度为O(n2),这就使得随着样本数目的增大,最小误差熵算法所需要的时间会快速增加。

2 Logistic快速最小误差熵算法

在对配电网变压器的停电状况进行预测时,由于在训练样本中,配变的预测结果为“停电”与“不停电”2种情况,即预测结果为布尔变量,而一般的回归模型的预测结果是连续变量,因此需要建立起这2种不同变量类型间的联系,将区间(-,+)的结果映射到[0,1]。Sigmod函数非常适合实现这一点,对应的算法即为Logistic回归。

Logistic回归通过Sigmod函数,在线性回归的基础上,将线性模型在区间(-,+)的预测结果映射到[0,1]。由于一个事件的概率值恰好在[0,1],故Sigmod函数的预测结果具有概率上的意义,预测值可以代表一个事件发生的概率,当预测概率小于0.5时,分类结果为负类,即表示不停电;当预测概率大于0.5时,分类结果为正类,表示停电。因此,在配变停电故障的预测过程中,Logistic回归可以建立配电网变压器的各种特征参数与其停电概率之间的关系。

2.1 Logistic回归

常用的二项Logistic回归模型为以下条件概率分布:

P(Y=1|x)=11+exp[-(wTx+b)]=exp(wTx+b)1+exp(wTx+b)
P(Y=0|x)=1-P(Y=1|x)=11+exp(wTx+b)

式中:xRn是模型输入;n为模型输入的维数;Y=1和Y=0是Y的2个可能取值;P(Y=1|x)

P(Y=0|x)分别为Y取得这2个可能取值的概率;wRnbRn是参数, w 为权值向量,b为偏置。为了表达方便,可以将权值向量和输入向量进行扩充,即w=(w1,w2,,wn,b)Tx=(x1,x2,,xn,1)T

2.2 快速最小误差熵

一个随机变量X的微分熵[22]式(8)所示:

H(x)=-p(x)logp(x)dx

假设一个随机变量x接近与其均值和方差相同的高斯分布,将其概率密度函数GramCharlier展开式[23]代入式(8),化简后可得:

H(x)12log2πeσ-k32(x)12σ5-k42(x)48σ7

式中:σ为随机变量x的方差;k3xk4x分别为x的三阶和四阶累积量,即偏度和峭度。

对于线性回归模型,其误差的熵为

H(ew)12log2πe+12logσ(ew)-k32(ew)12σ5(ew)-k42(ew)48σ7(ew)

2.3 Logistic快速最小误差熵回归算法

参考线性回归与Logistic回归的转换,快速最小误差熵回归的配电网变压器停电概率预测结果也为连续变量,因此也需要叠加一个Sigmod函数,将配电变压器的各种特征参数映射到[0, 1],称为Logistic快速最小误差熵算法。则对于模型:

y=11+exp(-wTx)

Logistic快速最小误差熵算法的误差可以表示为

ei=yi-11+exp(-wTxi)

在得到式(10)的过程中,线性回归的误差被作为一个随机变量进行推导,并没有使用关于线性回归的信息。因此,式(10)的表达式与回归算法的形式没有关系。故Logistic快速最小误差熵算法误差的熵与线性回归误差的熵的表达式(10)相同。

为了求出H(ew)的最小值,H(ew)关于 w 的导数为

H(ew)w=12σ(ew)ln2σ(ew)w-16σ6(ew)×[σ(ew)k3(ew)k3(ew)w-2k32(ew)σ(ew)w]-18σ7(ew)×[16σ(ew)k4(ew)k4(ew)w-k42(ew)σ(ew)w]

其中:

σ(ew)=Ep(Ew2)-[Ep(Ew)]2
σ(ew)w=12EP(Ew2)-[EP(Ew)]2×[EP[Ew2]w-[EP(Ew)]2w]
k3(ew)=1ni=1n[yi3-3yi2Sig(w)-3yiSig2(w)+Sig3(w)]
k3(ew)w=1ni=1n{[-3yi2Sig2(w)-6yiSig3(w)+3Sig4(w)]xiexp(-wTxi)]}
k4(ew)=1ni=1nyi4-4yi3Sig(w)+6yi2Sig2(w)-4yiSig3(w)+Sig4(w)-3
k4(ew)w=1ni=1n{[-4yi3Sig2(w)+12yi2Sig3(w)-12yiSig4(w)+4Sig5(w)]×xiexp(-wTxi)}

为了获得能够最小化H(ew)w,使用如下所示的梯度下降迭代格式:

ŵk+1=ŵk-αH(ewk)ŵk

式中:ŵkŵk+1分别表示第k次和k+1次迭代得到的线性回归系数向量;α表示迭代步长,由Arimijo准则确定。

由于这些式子的计算复杂度均为O(n),故快速最小误差熵算法的计算复杂度也为O(n)。因此理论上可以认为快速最小误差熵算法的运算速度快于传统的最小误差熵算法。

3 案例分析

3.1 算法时间复杂度验证

本文通过实验比较快速最小误差熵算法与最小误差熵算法的程序运行时间消耗。设线性回归模型y=w*Tx+e,其中模型参数取x~N(0,I10)w*=[1-11-11-11-11-1]T。其中,噪声信号采用高斯噪声e~N(0,1),快速最小误差熵算法的迭代歩长取α=0.005π,最小误差熵算法高斯核的核函数参数取h=10[24]。实验中采用从100到500的样本数量。算法时间复杂度验证时,取90%的样本作为训练集,10%的样本作为验证集。实验结果如表1所示。

表1   2种算法对于高斯误差的运行时间

Tab. 1  Running time of two algorithms for Gaussian error

样本数量平均运行时间/s最快运行时间/s
最小误差熵快速最小 误差熵最小误差熵快速最小 误差熵
100103.890.040 177.770.015 6
200384.310.058 0310.050.031 2
300801.520.076 9654.210.046 8
4001 430.610.100 01 254.120.046 8
5002 306.240.110 42 072.500.062 4

新窗口打开| 下载CSV


表1中可以看到,在算法平均运行时间和最快运行时间2方面,快速最小误差熵算法均比最小误差熵算法耗时少。

3.2 配电网停电预测算法验证

考虑配网中与停电相关的因素以及实际可获取运行数据,本文选取重过载时长、最大有功负载率、平均有功负载率、重三相不平衡时长、最大三相不平衡度以及平均三相不平衡度作为停电特征向量,利用Embedded特征选择方法进行配变最优停电特征的选择,选用Logistics回归作为基分类器,惩罚项选用L1范数,惩罚项权重取0.45,得到配电变压器最优停电特征子集。

选取某地区供电公司实际1 265条数据作为样本数据,对本文提出的快速Logistic最小误差熵模型进行验证。将数据随机分为训练集和验证集2个部分,其中训练集占80%,验证集占20%。表2中给出特征变量的样例。

表2   训练集中的特征变量数据样例

Tab. 2  Sample of feature variable data in training set

序号标准化后的重过载时长最大有功负载率/%平均有功负载率/%平均三相不平衡度/%标准化后的重三相不平衡度模型输出结果
1074.9878.0652.6001
20.010 5387.1446.8920.1717.570 0001
30.125 70131.5832.4538.160.012 3000
40.025 9697.1029.7423.150.001 3660
50.083 33123.8635.8035.150.002 7320

新窗口打开| 下载CSV


在训练集上运行Logistic快速最小熵算法,得到预测模型的参数ŵ

ŵ=-0.0610.007 4-0.260.610.0320.052T

然后利用测试集对配电变压器的停电概率进行预测,测试集的部分输出结果如表3所示。

表3   测试集中的部分预测结果

Tab. 3  Partial prediction results in test set

序号标准化后的重过载时长最大有功 负载率/%平均有功 负载率/%平均三相 不平衡度/%标准化后的重三相不平衡度实际停电情况模型预测输出输出停电概率
10.095 62115.9231.3734.440000.000 0
20.019 1397.1425.3826.400000.000 0
30.062 84125.5435.1932.720.120 2000.000 0
40.124 50136.8031.8431.840.019 91100.000 0
50.278 7095.22100.9034.270111.000 0

新窗口打开| 下载CSV


使用错误率和F测量2种评价标准对模型的预测结果进行评价。Logistic快速最小熵算法的停电预测结果见表4,可以看出,算法预测的准确率在88%左右,表明配电变压器的停电预测模型较为稳定,可以对是否停电进行区分,能够辅助运维人员预测设备的停电情况,并根据设备停电情况对有停电隐患的设备进行有针对性的关注和管理,减少停电的发生。

表4   Logistic 快速最小熵算法预测结果评价

Tab. 4  Evaluation of prediction results of Logistic fast minimum entropy algorithm

算法错误率F测量
Logistic快速最小熵算法0.118 50.877 2

新窗口打开| 下载CSV


3.3 配电网停电预测方法的对比分析

本文对Logistic快速最小误差熵算法以及Logistic回归算法的预测效果进行对比分析,并采用与Logistic最小误差熵预测模型相同的数据集。

对2种算法分别进行30次预测,图1是2种算法预测结果的F测量评价。从图1中可以看出,2种算法的F测量值都在0.80以上,但Logistic快速最小误差熵的预测效果要明显好于Logistic回归的效果。

图1

图1   2种算法停电预测结果的F测量

Fig. 1   F-measurement of outage prediction results based on two algorithms


4 结论

在最小熵回归算法的基础上,提出了快速最小误差熵算法,基本保持了最小熵回归的回归效果,并且显著地减少了算法的运行时间;针对配变停电预测适用Logistic回归的情况,提出了基于Logistic的快速最小误差熵回归算法,根据供电公司实际数据进行算法验证,预测效果要明显好于Logistic回归的效果。

参考文献

尤田柱鄢志平配电网安全防护技术[M].北京中国电力出版社2015125-128

[本文引用: 1]

YOU T ZYAN Z PDistribution network security protection technology[M].BeijingChina Electric Power Press2015125-128

[本文引用: 1]

刘建伟李学斌刘晓鸥

有源配电网中分布式电源接入与储能配置

[J/OL].发电技术:1-9[2022-02-14]..

[本文引用: 1]

LIU J WLI X BLIU X O

Distributed generation access and energy storage configuration in active distribution network

[J/OL].Power Generaton Technology1-9[2022-02-14]..

[本文引用: 1]

张志华刘健程林

基于串联电抗器的城市配电线路全线速断保护

[J].智慧电力,202048(1):111-117doi:10.1109/spies48661.2020.9243102

ZHANG Z HLIU JCHENG Let al

The whole line quick-trip protection of city distribution line based on series reactor allocation

[J].Smart Power,202048(1):111-117doi:10.1109/spies48661.2020.9243102

宋云亭张东霞吴俊玲

国内外城市配电网供电可靠性对比分析

[J].电网技术,200832(23):13-18

SONG Y TZHANG D XWU J Let al

Analysis of big data technology in power distribution system and typical applications

[J].Power System Technology,200832(23):13-18

张坤党东升马艳霞

主动式配电网电源分区布点规划关键技术研究

[J].电网与清洁能源,202036(3):42-48doi:10.3969/j.issn.1674-3814.2020.03.007

[本文引用: 1]

ZHANG KDANG D SMA Y Xet al

Research on key technologies of power supply distribution zones planning for active distribution network

[J].Power System and Clean Energy,202036(3):42-48doi:10.3969/j.issn.1674-3814.2020.03.007

[本文引用: 1]

肖勇陆文升李云涛

城市配电网发展形态指标体系及其评估方法研究

[J].电力系统保护与控制,202149(1):62-71

[本文引用: 1]

XIAO YLU W SLI Y Tet al

Research on index system and its evaluation methods of urban distribution network development form

[J].Power System Protection and Control,202149(1):62-71

[本文引用: 1]

胡丽娟刁赢龙刘科研

基于大数据技术的配电网运行可靠性分析

[J].电网技术,201741(1):265-271doi:10.1109/cyberc.2018.00042

[本文引用: 1]

HU L JDIAO Y LLIU K Yet al

Operational reliability analysis of distribution network based on big data technology

[J].Power System Technology,201741(1):265-271doi:10.1109/cyberc.2018.00042

[本文引用: 1]

费思源

大数据技术在配电网中的应用综述

[J].中国电机工程学报,201838(1):85-96

FEI S Y

Overview of application of big data technology in power distribution system

[J].Proceedings of the CSEE,201838(1):85-96

冷华童莹李欣然

配电网运行状态综合评估方法研究

[J].电力系统保护与控制,201745(1):53-59

LENG HTONG YLI X Ret al

Comprehensive evaluation method research of the operation state in distributed network

[J].Power System Protection and Control,201745(1):53-59

段穰达

有源配网后评价指标体系及其综合评价方法

[J].发电技术,202142(1):86-93doi:10.12096/j.2096-4528.pgt.20102

DUAN R D

A post-evaluation index system of active distribution network project and its comprehensive evaluation method

[J].Power Generation Technology,202142(1):86-93doi:10.12096/j.2096-4528.pgt.20102

李延真郭英雷彭博

基于多时间尺度状态估计的配电网实时态势预测

[J].电力工程技术,202039(2):127-134doi:10.12158/j.2096-3203.2020.02.018

LI Y ZGUO Y LPENG Bet al

Real-time situation prediction of distribution network based on multi-time scale state estimation

[J].Electric Power Engineering Technology,202039(2):127-134doi:10.12158/j.2096-3203.2020.02.018

邢晓敏徐海瑞廖孟柯

基于云模型和D-S证据理论的配电终端健康状态综合评估方法

[J].电力系统保护与控制,202149(13):72-81

[本文引用: 1]

XING X MXU H RLIAO M Ket al

Comprehensive evaluation method of distribution terminal units health status based on cloud model and D-S evidence theory

[J].Power System Protection and Control,202149(13):72-81

[本文引用: 1]

蒋碧莺荣建张军

Logistic分类算法下的配电网故障识别技术研究

[J].电工技术,2018(24):70-71doi:10.3969/j.issn.1002-1388.2018.24.032

[本文引用: 1]

JIANG B YRONG JZHANG J

Research on fault identification technology of distribution network based on logistic classification algorithm

[J].Electric Engineering,2018(24):70-71doi:10.3969/j.issn.1002-1388.2018.24.032

[本文引用: 1]

陈颖刘冰倩朱淑娟

极端气象条件下配电网大范围停电贝叶斯网络建模和停电概率预测方法

[J].供用电,201936(7):30-34

[本文引用: 1]

CHEN YLIU B QZHU S Jet al

Bayesian network modeling and power outage probability prediction method for largescale power outages in distribution networks under extreme weather conditions

[J].Distribution & Utilization,201936(7):30-34

[本文引用: 1]

侯慧耿浩肖祥

台风灾害下用户停电区域预测及评估

[J].电网技术,201943(6):1948-1954

[本文引用: 1]

HOU HGENG HXIAO Xet al.

Research on prediction and evaluation of user power outage area under typhoon disaster

[J].Power System Technology,201943(6):1948-1954

[本文引用: 1]

严道波杨勇邱丹

基于天气因素和XGBoost算法的配电线路故障停电预测

[J].电力与能源,201940(2):168-171

[本文引用: 1]

YAN D BYANG YQIU Det al

Failure prediction of distribution line based on weather factors and XGBoost algorithm

[J].Power and Energy,201940(2):168-171

[本文引用: 1]

MENSAH A FDUENAS-OSORIO L

Outage predictions of electric power systems under Hurricane winds by Bayesian networks

[C]//International Conference on Probabilistic Methods Applied to Power SystemsDurham,UKIEEE20141-6doi:10.1109/pmaps.2014.6960677

[本文引用: 1]

WANIK D WPARENT J RANAGNOSTOU E Net al

Using vegetation management and LiDAR-derived tree height data to improve outage predictions for electric utilities

[J].Electric Power Systems Research,2017146236-245doi:10.1016/j.epsr.2017.01.039

[本文引用: 1]

PRINCIPE JOSÉ CInformation theoretic learning:renyi's entropy and kernel perspectives[M].BerlinSpringer Publishing Company2010doi:10.1007/978-1-4419-1570-2

[本文引用: 1]

RENYI A

On measures of entropy and information

[C]//Proceedings of the 4th Berkeley Symposium on Mathematics,Statistics and ProbabilityBerkeley,USAUniversity of California 11960158-174

[本文引用: 1]

WEIDEMANN HSTEAR E

Entropy analysis of estimating systems

[J].IEEE Transactions on Information Theory.197016(3):264-270doi:10.1109/tit.1970.1054444

[本文引用: 1]

Thomas M CThomas J A信息论基础[M].阮吉寿,张华,译.北京机械工业出版社2005

[本文引用: 1]

THOMAS M CTHOMAS J AElements of information theory[M].BeijingChina Machine Press2005

[本文引用: 1]

WALLACE D L

Asymptotic approximations to distributions

[J].Annals of Mathematical Statistics.195829(3):635-654doi:10.1214/aoms/1177706528

[本文引用: 1]

HU TWU QZHOU D X

Convergence of gradient descent for minimum error entropy principle in linear regression

[J].IEEE Transactions on Signal Processing,201664(12):6571-6579doi:10.1109/tsp.2016.2612169

[本文引用: 1]

/