发电技术, 2024, 45(4): 734-743 DOI: 10.12096/j.2096-4528.pgt.23029

智能电网

基于深度强化学习的有源配电网电压分层控制策略

杜婉琳1, 王玲1, 罗威2, 朱远哲1, 吕鸿1, 马潇男3, 周霞3

1.广东电网有限责任公司电能质量重点实验室(广东电网有限责任公司电力科学研究院),广东省 广州市 510080

2.广东电网有限责任公司梅州供电局,广东省 梅州市 514021

3.南京邮电大学自动化学院、人工智能学院,江苏省 南京市 210023

Voltage Hierarchical Control Strategy of Active Distribution Network Based on Deep Reinforcement Learning

DU Wanlin1, WANG Ling1, LUO Wei2, ZHU Yuanzhe1, LÜ Hong1, MA Xiaonan3, ZHOU Xia3

1.Key Laboratory of Power Quality of Guangdong Power Grid Co. , Ltd. (Electric Power Research Institute of Guangdong Power Grid Co. , Ltd. ), Guangzhou 510080, Guangdong Province, China

2.Meizhou Power Supply Bureau of Guangdong Power Grid Co. , Ltd. , Meizhou 514021, Guangdong Province, China

3.College of Automation & College of Artificial Intelligence, Nanjing University of Posts and Telecommunications, Nanjing 210023, Jiangsu Province, China

收稿日期: 2023-08-26   修回日期: 2023-10-18  

基金资助: 国家自然科学基金项目.  52207009
南方电网公司科技项目.  GDKJXM20200331

Received: 2023-08-26   Revised: 2023-10-18  

作者简介 About authors

杜婉琳(1985),女,硕士,高级工程师,电力系统分析技术,2788829207@qq.com

马潇男(1999),男,硕士研究生,主要研究方向为配电网运行技术、电压管理,344717084@qq.com

周霞(1978),女,博士,副教授,从事电力通信、电力系统分析与控制研究,本文通信作者,zhouxia@njupt.edu.cn

摘要

目的 分布式电源发电的随机性和波动性,给有源配电网(active distribution network,ADN)的电压控制带来了严峻的挑战,在此背景下,亟需一种高效的电压控制策略来保证ADN的安全运行。 方法 基于深度强化学习方法,提出了一种双层区域配电网电压控制策略。首先,以调压设备的调节特性和可控元素复杂化的特点为前提,针对ADN辐射网架结构,设计了区域协调控制区域和本地自治控制区域,分别构建每个区域的电压控制模型;然后,通过深度Q网络(deep Q-network,DQN)算法和深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法对该模型进行求解,以实现实时跟踪电压变化的目的,有效解决了ADN运行过程中电压控制问题;最后,通过IEEE 33节点仿真算例对该方法进行了验证。 结果 利用DQN算法和DDPG算法分别求解协调控制区域和本地自治区域的控制变量,实现了ADN系统电压调节的实时决策,解决了ADN潮流双向流动、电压复杂多变的问题。 结论 所提控制策略控制电压偏差效果明显,具有很强的准效性和实用性。

关键词: 有源配电网 (ADN) ; 区域协调控制 ; 本地自治控制 ; 深度强化学习 ; 电压控制策略

Abstract

Objectives The randomness and volatility of distributed power generation poses significant challenges for the voltage control in active distribution network (AND). In this context, there is an urgent need for an efficient voltage control strategy to ensure the safe operation of ADN. Methods Based on the deep reinforcement learning method, a voltage control strategy for double-layer regional distribution networks was proposed. First, based on the adjustment characteristics of voltage regulating equipment and the complexity of controllable elements, a regional coordinated control area and a local autonomous control area were designed for the radiating grid structure of the ADN, and the voltage control model of each area was constructed. Then, the model was solved by deep Q-Network (DQN) algorithm and deep deterministic policy gradient (DDPG) algorithm to achieve the purpose of tracking voltage changes in real time, and effectively solve the voltage control problem during the operation of the ADN. Finally, the method was verified by IEEE 33-bus simulation examples. Results The DQN algorithm and the DDPG algorithm were used to solve the control variables in the coordinated control region and the local autonomous region respectively, realizing real-time decision-making of voltage regulation in the ADN system, and solving the problems of bidirectional flow of ADN power flow and complex and changeable voltage. Conclusions The proposed control strategy has obvious effect on controlling voltage deviation, and has strong accuracy and practicality.

Keywords: active distribution network (ADN) ; regional coordination control ; local autonomous control ; deep reinforcement learning ; voltage control strategy

PDF (2605KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

杜婉琳, 王玲, 罗威, 朱远哲, 吕鸿, 马潇男, 周霞. 基于深度强化学习的有源配电网电压分层控制策略. 发电技术[J], 2024, 45(4): 734-743 DOI:10.12096/j.2096-4528.pgt.23029

DU Wanlin, WANG Ling, LUO Wei, ZHU Yuanzhe, LÜ Hong, MA Xiaonan, ZHOU Xia. Voltage Hierarchical Control Strategy of Active Distribution Network Based on Deep Reinforcement Learning. Power Generation Technology[J], 2024, 45(4): 734-743 DOI:10.12096/j.2096-4528.pgt.23029

0 引言

与传统的被动配电网不同,有源配电网(active distribution network,ADN)可以实现电网的双向流动和信息的互联互通[1],同时,ADN还能提高分布式电源的利用效率和经济性,促进可再生能源开发,符合国家能源转型的发展方向[2-7]。但是,该方法也对电网的电压控制提出了更高的要求[8],因为不恰当的电压水平会导致设备发生过电流,进而引起用户设备的损坏[9-10]。所以,应当将有效控制ADN的电压波动作为后续研究的重点之一[11-12]

ADN电压波动控制问题较为复杂,是拥有众多目标函数、变量和约束条件的高维非线性问题[8]。目前,高维非线性问题的解决思路主要采用启发式搜索算法[13-15]和二阶锥松弛技术[16-17]。文献[18-19]采用启发式搜索算法中的粒子群算法和遗传算法对配电网进行协调控制,以改善配电网运行过程中的电压偏移现象,但是,该方法计算量大,时间成本较高,需要耗费大量的计算资源;文献[20-21]利用二阶锥技术求解可控设备模型来实现电压偏差最小化,但是,此类技术依赖于源荷预测数据和精确的电力系统优化模型,难以实现配电网电压实时调控的要求。

人工智能技术有望解决先前诸多方法的局限性,所以,诸多学者探讨了基于新一代人工智能技术[22]的配电网电压波动调控方法[23-24]。其中,强化学习(reinforcement learning,RL)方法作为人工智能技术的重要分支被广泛应用。文献[25-26]研究了单层尺度RL方法在配电网中的应用问题,该方法可以实时提供灵活的控制决策,针对电压波动问题控制效果良好。但是,文献[27]的研究发现,单层尺度RL容易受到环境变化的影响,出现过拟合现象。针对此问题,文献[28-29]基于长短时间尺度RL开展了研究,在配电网电压控制方面具有灵活性、自适应性。然而,上述方法均未考虑控制变量和AND拓扑结构的特点,所以存在模型不确定性,导致算法的控制效果不稳定。

因此,基于上述电压波动控制技术中所存在的问题,本文提出了基于深度强化学习的有源配电网电压分层控制策略。分层建立有功-无功协调优化模型后,采用深度强化学习算法求解;此外,考虑控制变量和AND拓扑结构的类型,提出利用深度Q网络(deep Q-network,DQN)算法求解区域协调控制的离散型设备变量,利用深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法求解本地自治区域的连续型设备变量,以达到算法和物理模型有机整合。最后,基于IEEE 33节点划分多层次电压控制区域,验证了本文所提出的算法的有效性。

1 电压分层协调控制总框架

1.1 控制指标

将配电网的电压可以分为3个不同的状态区间:正常状态区间、预警状态区间和紧急状态区间,如图1所示。

图1

图1   配电网电压分布状态图

Fig. 1   Voltage distribution state diagram of distribution network


1)正常状态

安全阈值设置为[0.95 pu,1.05 pu]。

2)紧急状态

紧急状态表达式为

[fVSmin,i, fVSmax,i]=[1.07 pu , 1.10 pu]
[fVXmin,i, fVXmax,i]=[0.85 pu , 0.93 pu]

式中:fVSmin,ifVSmax,i分别为第i个区域上紧急状态下限值和上限值;fVXmin,ifVXmax,i分别为第i个区域下紧急状态下限值和上限值。

3)预警状态

预警状态表达式为

[fYVSmin,i,fYVSmax,i]=[1.05 pu , 1.07 pu]
[fYVXmin,i,fYVXmax,i]=[0.93 pu , 0.95 pu]

式中:fYVSmin,ifYVSmax,i分别为第i个区域上预警状态下限值和上限值;fYVXmax,ifYVXmin,i分别为第i个区域下预警状态上限值和下限值。

1.2 控制框架

本文核心是分区对不同类型的控制设备进行控制,图2为配电网分层控制方法的结构图。

图2

图2   配电网分层控制方法结构图

Fig. 2   Structure diagram of hierarchical control method of distribution network


主动配电网电压分层协调控制系统由主动配电网管理系统(active distribution management system,ADMS)、区域协调控制器和本地自治控制器3部分组成。控制器被安装在每个区域中,并且各个负荷节点处的电压传感器与控制器通信网络相邻布置。ADMS通过采集到的节点电压数据进行计算,当判断电压偏差平均标幺值处于紧急状态时,将信号传给区域协调控制器,采用DQN进行训练,得出调压器分接头的最佳档位位置;若区域协调控制器没有收到信号或者通过区域协调控制器控制以后,电压仍然处于非正常状态,则通过本地自治控制器对光伏逆变器、静态无功补偿装置(static var compensator,SVC)和储能进行调节,采用DDPG算法进行训练,获得最优控制策略后将控制信号下达到各个调压设备,实现电压实时自治控制,整体控制流程如图3所示。

图3

图3   整体控制流程图

Fig. 3   Overall control flow chart


2 深度强化学习算法

2.1 DQN算法

DQN算法通过使用神经网络来估计当前状态下每个行动的Q值,输入是一个状态s,输出是一个向量,其中每个元素表示一个可能的动作aQ值:

Q(s,a)  Q(s,a;θ)

式中:θ为神经网络的权重参数;Q(s,a)为真实的Q值;Q(s,a;θ)为神经网络估计的Q值。

目标是最小化Q值的平方误差损失,即:

L(θ)=E{[r(t)+γmaxa'Q(s',a';θ_target)-Q(s,a;θ)]2}

式中:r(t)为当前状态和行动的奖励;γ为折扣因子;s'为下一个状态;a'为下一个状态下所有可能行动的最大Q值对应的行动;θ_target为目标网络的权重参数。

DQN算法使用随机梯度下降来更新神经网络的权重参数θ。可以计算损失函数L(θ)的梯度:

θ Lθ=r_i+γmax_a' Q(s'_i,a'θ_target)-Q(s_i,a_iθ)×θQ(s_i,a_iθ)

式中:s'_i为第i组数据的下一个状态;a_i为第i组数据下一个状态下所有可能行动的最大Q值对应的行动;r_i为第i组数据下状态和行动的奖励。

根据梯度下降算法,更新神经网络的权重参数θ,即

θt+1=θt-αθ L(θ)

式中α为学习率。

DQN算法使用ε-greedy策略来选择行动,该策略以ε的概率选择随机行动。其中,ε为探索率,通常在训练早期设置较高的值,然后逐渐降低到一个较小的值。

2.2 深度确定性策略梯度算法

DDPG算法将经验数据(st,at,rt,st+1)存储到经验池中,通过同时建立Actor目标网络和Critic目标网络来输出目标Q值,并通过最小化目标Q值和Critic网络输出Q值的差值完成模型的优化训练。

使用高斯分布表示输出的概率分布,即

a=μ(s;θμ)+ε(1)

式中:a为输出的动作;μ为策略网络;ε(1)为高斯噪声;θμ为策略网络的权重参数。

使用策略梯度算法来训练策略网络,即最大化长期回报的期望值J(θμ)

θJ(θμ)=Eπ[aQ(s,a|θQ)|s=st,a=μ(st)]θμμ(s|θμ)

式中:Eπ表示在策略π下的期望;Q(s,a|θQ)是值函数网络,即状态-动作值函数;θQ为Critic目标网络的权重参数公式;aQ(s,a|θQ)表示状态-动作值函数相对于动作a的梯度。

值函数网络是一个连续函数,使用均方误差(mean squared error,MSE)作为损失函数,即

L(θQ)=E{[y-Q(s,a|θQ)]2}

式中y=r+γQ[s',μ(s'|θμ)|θQ]表示目标值。

使用梯度下降算法来更新权重参数θQ,即

θQ(t+1)=θQ(t)-αθL[θQ(t)]

式中θL[θQ(t)]是损失函数相对于θQ(t)权重参数的梯度。

3 基于深度强化学习算法的分层调压控制模型

3.1 电压控制数学模型

在调节区域协调控制节点电压时,将控制的目标设置为:最小全域配电网母线节点电压越限值平均值,表达式为

minF(x)=U¯-1.05U¯N, U¯1.05U¯N0.95U¯N-U¯, U¯0.95U¯N

式中:U¯为全域配电网母线节点电压平均值;U¯N为配电网平均电压额定值。

在调节本地自治区域部分节点电压时,将控制目标设置为最小自治区域母线节点电压越限值,表达式为

minF(x)=i=1M(Ui-1.05UN),     Ui1.05UNi=1M(0.95UN-Ui),     Ui0.95UN

式中:Ui为第i个节点的节点电压;UN为该区域配电网额定电压值;M为该区域配电网母线节点数。

约束条件如下。

1)潮流平衡约束

潮流平衡约束为

i=1MPi,L(t)+PLoss(t)=PM(t)+Pi,PV(t)+Pi,ES(t)i=1MQi,L(t)+QLoss(t)=QM(t)+Qi,PV(t)+Qi,SVC(t)

式中:Pi,L(t)Qi,L(t)分别为在t时刻节点i上负荷消耗的有功和无功功率;PLoss(t)QLoss(t)分别为t时刻线路中的有功损耗和无功损耗;PM(t)QM(t)分别为t时刻从主配网上传输的有功和无功功率;Pi,PV(t)Qi,PV(t)分别为t时刻分布式光伏的输出有功和无功功率;Pi,ES(t)t时刻节点i上储能输出有功功率;Qi,SVC(t)t时刻节点i上SVC输出无功功率。

2)光伏逆变器约束

光伏逆变器约束为

PPVminPi,PV(t)PPVmax
Qi,PV2(t)Sinv2-Pi,PV2(t)

式中:PPVmaxPPVmin分别为光伏逆变器输出有功的上限和下限值;Sinv2表示逆变器的容量。

3)储能出力约束

储能出力约束为

Pi,minES(t)Pi,ES(t)Pi,maxES(t)
ΔPi,minES(t)ΔPiES(t)ΔPi,maxES(t)

式中:ΔPiES(t)t时刻节点i上储能输出有功变化量;Pi,minES(t)Pi,maxES(t)分别为t时刻节点i上储能输出有功的最小值和最大值;ΔPi,minES(t)ΔPi,maxES(t)分别为t时刻节点i上储能输出有功最小和最大变化量。

4)SVC出力约束

SVC出力约束为

Qi,minSVC(t)Qi,SVC(t)Qi,maxSVC(t)
ΔQi,minSVC(t)ΔQiSVC(t)ΔQi,maxSVC(t)

式中:ΔQiSVC(t)为节点i上SVC输出无功变化量;Qi,maxSVC(t)Qi,minSVC(t)分别为节点i上SVC输出无功上下限;ΔQi,maxSVC(t)ΔQi,minSVC(t)分别为t时刻节点i上SVC输出无功爬坡上下限。

5)有载调压变压器约束

有载调压变压器分接头调节范围的计算公式如下:

nnext[ntpmin,ntpmax]=[ntpnowxpromin,ntpnowxpromax]
[xpromin,xpromax]=i=1,2,,n[fVSmin,i/fVXmin,iUeq,i,fVSmax,i/fVXmax,iUeq,i]

式中:ntpmin为有载变压器分接头最小调节值;ntpmax为有载变压器分接头最大调节值;xpromin为有载变压器最小可调比例;xpromax为有载变压器最大可调比例;ntpnow为有载变压器分接头当前所处位置;n为区域数量;Ueq,i为等效电压。

3.2 深度强化学习算法设计

将深度强化学习应用于配电网的电压控制中,将电压控制问题转化为马尔科夫决策过程,并通过对智能体在环境中进行探索和学习来获得最优的控制行为。该算法将配电网潮流系统状态映射到控制动作,同时利用奖励函数和控制变量映射来实现控制目标,在满足约束条件的前提下确保配电网系统的安全运行。

3.2.1 区域协调控制的DQN算法

1)状态空间

将母线节点电压作为被控制对象,则状态空间为节点电压的集合SDQN

SDQN={v1,v2,,vi,,vN}

式中:vi表示节点i电压的标幺值;N为全域配电网母线节点数。

2)动作空间

将有载变压器分接头的位置设置为DQN算法的动作空间ADQN,假设每个设备有n个档位,设置相同的调节范围:i×1%pu,-nin;档位调节的总范围±n×1%pu,即

ADQN={-n×1%pu,-(n-1)×1%pu,,
0%pu,, (n-1)×1%pu,n×1%pu}

3)奖励函数

将点电压越限量作为控制目标,奖励函数设计为rDQN,i

rDQN,i=-βΔv¯2

式中:β为权重系数;Δv¯为全局配电网母线节点电压的平均标幺值超过正常状态的数值。

3.2.2 本地自治控制的DDPG算法

1)DDPG算法的状态空间

将各节点电压、有功功率和无功功率波动作为状态变量,构建配电网电压控制的状态空间的:

SDDPG,i={v1,,vi,,vM,dv1,,dvi,,dvM,p1,,              pi,,pM,dp1,,dpi,,dpM,q1,,qi,,
qM,dq1,,dqi,,dqM}

式中:dvi为节点i电压的波动;pi为节点i的有功功率;dpi为节点i有功功率波动;qi为节点i的无功功率;dqi为节点i无功功率波动;1iM

2)DDPG算法的动作空间

将并入的设备动作出力集合{ADDPG.i}可以定义为动作空间:

{ADDPG.i}=[PiPV(t), QiPV(t), PiES(t), QiSVC(t)]

3)DDPG算法的奖励函数

将节点电压越限量和设备出力调节量作为奖励函数RDDPG,i来更新DDPG算法的策略网络和值函数网络,即

RDDPG,i=-ΔviB1ΔviT-ΔPiPVC1ΔPiPVT-ΔQiPVC2ΔQiPVT-ΔPiESD1ΔPiEST-ΔQiSVCE1ΔQiSVCT

式中:Δvi为母线节点i的电压标幺值的越限值;ΔQiPV表示母线节点i的无功变化量;B1表示电压偏差项的惩罚系数;C1C2表示分布式光伏输出有功、无功调节量项的惩罚系数;D1表示储能输出有功调节量项的惩罚系数;E1表示SVC输出无功调节量项的惩罚系数。

4 仿真验证

4.1 仿真分析

采用标准IEEE 33节点配电网系统进行仿真,拓扑图如图4所示。系统中调压器位于节点1,额定容量为100 MV⋅A,调节范围根据具体情况确定,该算例具体包括分布式光伏、储能电池、SVC,设备参数如表1所示。

图4

图4   IEEE 33节点配电网拓扑图

Fig. 4   IEEE 33-node distribution network topology


表1   设备参数

Tab. 1  Equipment parameters

序号布置节点类型额定容量
1L17、L19、L20、L33分布式光伏2.2 MW
2L11、L14、L22、L28储能电池800 kW⋅h
3L18、L25SVC2 MV⋅A

新窗口打开| 下载CSV


通过配电网控制区域划分方法,将配电网按图4中的划分结果进行划分,结果如表2所示。

表2   控制区域划分结果

Tab. 2  Control zone division results

协调控制区域节点编号自治控制区域编号所含节点编号控制节点编号
L1—L33自治控制区域1L1—L5、L19—L2、L3—L25L20、L22、L25
自治控制区域2L6—L18L11、L14、L17、L18
自治控制区域3L26—L33L28、L33

新窗口打开| 下载CSV


4.2 结果分析

IEEE 33节点配电网在某一时刻引入功率扰动,部分节点越过正常状态区域限值,首先根据有载调压器的调节范围对DQN算法进行设计。

使用DQN智能体进行训练,每次训练290个样本,共进行500次训练。初始阶段,智能体奖励值较低,经过230次训练episode后,DQN智能体逐渐收敛于最优策略,其奖励值稳定且震荡幅度减小。最终,DQN智能体学习到了调节调压器分接头对电压控制的最优策略,具有良好的控制性能。DQN智能体训练结果如图5所示。

图5

图5   DQN智能体训练过程

Fig. 5   DQN agent training process


图6为区域协调控制前后节点电压图。由此可见,各母线电压幅值有所下降,但仍然有部分母线节点电压标幺值处于非正常状态安全阈值之间,因此,需要通过DDPG算法对电压越限节点所在区域做进一步的处理。DDPG智能体训练结果如图7所示。

图6

图6   区域协调控制前后节点电压图

Fig. 6   Node voltage diagram before and after regional coordination control


图7

图7   DDPG智能体训练结果

Fig. 7   DDPG agent training results


DDPG智能体训练1 000个episodes,每个episode在训练300个样本后结束,经过70个episode后DDPG智能体的奖励值稳定,表明算法已收敛。图8为未削减光伏有功情况下节点10—17的控制效果。可见,控制区域内的节点电压并未控制到正常状态内,因此需要进一步削减有功功率。图9为通过光伏有功削减后节点10—17节点的电压,可快速有效地将母线节点电压控制在安全阈值内。

图8

图8   无有功削减情况下的电压控制效果

Fig. 8   Voltage control effect without active power reduction


图9

图9   加入有功削减情况下电压控制效果

Fig. 9   Voltage control effect with active power reduction


为了验证本文方法控制的优越性,将本文方法与传统的麻雀搜索(sparrow search algorithm,SSA)算法和粒子群优化(particle swarm optimization,POS)算法进行对比,不同策略下的控制结果如表3所示。SSA在控制调节上响应时间为5.52 s,平均电压偏差0.002 9 pu,POS在控制调节上响应时间为4.84 s,平均电压偏差0.003 1 pu.。而采用强化学习控制方法进行调节时响应时间为0.11 s,平均电压偏差0.002 3 pu.,可以看出,本文控制策略虽然与其他算法在平均电压偏差上相差不大,但是大幅度缩短了算法响应的时间,充分显示了该强化学习算法的高效性和准确性。

表3   不同策略下的控制结果

Tab. 3  Control results under different strategies

策略优化前强化学习算法SSAPOS
响应时间/s00.115.524.84
平均电压偏差/pu0.024 00.002 30.002 90.003 1

新窗口打开| 下载CSV


5 结论

针对有源配电网内不同时间响应的调压设备特性,提出一种基于深度强化学习的有源配电网电压分层控制策略,具体结论如下:

1)针对有源配电网电压特性,将有源配电网电压等级划分为3个不同的区域,有助于有源配电网系统的实时监测和管理,便于后续开展有源配电网电压控制。

2)针对不同控制对象的响应特点,利用DQN算法和DDPG算法分别求解协调控制区域和本地自治区域的控制变量,实现了ADN系统电压调节的实时决策。

3)经IEEE 33节点实验结果表明,所提方法可以有效保证电压稳定在正常状态之内;与SSA算法和POS算法相比,所提方法在响应时间和响应效果方面均有更大的优势。

参考文献

江道灼徐宁江崇熙

蜂巢状有源配电网构想、关键技术与展望

[J].电力系统自动化,201943(17):1-11doi:10.7500/AEPS20180730017

[本文引用: 1]

JIANG D ZXU NJIANG C Xet al

Conception,key technology and prospect of honeycomb-shape active distribution network

[J].Automation of Electric Power Systems,201943(17):1-11doi:10.7500/AEPS20180730017

[本文引用: 1]

刘建伟李学斌刘晓鸥

有源配电网中分布式电源接入与储能配置

[J].发电技术,202243(3):476-484doi:10.12096/j.2096-4528.pgt.21068

[本文引用: 1]

LIU J WLI X BLIU X O

Distributed power access and energy storage configuration in active distribution network

[J].Power Generation Technology,202243(3):476-484doi:10.12096/j.2096-4528.pgt.21068

[本文引用: 1]

于淼闫旻睿万克厅

数据驱动的有源配电网运行态势智能感知方法

[J].电力建设,202445(7):34-53

YU MYAN M RWAN K Tet al

Data-driven intelligent situational awareness of active distribution networks

[J].Electric Power Construction,202445(7):34-53

蔡欢袁旭峰熊炜

柔性互联配电网运行调度研究综述

[J].智慧电力,202250(6):92-99

CAI HYUAN X FXIONG Wet al

Review on operation scheduling of flexible interconnected distribution network

[J].Smart Power,202250(6):92-99

闫群民董新洲穆佳豪

基于改进多目标粒子群算法的有源配电网储能优化配置

[J].电力系统保护与控制,202250(10):11-19

YAN Q MDONG X ZMU J Het al

Optimal configuration of energy storage in an active distribution network based on improved multi-objective particle swarm optimization

[J].Power System Protection and Control,202250(10):11-19

仲泽天李梦月王加澍

一种有源配电网分布式光伏消纳能力评估方法

[J].电网与清洁能源,202339(2):60-68

ZHONG Z TLI M YWANG J Set al

An assessment method for distributed photovoltaic absorption capacity of active distribution networks

[J].Power System and Clean Energy,202339(2):60-68

LOPION PMARKEWITZ PROBINIUS Met al

A review of current challenges and trends in energy systems modeling

[J] . Renewable and Sustainable Energy Reviews,201896156-166doi:10.1016/j.rser.2018.07.045

[本文引用: 1]

彭生江陆军张中丹

光伏接入对电网的影响研究

[J].电力系统保护与控制,202149(5):157-164doi:10.19783/j.cnki.pspc.200505

[本文引用: 2]

PENG S JLU JZHANG Z Det al

Research on the influence of photovoltaic access on a power grid

[J].Power System Protection and Control,202149(5):157-164doi:10.19783/j.cnki.pspc.200505

[本文引用: 2]

段穰达

有源配网后评价指标体系及其综合评价方法

[J].发电技术,202142(1):86-93doi:10.12096/j.2096-4528.pgt.20102

[本文引用: 1]

DUAN R D

A post-evaluation index system of active distribution network project and its comprehensive evaluation method

[J].Power Generation Technology,202142(1):86-93doi:10.12096/j.2096-4528.pgt.20102

[本文引用: 1]

张华赢艾精文汪伟

基于约束型深度强化学习的主动配电网电压控制策略

[J/OL] .电测与仪表,2022, .

[本文引用: 1]

ZHANG H YAI J WWANG W

Active distribution network voltage control strategy based on constrained deep reinforcement learning

[J/OL].Journal of Electrical Measurement and Instrumentation,2022

[本文引用: 1]

WECKX SDRIESEN J

Optimal local reactive power control by PV inverters

[J].IEEE Transactions on Sustainable Energy,20167(4):1624-1633. doi:10.1109/tste.2016.2572162

[本文引用: 1]

符杨廖剑波李振坤

考虑越限风险的主动配电网日前优化调度及运行

[J].中国电机工程学报,201737(21):6328-6338doi:10.13334/j.0258-8013.pcsee.162014

[本文引用: 1]

FU YLIAO J BLI Z Ket al

Day-ahead optimal scheduling and operating of active distribution network considering violation risk

[J].Proceedings of the CSEE,201737(21):6328-6338doi:10.13334/j.0258-8013.pcsee.162014

[本文引用: 1]

李鹏姜磊王加浩

基于深度强化学习的新能源配电网双时间尺度无功电压优化

[J/OL].中国电机工程报:1-15..

[本文引用: 1]

LI PJIANG LWANG J Het al

Optimization of dual-time scale reactive voltage for distribution network with renewable energy based on deep reinforcement learning

[J/OL].Proceedings of the CSEE,1-15..

[本文引用: 1]

蒋平梁乐

基于内点法和遗传算法相结合的交直流系统无功优化

[J].高电压技术,201541(3):724-729doi:10.13336/j.1003-6520.hve.2015.03.004

JIANG PLIANG L

Reactive power optimization of hybrid AC/HVDC power system combining interior point algorithm and genetic algorithm

[J].High Voltage Engineering,201541(3):724-729doi:10.13336/j.1003-6520.hve.2015.03.004

李晓利高金峰

用于配电网多目标无功优化的改进粒子群优化算法

[J].电力自动化设备,201939(1):106-111doi:10.16081/j.issn.1006-6047.2019.01.016

[本文引用: 1]

LI X LGAO J F

Improved particle swarm optimization algorithm for multi-objective reactive power optimization of distribution network

[J].Electric Power Automation Equipment,201939(1):106-111doi:10.16081/j.issn.1006-6047.2019.01.016

[本文引用: 1]

林少华吴杰康莫超

基于二阶锥规划的含分布式电源配电网动态无功分区与优化方法

[J].电网技术,201842(1):238-246doi:10.13335/j.1000-3673.pst.2017.0718

[本文引用: 1]

LIN S HWU J KMO Cet al

Dynamic partition and optimization method for reactive power of distribution networks with distributed generation based on second-order cone programming

[J].Power System Technology,201842(1):238-246doi:10.13335/j.1000-3673.pst.2017.0718

[本文引用: 1]

肖遥别朝红黄格超

基于二阶锥最优潮流的机会约束分布鲁棒优化研究

[J].电网技术,202145(4):1505-1517doi:10.13335/j.1000-3673.pst.2020.1002

[本文引用: 1]

XIAO YBIE Z HHUANG G Cet al

Chance-constrained distributional robust optimization based on second-order cone optimal power flow

[J].Power System Technology,202145(4):1505-1517doi:10.13335/j.1000-3673.pst.2020.1002

[本文引用: 1]

李国庆陈蓉沈杰

大规模光伏接入的配电网动态无功优化研究

[J].太阳能学报,201839(8):2373-2380

[本文引用: 1]

LI G QCHEN RSHEN Jet al

Research of dynamic reactive power optimization of large-scale photovoltaic access distribution network

[J].Acta Energiae Solaris Sinica,201839(8):2373-2380

[本文引用: 1]

刘斌程杰肖荣

面向中低压一体化的配网无功优化方法

[J].电气自动化,201941(6):45-47

[本文引用: 1]

LIU BCHENG JXIAO Ret al

Reactive power optimization method for integrated medium and low voItage distribution networks

[J].Electrical Automation,201941(6):45-47

[本文引用: 1]

褚国伟张友旺葛乐

自储能柔性互联配电网多时间尺度电压优化

[J].电力系统自动化,202145(9):71-79doi:10.7500/AEPS20200223007

[本文引用: 1]

CHU G WZHANG Y WGE Let al

Multi-time-scale voltage optimization of flexible interconnected distribution network with self-energy storage

[J].Automation of Electric Power Systems,202145(9):71-79doi:10.7500/AEPS20200223007

[本文引用: 1]

郭清元吴杰康莫超

基于混合整数二阶锥规划的新能源配电网电压无功协同优化模型

[J].中国电机工程学报,201838(5):1385-1396doi:10.13334/j.0258-8013.pcsee.170247

[本文引用: 1]

GUO Q YWU J KMO Cet al

A model for multi-objective coordination optimization of voltage and reactive power in distribution networks based on mixed integer second-order cone programming

[J].Proceedings of the CSEE,201838(5):1385-1396doi:10.13334/j.0258-8013.pcsee.170247

[本文引用: 1]

于成龙侯俊杰蒲洪波

新一代人工智能在国防科技领域发展探讨

[J].国防科技,202041(4):13-18

[本文引用: 1]

YU C LHOU J JPU H Bet al

Development of the new generation artificial intelligence in national defense science and technology

[J].National Defense Technology,202041(4):13-18

[本文引用: 1]

蒲天骄乔骥韩笑

人工智能技术在电力设备运维检修中的研究及应用

[J].高电压技术,202046(2):369-383doi:10.13336/j.1003-6520.hve.20200131001

[本文引用: 1]

PU T JQIAO JHAN Xet al

Research and application of artificial intelligence in operation and maintenance for power equipment

[J].High Voltage Engineering,202046(2):369-383doi:10.13336/j.1003-6520.hve.20200131001

[本文引用: 1]

YAP K YSARIMUTHU C RLIM J M Y

Artificial intelligence based MPPT techniques for solar power system:a review

[J].Journal of Modern Power Systems and Clean Energy,20208(6):1043-1059doi:10.35833/mpce.2020.000159

[本文引用: 1]

李琦乔颖张宇精

配电网持续无功优化的深度强化学习方法

[J].电网技术,202044(4):1473-1480doi:10.13335/j.1000-3673.pst.2019.2218

[本文引用: 1]

LI QQIAO YZHANG Y J

Continuous reactive power optimization of distribution network using deep reinforcement learning

[J].Power System Technology,202044(4):1473-1480doi:10.13335/j.1000-3673.pst.2019.2218

[本文引用: 1]

WANG Y

Grid voltage control method based on generator reactive power regulation using reinforcement learning

[C]//2020 IEEE/IAS Industrial and Commercial Power System Asia (I&CPS Asia)IEEE20201060-1065doi:10.1109/icpsasia48933.2020.9208556

[本文引用: 1]

毕聪博唐聿劼罗永红

电力系统优化控制中强化学习方法应用及挑战

[J].中国电机工程学报,202444(1):1-21

[本文引用: 1]

BI C BTANG Y JLUO Y Het al

Review on critical problems in reinforcement learning methods applied in power system optimization and control scenarios

[J].Proceedings of the CSEE,202444(1):1-21

[本文引用: 1]

倪爽崔承刚杨宁

基于深度强化学习的配电网多时间尺度在线无功优化

[J].电力系统自动化,202145(10):77-85

[本文引用: 1]

NI SCUI C GYANG Net al

Multi-time-scale online optimization for reactive power of distribution network based on deep reinforcement learning

[J].Automation of Electric Power Systems,202145(10):77-85

[本文引用: 1]

高一航徐晓春李鹏

面向高比例新能源并网的双时间尺度电网电压控制

[J].电网与清洁能源,202137(5):115-122doi:10.3969/j.issn.1674-3814.2021.05.014

[本文引用: 1]

GAO Y HXU X CLI Pet al

Dual-time-scale grid voltage control for high-proportion new energy grid-connected

[J].Power System and Clean Energy,202137(5):115-122doi:10.3969/j.issn.1674-3814.2021.05.014

[本文引用: 1]

/