一种二模态天气分型方法及其在光伏功率概率预测的应用
1.
2.
3.
4.
A Two-Modal Weather Classification Method and Its Application in Photovoltaic Power Probability Prediction
1.
2.
3.
4.
收稿日期: 2023-02-20
基金资助: |
|
Received: 2023-02-20
作者简介 About authors






天气分型是光伏功率预测中不可或缺的预处理步骤,为精细刻画光伏出力的不确定性,提出一种新的基于光伏功率聚类的二模态天气分类方法。该方法结合气象信息和功率信息进行天气分型,为天气分型在光伏功率预测的应用提供了一条有效的新路径。此外,该方法使用数据融合技术,依据融合数值天气预报(numeric weather prediction,NWP)气象和实际气象二者间的相关信息进行天气分型,以减少模型对NWP准确度的依赖并提高模型的鲁棒性。以吉林某光伏电站数据为例,验证了该天气分型方法的合理性,同时,将天气分型方法与功率概率预测相结合,其测算结果表明,使用所提方法进行天气分型概率预测的区间覆盖率更接近预设的置信水平,且平均带宽更窄。
关键词:
Weather classification is an indispensable preprocessing step in photovoltaic (PV) power prediction. A new two-modal weather classification methods based on PV power clustering was proposed to finely depict the uncertainty of PV power output. Both PV power data and meteorological data were considered for weather classification, providing a novel and effective path for PV power prediction. In addition, data fusion technology was used to extract relevant information from both numeric weather prediction (NWP) data and measured meteorological data to help for weather classification. This approach reduces the model’s reliance on the accuracy of forecasted meteorological indicators and improve the robustness of the model. Experiments based on data from a PV power station in Jilin demonstrated the rationality of the proposed weather classification method. Combining the PV power probability prediction with the proposed weather classifier resulted in prediction interval coverage probabilities closer to the preassigned confidence level and narrower mean prediction interval width.
Keywords:
本文引用格式
付小标, 侯嘉琪, 李宝聚, 温亚坤, 赖晓文, 郭雷, 王志伟, 王尧, 张海锋, 李德鑫.
FU Xiaobiao, HOU Jiaqi, LI Baoju, WEN Yakun, LAI Xiaowen, GUO Lei, WANG Zhiwei, WANG Yao, ZHANG Haifeng, LI Dexin.
0 引言
根据调研,发现基于天气分型的光伏功率预测研究存在以下不足:
1)大多数研究在建立天气分类的功率预测模型时,将天气分型视为功率预测之前的一个小步骤,而没有考虑划分为一类天气类型的功率模式是否存在共性、划分天气类型是否真正有利于功率预测建模。
2)天气分类模型多使用NWP数据,这会使模型较大程度依赖预报数据的准确度。
3)学者们通常考虑天气分型在光伏功率的点预测的应用效果,而日前电网调度、现货出清的随机优化算法需要光伏功率的概率预测信息以提升电力系统的稳定性和经济性。
针对上述三点,本文提出基于光伏功率聚类的二模态天气分类与日前功率概率预测组合模型。首先,根据电站历史的实际功率、NWP气象和实际气象,建立基于功率模式聚类的二模态天气分类模型;其次,基于天气分类模型,在不同天气类型下使用历史预测功率和实际功率构建条件概率模型;最后,以吉林某光伏电站为算例阐述了该天气分型方法的合理性,并结合功率概率预测验证了所提方法的有效性。
1 基于实际功率聚类的二模态天气分类模型
1.1 整体架构
天气分类旨在精细化构建预测模型。相对于单个功率预测模型,本文通过构建不同天气类型下的多个功率预测模型,期望能更精细地刻画模型、提升整体预测准确度。
首先对光伏的日实际功率曲线进行聚类,得到日的聚类标签。该聚类标签可以反映不同功率模式,因此将其视作广义的天气类型标签,这样做的合理性在于:1)考虑到天气分型的目的是精准功率预测,期望划定的不同天气类型反映的是不同的功率模式,从而有利于针对性地构建不同天气类型下的功率预测模型;2)光伏功率受气象状态影响大,事实上,除受地理位置等因素影响外,功率模式也受气象因子影响作用,而且不同功率模式确实体现了不同的气象状态条件。
然后,本文融合利用NWP气象、实际气象两方面信息(即二模态),以及前述的天气类型标签构建了二模态天气分类模型。之所以采用二模态,是考虑到以下因素:1)若单使用NWP气象进行天气类型划分,分类结果很容易受到NWP精度的影响;2)若单使用实际气象训练天气分类模型,在实时预测时会有特征迁移问题。因此,基于实际气象训练的模型要在NWP气象上实现天气划分。
图1展示了二模态天气分类模型的架构,该架构包括模型训练和模型预测。模型训练时,实际气象
图1
图1
基于实际功率聚类的二模态天气分类模型
Fig. 1
Weather classification model based on the photovoltaic bimodal power clustering
1.2 数据及处理
本文采用吉林某光伏电站的NWP气象、实际气象、实际功率数据,单条样本为1 d,对数据预处理(包括异常处理、3个数据源日期配对等)后得到2019年5月—2022年3月共634条有效样本。实测气象使用总辐照度、直接辐照度、散射辐照度、风速、温度、气压共6个指标,NWP气象使用短波辐射、长波辐射、风速、温度、云量、降水、气压共7个指标,时间分辨率选取1 h(即1 d内的24个样本点),基于实测气象和NWP气象分别构建得到634
1.3 功率的时间序列K均值聚类
时间序列聚类是指基于相似性度量将时间序列聚合成不重叠的类,或划分为抽象的层次结构,使得类中的时间序列具有更大相似性,而类间的时间序列有更小的相似性,主要是用来挖掘和识别时间序列中感兴趣的模式[21]。本文使用应用广泛的时间序列K均值聚类对光伏日功率曲线进行聚类。
对于光伏的日功率序列,由于光周期特性,本文倾向于将有效出力时间跨度、同一时刻点出力值大小相似的曲线视为同一种模式,因此使用欧氏距离作为时间序列K均值聚类的相似性度量。光伏功率的时间序列K均值聚类的步骤如下:
1)数据归一化。对光伏出力矩阵
式中:
2)初始质心。从
3)计算各条序列到质心的距离。矩阵
4)类划分。将各序列按其与最近质心的距离进行划分,形成
5)更新质心。在每个聚类内计算各序列的平均值,得到的均值序列作为新的质心。
重复迭代3)—5)步,直到满足迭代次数或相邻2个质心的误差小于指定值,最终得到训练集上各样本(各日期)的类别标签
1.4 二模态天气分类模型
本文使用二模态学习构建天气分类预测模型,该模型以NWP气象、实际气象为输入,天气类型为输出。值得注意的是,这里将预测、实测气象视为描述气象的2个模态,这样做有其合理性:
1)从理论上来说,针对光伏预测中的天气分类问题,一种普遍做法是:建立NWP为输入、天气类型为输出的分类或聚类模型[14,18,24]。但该方法很大程度上依赖预测气象的准确度,而NWP通常偏差较大,这会导致模型学到虚假的对应关系,降低模型的鲁棒性。另一种普遍做法是:首先使用实测气象训练天气分类模型,然后构建各天气类型下的功率预测模型,最后将预测日对应的NWP气象指标输入到训练好的天气分类模型,得到预测日的天气类型,进而进行天气功率预测[12,20,25]。但该思路存在模型迁移问题:其一,训练的天气分类模型对天气的界定和公共气象服务对天气的界定机制不一致;其二,实测气象指标和NWP气象指标存在分布差异。上述2个模型迁移问题均会导致天气分类预测模型的实际预测性能降低。因此,为克服天气分类中存在的模型迁移问题,减小天气分类模型对NWP精准度的依赖性,提高功率预测的准确度和鲁棒性,本研究提出二模态天气分类模型。
2)在实际应用中,多模态学习在语音合成、动作识别、医学图像融合、视频索引等任务的多个标准数据集上实现了最新的技术水平[26]。特别是在电力领域,朱乔木[27]的研究和实验表明,相较于只考虑风速的风电功率预测,整合多种测量气象数据并挖掘其中有利于功率预测的信息,可以提高风电功率的预测精度;文献[28-29]的实验表明,相较于使用未处理的NWP数据、仅修正NWP系统误差后的数据以及传统的单点NWP修正数据,使用基于实测总辐照度修正的NWP总辐照度进行光伏功率预测的误差更小。本文提出二模态天气分类模型,其基本原理为,二模态的气象被投影到同一语义共享子空间。该子空间具有如下两方面特征:其一,子空间内的NWP气象与实测气象之间有更多的相关性;其二,子空间内NWP气象、实测气象有更高的天气分类准确度。其优化方法为:最大化NWP气象和实测气象的相关度量,最小化NWP气象和实测气象的分类精度,并将其作为损失函数训练天气分类模型。上述最大化2种气象相关度量可以视为模型利用实测气象对NWP气象进行修正,而最大化分类准确度则可以视为模型利用神经网络提取与天气类型有关的气象特征。
使用PyTorch框架搭建并训练二模态天气分类模型,模型的全连接神经网络含3层隐藏层,隐藏层节点数参考经验公式设置为128,在线性层之后使用了BatchNorm层和ReLU激活函数,优化器为Adam,学习率设为0.001。具体步骤如下:
1)数据(训练集)准备。准备实测气象矩阵
2)损失函数设计。损失函数作用在子空间上,即图1的
3)模型构建。搭建二模态神经网络天气分类模型,如图1所示。
4)模型训练。设置最大训练次数,进行模型训练,最后保存最优模型
5)实施预测。用最优模型划分新样本(新的NWP气象)的天气类型。
1.5 聚类效果分析
本文采用文献[14]中的天气分型方法,即使用NWP气象中的云量、降水指标对天气类型进行划分,图2为按照该方法划分的5种天气类型下的光伏功率。由图2可知:1)5种天气类型下均有不少的光伏功率峰值接近30 MW,包括在阴天和全雨天气类型下,这表明使用该方法划分的天气分型存在较大噪声;2)无论是从类均值曲线的峰值还是从样本曲线峰值的跨度上看,晴天、多云、小雨3个分类光伏功率模式区分不明显,同样地也难以区分阴天和全雨,这表明使用该分类方法模糊了类的界定,并未达到预定的划分5种类型天气的效果。总的来说,对于本文所采用的光伏电站,光伏功率模式并未在所划分的天气类型下显现特定的模式。其原因可能是:该NWP气象源的数据精度不理想,或这种天气类型划分方式并不是对所有电站有效。这也侧面说明本文有针对性地重新考虑天气分型方法在功率预测中的运用是有必要的。
图2
图2
不同天气分类下的光伏功率
Fig. 2
Photovoltaic power under different weather classifications
光伏实际功率的时间序列K均值聚类结果及各类天气对应的辐照度、温度如图3所示。图3(a)按照时间序列K均值聚类将实际功率划分为3种模式,可以发现,第0种天气类型日最大功率水平相对较低,可视为阴雨天的光伏出力模式;第1种天气类型日最大功率水平相对较高,功率时间跨度相对窄,可视为昼短时的多云或晴天的光伏出力模式;第2种天气类型日最大功率水平相对较高,功率时间跨度相对宽,可视为昼长时的多云或晴天的光伏出力模式。由图3(b)可以发现,每种天气类型的总辐照度指标的模式特点与其光伏出力模式特点对应。由图3(c)可以发现:第1种天气类型温度水平较低,与昼短时的温度对应;第2种天气类型温度水平较高,与昼长时的温度对应;而第0种天气类型温度的样本曲线跨度较大。
图3
图3
光伏实际功率聚类结果及各类天气对应的辐照度、温度情况
Fig. 3
Clustering results of photovoltaic power and corresponding irradiance and temperature
综上所述,实际功率的时间序列K均值聚类可以较好地区别各种光伏出力模式,且聚类结果也反映了不同的气象模式,这也表明了基于实际功率聚类作为天气类型划分的可行性。
1.6 天气分型结果分析
图4
图4
光伏天气分类模型训练过程
Fig. 4
Training process of photovoltaic bimodal weather classification model
综上所述,基于实际功率聚类的二模态天气分类模型能充分挖掘实际气象和NWP气象的相关性,且能较好地进行天气分型。
2 结合核密度估计和Copula理论的功率概率预测模型
2.1 日前预测框架
对功率的概率刻画主要包含功率或预测误差的分位数、置信区间、典型场景、概率分布等,但因概率分布与随机变量相互唯一确定,且概率分布可以导出区间预测、场景等其他信息,在应用上更具优势。此外,就功率的概率建模而言,相较于直接统计或拟合功率、功率预测误差的分布,拟合功率的条件概率分布在理论上更精确[10,33]。因此,本节以核密度估计[34]和Copula理论[35]为工具,建立实际功率关于预测功率的条件概率模型。此模型的输入为预测功率、实际功率,输出为实际功率关于预测功率的条件概率分布。光伏功率的条件概率建模及日前预测的具体步骤如下:首先利用本文所提的二模态天气分类模型对待预测日的天气类型进行预测;然后筛选对应天气类型的历史预测功率、实测功率数据进行条件概率建模;最后根据待预测日的预测功率,计算出完整调度时刻实际功率的条件概率密度。以待预测日为第0种天气类型为例,构建光伏功率的条件概率模型,其日前预测框架如图5所示。
图5
图5
光伏功率的条件概率建模及日前预测框架
Fig. 5
Framework of photovoltaic power conditional probability modeling and dayahead forecasting
2.2 数据说明
获取吉林某光伏电站的实际功率、预测功率数据,单条样本为1个时刻点,时间分辨率均为15 min。训练集为2019年5月—2021年2月的数据,共33 087条有效样本,其中第0、1、2种天气类型的样本数分别为7 872、15 840、7 104条。测试集为2021年3月—2022年3月的数据,在测试集上讨论概率预测模型的建模效果。
2.3 Copula条件概率模型
设
式中
根据Sklar定理和条件概率公式,功率的条件概率密度
式中:
基于上述讨论,功率的条件概率分布建模包括以下步骤:
1)在训练集上,使用核密度方法得到密度函数
2)基于训练集,对Copula密度函数
3)给定光伏电站某日间隔15 min(共计96个时刻点)的预测功率
2.4 评价指标
式中:
2.5 结果分析
图6为3种天气类型的实际功率和预测功率散点图,各天气类型下实际功率和预测功率二者的依赖结构有差异。第0种天气类型对应阴雨天,此种天气状况下光伏的预测出力和实际出力的散点较为分散,特别是光伏处于中、高出力状态时,二者的相关关系较弱;第1、2种天气类型分别对应昼短类晴天和昼长类晴天,可知类晴天模式下,光伏的预测出力和实际出力间的相关程度较高,呈现线性关系,但仍可以发现,相对于光伏处于低、高出力,在中等出力状态下,实际功率和预测功率二者的散点更分散,这也表明类晴天时,光伏在低、高出力处的不确定性较弱,而在中等出力时不确定性较强。
图6
图6
光伏实际功率和预测功率散点图
Fig. 6
Scatter plot of actual power and predicted power of photovoltaic
图7
表1为不同天气类型下各Copula函数拟合的对数似然估计值(越大越优),在不同天气类型下选择其拟合最优的Copula作为估计值。
表1 Copula函数的对数似然值
Tab. 1
天气类型 | Gaussian Copula | Student Copula | Clayton Copula | Frank Copula | Gumbel Copula |
---|---|---|---|---|---|
第0种 | 3 476.3 | 3 620.8 | 2 560.6 | 3 353.6 | |
第1种 | 11 242.2 | 6 910.7 | 10 402.3 | 11 187.6 | |
第2种 | 5 818.8 | 5 858.9 | 3 410.3 | 6 079.1 |
图8给出了预测功率值差异较小时(5~8 MW)不同天气类型下光伏出力的条件概率分布,可以看出,虽然给定的预测功率值差异不大,但在不同的天气类型下光伏出力的条件概率分布呈现各自特点:1)对于第0种天气类型(阴雨天),条件概率峰值所对应的出力值相对于预测功率是有偏差的,预测功率为8.1 MW,但实际功率的概率密度值在1~5 MW范围内集中,这表明阴雨天实际出力往往低于其预测出力;2)对于第1种天气类型(昼短类晴天),当预测功率为5.86 MW时,其实际功率的概率密度值在2 MW左右存在峰值,但也以一定的概率出现在4~20 MW,这是因为实际功率一定程度上受到昼短时段气象、环境状态多变的影响;3)第2种天气类型(昼长类晴天)下,给定预测功率为7.74 MW时,条件概率密度值在3~10 MW处集中,这表明该种天气类型下,其实际出力的不确定程度相对其他2种天气类型要小。
图8
图8
光伏功率条件概率分布
Fig. 8
Conditional probability distribution of photovoltaic power
为了定量描述天气分型概率预测建模的效果,计算了在测试集上、不同置信度下预测区间的区间覆盖率
表2 不同置信度下天气分型的PICP和MPIW
Tab. 2
类别 | 80%置信度 | 90%置信度 | 95%置信度 | |||
---|---|---|---|---|---|---|
PICPα | MPIWα | PICPα | MPIWα | PICPα | MPIWα | |
天气分型 | 0.919 9 | 4.91 | 0.959 8 | 6.27 | 0.977 8 | 7.48 |
不进行天气分型 | 0.932 6 | 5.53 | 0.960 7 | 7.07 | 0.975 5 | 8.43 |
3 结论
提出了一种新的基于光伏功率聚类的双模态天气分类模型,并结合功率概率预测验证了该方法的有效性,相比于不进行天气分型,使用所提方法进行天气分型的概率预测的区间覆盖率更接近预设的置信水平,且平均带宽更窄。天气分型模型充分考虑日前预测的可操作性,为提高功率预测的精度和鲁棒性提供了思路。基于实验结果得出如下结论:
1)考虑功率信息到天气分型中,而不仅仅使用气象信息进行天气分型,或许是天气分型在光伏功率预测中的一条有效的新路径。
2)不同天气类型下,光伏预测功率和实际功率的相关结构存在差异,选用不同的Copula族可以差异化地捕获其依赖结构。
3)阴雨天下,当光伏预测出力为低出力水平时,其实际出力的不确定程度较低,而中、高出力水平下实际出力不确定性较强;对于类晴天,预测出力在低出力或高出力情况时,光伏功率的不确定性较低,而中等出力水平下功率的不确定性较高。
参考文献
光伏发电系统发电功率预测
[J].
Power forecasting of photovoltaic power generation system
[J].
区域光伏发电出力特性分析研究
[J].
Analysis and research on output characteristics of regional photovoltaic power generation
[J].
高比例光伏发电对浙江电网电力平衡的影响及应对策略
[J].
The impact of high-proportion photovoltaic power generation on the power balance of Zhejiang power grid and its countermeasures
[J].
光伏发电系统在火力发电厂的应用研究
[J].
Research on application of photovoltaic power generation system in thermal power plant
[J].
基于时变因素的光伏发电系统可靠性评估
[J].
Reliability evaluation of photovoltaic system based on time varying factors
[J].
基于PCA-LMD-WOA-ELM的短期光伏功率预测
[J].
Short term photovoltaic power prediction based on PCA-LMD-WOA-ELM
[J].
A review and evaluation of the state-of-the-art in PV solar power forecasting:techniques and optimization
[J].
光伏发电出力的条件预测误差概率分布估计方法
[J].
A method of probabilistic distribution estimation of conditional forecast error for photovoltaic power generation
[J].
Solar spectral influence on the performance of photovoltaic (PV) modules under fine weather and cloudy weather conditions
[J].
Generative adversarial networks and convolutional neural networks based weather classification model for day ahead short-term photovoltaic power forecasting
[J].
Image phase shift invariance based cloud motion displacement vector calculation method for ultra-short-term solar PV power forecasting
[J].
基于天气分型的短期光伏功率组合预测方法
[J].
Combination forecasting method of short-term photovoltaic power based on weather classification
[J].
基于时间序列的深度学习光伏发电模型研究
[J].
Deep learning photovoltaic power generation model based on time series
[J].
基于模糊聚类分析的电能质量扰动模式识别方法
[J].
Disturbance pattern recognition method of power quality based on the fuzzy clustering analysis
[J].
基于主成分分析合作博弈的电网负荷智能预测方法研究
[J].
A study on the intelligent load forecasting method of power grids based on principal component analysis and cooperative game
[J].
基于天气分型的风电功率预测方法
[J].
Study on weather typing based wind power prediction
[J].
Online 24-h solar power forecasting based on weather type classification using artificial neural network
[J].
一种新型天气分型方法及其在光伏功率预测中的应用
[J].
A novel weather classification method and its application in photovoltaic power prediction
[J].
Time-series clustering:a decade review
[J].
Representation learning:a review and new perspectives
[J].
多模态数据融合算法研究
[D].
Research on multimodal data fusion methods
[D].
基于天气分型的风光出力互补性分析方法
[J].
Analysis method for complementarity between wind and photovoltaic power outputs based on weather classification
[J].
基于多尺度聚类分析的光伏功率特性建模及预测应用
[J].
Multi-scale clustering analysis based modeling of photovoltaic power characteristics and its application in prediction
[J].
Multimodal machine learning:a survey and taxonomy
[J].
基于深度学习的电力系统暂态稳定评估及风电功率预测方法研究
[D].
Research on power system transient stability assessment and wind power prediction method based on deep learning
[D].
基于多源气象预报总辐照度修正的光伏功率短期预测
[J].
Short-term forecasting of photovoltaic power based on total irradiance correction of multi-source meteorological forecast
[J].
多点数值天气预报风速和辐照度集中式修正方法研究
[J].
Integrated correction method of multi-point numerical weather prediction wind speed and irradiance
[J].
Distance covariance analysis
[C]//
Independent component analysis via distance covariance
[J].
Fast computing for distance covariance
[J].
Modelling and simulating the spatio-temporal correlations of clustered wind power using copula
[J].
Kernel density estimation and its application
[J].
Copula theory:an introduction
[C]//Copula Theory and Its Applications,
Construction of optimal prediction intervals for load forecasting problems
[J].
Comprehensive review of neural network-based prediction intervals and new advances
[J].
/
〈 |
|
〉 |
