無論是在過去的電力中長期交易市場裡,還是即将到來的電力現貨交易市場裡,負荷預測都是各大售電公司和電力大用戶馳騁市場的必備技能。不會做負荷預測或者負荷預測做得不好,必将被無情的市場按在地闆上摩擦。
在過去幾年的業務發展中,彙電雲聯累積了70多個行業、3000多用戶2年以上的一級能效數據。經過補全,清洗等ETL處理後,把用戶每天的真實負荷繪制成曲線,發現真是千姿百态:有的上蹿下跳日複一日,有的一馬平川偶爾會皮一下,如下圖所示。
圖一:不同用戶的負荷曲線
負荷預測的方法,從根據用戶曆史耗電情況的估算,到基于統計的分析預測模型如ARIMA,再到現在大行其道的循環神經網絡如LSTM及其變種,無一例外地都對穩定負荷變化有強烈的需求。負荷越穩定,規律越明顯,預測的準确率就越高。這就是我們在實際操作中,會發現統調負荷預測,很輕松就能達到98%以上,而具體到單個用戶的負荷預測,準确率會低到懷疑人生。
對于售電公司,預測所代理的用戶總體的負荷曲線才是實實在在的需求,同時還可以深入挖掘和發展不同行業、不同用電習慣的用戶,來平衡手中已有用戶的總體負荷曲線。這對他們拓展業務,降低被考核風險,以及在現貨市場中獲利都至關重要。
彙電雲聯根據不同的場景需求,建立起豐富的算法模型庫,在這些算法和模型庫中,本着實事求是不浮誇不忽悠的科學精神,我們會陸續公布不同場景,不同數據組合,不同特征工程下的負荷預測實戰結果。本期公布的是【有色金屬冶煉】這個行業。
每張圖展示的結果,選擇的訓練集都是從2018-04-01到T-1,其中T為要預測的那一天。比如要預測2018-12-23這一天24個點的負荷,訓練集是2018-04-01到2018-12-23,依次類推。每張表展示是T當天的預測結果,表的最後一行是所有預測時間的平均預測結果。
在所有的模型和算法中,我們充分考慮了工作日、周末和節假日的區别,但是由于沒有對用戶的周末、節假日的負荷使用情況進行調研,會導緻這部分時間的預測準确率比較低。圖中顯示的預測準确率,是從12-23到12-31這段時間的平均預測準确率,準确率評估公式是國網公布的公式,該公式相對于常用的回歸算法的評估公式比如MAPE,對異常值更加敏感,意味着同一套數據,用該公式算出的準确率,會比使用MAPE算出來的準确率低一些。
圖二:國網準确率評估公式
第一組算法是一組很巧妙的、取不同時間長度的數據作為自變量的算法。該算法的思想取自生産的連續性,當然也受限于生産的連續性。因此,在趨勢穩定不中斷的情況下,準确率相當可觀,如其中12-27、12-28這兩天。但對突然的減産檢修等生産行為,則表現得會措手不及。
圖三:方式一預測方法
第二組算法是機器學習領域的回歸算法,取相似日同時刻的曆史負荷值構建特征矩陣,這是一種比較直觀比較傳統的做法,對比較穩定的工作日的負荷預測效果,也是杠杠的好。
圖四:機器學習算法組
第三組算法還是機器學習領域的算法,根據電力場景構建特有的特征,我們一共構建了有14維的特征矩陣。如下列圖表所示,效果略差于第一、二組算法得到的結果。
圖五:自建特征算法組
第四組算法是用不同的差異比較大的簡單算法模型做的STACKING,結果也還過得去。
圖六:融合算法組
從上面提供的四組算法得到的結果來看,反而是比較傳統的相似日同時刻模型得到的準确率更高,而Kaggle上刷分的常勝技能STACKING,也不見得甩了其他算法幾條街。另外12-30是元旦假期的第一天,預測值誤差比較大,這主要是因為不同用戶的節假日安排不同步造成的
本文版權歸“彙電雲聯”所有,轉載請聯系作者。
上一篇
停課不停學
下一篇
一曲一淨土,一弦一清音
有話要說...