免費下載!
[!--downpath--]風電機組風速功率數據清理是風電機組異常運行數據識別與清理的研究熱點。 其中,風力電機的風速-功率數據清理分為三類。 第一類是基于數理統計的清洗方法(如密度、距離、中值、方差、平均值等),但此類方法對于識別密集分布的異常數據效果有限。 例如文獻[]采用四分位數法處理異常數據,風電數據中異常數據所占比例較大,四分位數法會剔除大量正常數據; 文獻【】采用四分位法和降維分析方法剔除異常數據,但沒有給出具體的剔除標準,可能會導致正常數據被刪除,對數據處理結果影響較大; 文獻[]采用局部異常值因子(local中期風電功率預測,LOF)算法來檢查異常值,該算法根據風速-功率曲線,估計曲線周圍的相對密度,消除異常值。 第二種是基于數據挖掘的,即通過無監督學習來識別大量數據中具有異常特征的數據,并將其用于數據分析和處理。 這類方法不需要提前建立模型,具有較好的抗干擾性中期風電功率預測,例如文獻[]采用LOF與支持向量機相結合,通過LOF值修復異常范圍,然后構造結合支持向量機的判斷機制,從而判斷異常值,有效防止基于距離降維方法的異常值吞噬現象。 文獻[]采用最優殘差算法實現了分散異常數據的有效識別,但無法有效識別高密度的累積異常數據。 第三類方法是基于數據的分布特征。 該類方法的依據是位于風速-功率曲線之外的數據為異常數據,可以實現多類異常數據的清洗。 例如,如果風速-功率的概率密度偏差服從正態分布,文獻[]提出了一種基于“3σ規則”的判斷方法來衡量異常值,即位于[0, 3σ]為異常偏差,位于[0,3σ]以內的偏差為正常偏差,從而達到數據清洗的目的。 而且風速-功率的概率密度往往是多峰的,精度不高。 文獻[]借助成熟的預測算法獲取方差的偏差信息,綜合分析偏差概率密度的特征,判斷異常信息。 文獻[]提出了一種不需要概率密度分布函數的四分位數算法,避免了擬合概率密度的復雜過程。