風(fēng)電遇上數(shù)據(jù)科學(xué)家 | 一種異常檢測的方法
風(fēng)電機(jī)組運行工況復(fù)雜多變,機(jī)組狀態(tài)監(jiān)測數(shù)據(jù)量大、來源多且雜,現(xiàn)有的異常檢測方法面對如此海量的數(shù)據(jù)很難保證預(yù)測的精度并進(jìn)行快速處理。
天澤智云資深數(shù)據(jù)科學(xué)家謝鵬從全新視角出發(fā),以溫度數(shù)據(jù)進(jìn)行故障預(yù)測為例,呈現(xiàn)新的建模方法。
數(shù)據(jù)科學(xué)家
21世紀(jì)“最性感職業(yè)”之一
他們懂?dāng)?shù)據(jù)、懂算法、懂軟件
懂行業(yè)專業(yè)知識、懂市場應(yīng)用、懂決策分析
具備過人的溝通協(xié)調(diào)能力
也具備超高的設(shè)計能力
……
他們練就十八般武藝
解決各種可見不可見的問題
一、數(shù)據(jù)科學(xué)處理問題的思路
我們處理問題的一般思路是,首先根據(jù)問題的需求提出假設(shè)/理論,發(fā)現(xiàn)并構(gòu)建出特征,之后基于假設(shè)和特征構(gòu)建模型將其轉(zhuǎn)化為數(shù)學(xué)問題,最后通過測試、優(yōu)化模型,實現(xiàn)算法來進(jìn)行工程上的部署。
其中,特征是指可以抽象化問題的一些表征,特征有來自于表征的,比如基于機(jī)理的、基于統(tǒng)計的以及基于圖形的等。
有的故障、失效的機(jī)理并沒有研究清楚,這種情況下我們需要通過實驗研究建立統(tǒng)計模型,比如隊列(Cohort)/案例對照(Case-control)研究、生存分析等。
二、聚焦到風(fēng)電領(lǐng)域如何應(yīng)用
聚焦到傳統(tǒng)風(fēng)電數(shù)據(jù)分析領(lǐng)域,經(jīng)常從其變量間的關(guān)系,尤其是以功率曲線為基礎(chǔ)的圖形入手進(jìn)行分析。風(fēng)機(jī)的控制為工程師設(shè)定的具有固定邏輯的算法,具有特定的規(guī)律性,所以很多機(jī)組中的異常都會在功率曲線中有所體現(xiàn)。
除風(fēng)功率曲線外,轉(zhuǎn)速、槳葉角、對風(fēng)角、葉尖速比等都是我們經(jīng)常用來觀察的變量。
實際工作中,我們研究的故障在這些變量間兩兩關(guān)系并不能觀察到異常。
對于沒有任何表征的模型,我們有以下兩個思路:識別特定故障發(fā)生前模式及識別特定故障發(fā)生時模式。
從方法角度,這兩者均屬于模式識別,我們希望通過建立可以描述故障發(fā)生前或者故障發(fā)生時的特征,利用機(jī)械工程上的方法、信號處理的方法、統(tǒng)計學(xué)方法以及機(jī)器學(xué)習(xí)的方法構(gòu)建一個或多個可以識別一種或多種故障模式的模型。
路徑1:識別特定故障發(fā)生前模式
在此,我們先來探討一下故障發(fā)生前是否有征兆?對于這個問題,天澤智云幾位數(shù)據(jù)科學(xué)家發(fā)表了自己的看法。
A博士:故障發(fā)生前不會有任何表征。
B博士:用戶想要避免的失效一般都為故障非常嚴(yán)重的失效狀態(tài),所以有時把早期故障預(yù)測也簡稱為故障預(yù)測。
C博士:故障和失效沒有準(zhǔn)確定義,一般說的有沒有表征只是指能不能監(jiān)測到數(shù)據(jù),但故障的演進(jìn)是一直存在的。
D博士:故障既然被稱之為故障,證明故障已經(jīng)表征出來了。而故障表現(xiàn)出來需要經(jīng)歷一定的時間,各個內(nèi)在已經(jīng)磨耗到一定的階段才能表現(xiàn)出來。
經(jīng)過討論,我們認(rèn)為在故障發(fā)生之前,會存在很多因素影響一個部件的壽命(稱之為危險因素),比如空氣的酸堿度、沙塵、惡劣的環(huán)境溫度、共振載荷會對葉片材料壽命造成顯著的危害,通過對這些因素進(jìn)行受控實驗或者長時的隊列/案例研究可以通過統(tǒng)計模型描述其剩余壽命。
在故障完全發(fā)生前,進(jìn)行壽命預(yù)測是一種可行的方法,但是這種方法需要的實驗、數(shù)據(jù)、時間的代價都很大。
對于部件來說,其故障發(fā)生前沒有明確的表征,因此我們著重研究故障早期的表征。
路徑2:識別故障發(fā)生早期的表征
Q:我們有什么數(shù)據(jù)?
SCADA數(shù)據(jù),秒級/分鐘級
無故障標(biāo)簽/無準(zhǔn)確故障產(chǎn)生時間
有限傳感器測點,大多數(shù)為溫度測點數(shù)據(jù)
能獲取的數(shù)據(jù)可能并不滿足對特定故障模式的建模。
Q:在這種情況下如何做故障預(yù)測?
有限數(shù)據(jù),尤其是沒有標(biāo)簽數(shù)據(jù)的情況下,對特定故障模式建模難以實現(xiàn)。退而求其次,我們對部件進(jìn)行異常檢測。對此,我們提出一個理論:
定義什么是異常:
偏離正常就是異常
如何描述正常:
用正常狀態(tài)的物理過程來定義
如何測量對正常的偏離
有了正常狀態(tài)的定義之后,用數(shù)學(xué)上或者其他方法來描述對正常的偏離:使用分類模型,或者使用距離來度量
以上是我們從以前的研究中總結(jié)的研究方法。研究發(fā)現(xiàn),熱傳導(dǎo)和溫度是物理系統(tǒng)的最基本的變量,基于熱力學(xué)第一定律,可以建立溫度變化和風(fēng)機(jī)輸出功率或轉(zhuǎn)速的變量關(guān)系。如果風(fēng)機(jī)在大部件失效的狀態(tài)下,這種線性關(guān)系就會遭到破壞,從而服從不同于正常狀態(tài)下的溫度分布情況。在很多情況下,溫度關(guān)系的變化是部件失效的一種直接表征。如下圖研究中表示油溫溫升分布與齒輪箱失效的關(guān)系。
基于以上,我們認(rèn)為可以將溫度、溫升作為建模的依據(jù),將溫度、溫升分布的改變作為故障發(fā)生(早期)的表征。
當(dāng)然,通常做異常檢測我們有很多可以用的其他統(tǒng)計和機(jī)器學(xué)習(xí)模型,比如使用PCA-T2/SPE、SOM-MQE、Isolation Forest等方法進(jìn)行建模。在本例中,我們關(guān)注于特定溫度的異常檢測,呈現(xiàn)另外的建模方法。
三、建模的思路是什么
對于軸承,我們認(rèn)為發(fā)電機(jī)前后軸承溫度存在一定差異并在正常情況下保持動態(tài)的穩(wěn)態(tài),熱傳導(dǎo)的過程需要時間并且逐漸變化。由于發(fā)電機(jī)軸承失效或故障導(dǎo)致這種穩(wěn)態(tài)的破壞,并將體現(xiàn)在基線的偏離上。我們用以下幾種方式定義基線。
定義基線方式1:
我們用一種函數(shù)關(guān)系來描述一種溫度量,建立模型來預(yù)測溫度,比如建立油溫的模型對溫度進(jìn)行預(yù)測。將預(yù)測的溫度作為基線,如果預(yù)測的數(shù)據(jù)和實際獲得的數(shù)據(jù)相差很大,我們認(rèn)為偏離正常狀態(tài)。
我們可以使用回歸模型來擬合,比如ANN、SVR、ANFIS,這很多情況下我們觀察的變量具備一定的時間序列上的關(guān)聯(lián),則可以使用NARX/LSTM模型。之后使用距離(比如MD)度量一段時間內(nèi)預(yù)測值與實際值的差異,使用單機(jī)組無故障數(shù)據(jù)訓(xùn)練建立基線。
這種方法存在一種缺陷:對實際值的擬合的模型精度會放大后續(xù)建模的誤差
定義基線方式2:用直方圖描述分布
我們認(rèn)為在健康情況下,溫升存在特定的分布。描述一種分布最常用的圖形是直方圖。從數(shù)學(xué)的角度看,直方圖是一種離散化數(shù)據(jù)進(jìn)行統(tǒng)計的方法。
直方圖這種方法雖然簡單,但是在很多領(lǐng)域都有著廣泛的用途。
比如:
xgboost - 其中應(yīng)用到直方圖算法,用于高效地生成候選的分割點,運算非常快
方向梯度直方圖(HOG) – 機(jī)器視覺領(lǐng)域的特征方法
使用離散化權(quán)重的方法優(yōu)化深度學(xué)習(xí)性能等
在實際應(yīng)用到工業(yè)場景中,對數(shù)據(jù)離散化的參數(shù)需要根據(jù)其業(yè)務(wù)屬性來約束。
直方圖方法的變種
使用直方圖方法可以獲得對變量的特征向量,這種方法通常可以描述數(shù)據(jù)的分布。但是在很多情況中,數(shù)據(jù)的噪聲,尤其是傳感器的測量誤差,會淹沒異常模式的表征。為提高信噪比,我們采用一種來自被自然語言處理(NLP)領(lǐng)域廣泛使用的加權(quán)方法TF-IDF。
獲得特征向量后,有了基線及實時數(shù)據(jù)特征矩陣后,我們可以使用歐式距離來描述實時數(shù)據(jù)與基線特征向量的距離。當(dāng)然,我們也可以應(yīng)用其他的模型,比如可以進(jìn)行聚類。
TF-IDF訓(xùn)練案例
案例:變槳電機(jī)溫度的異常檢測。
我們以三個變槳電機(jī)編組為三組,計算三組特征向量與基線的距離。
下圖為正常的變槳電機(jī)溫度狀態(tài)。
下圖為異常的變槳電機(jī)溫度狀態(tài)。
在所應(yīng)用到的各種案例中,該方法對各部件溫度的異常檢測具備良好的準(zhǔn)確性(>90%)。
定義基線方式3:符號化的特征表示
使用直方圖或者是TF-IDF,其中的一個重要的步驟是對連續(xù)數(shù)據(jù)的離散化。離散化可以看成一種對信號中的信號進(jìn)行平滑的過程,損失了一定的信息換取更高的信噪比。
在獲得離散化的數(shù)據(jù)后,使用固定維度對原始數(shù)據(jù)進(jìn)行重新表達(dá)。在自然語言處理中,這種技術(shù)稱為詞的分布式表示(Distributional Representation)。
我們繼續(xù)把這種離散化的連續(xù)數(shù)據(jù)視為“符號”,這種處理在很多領(lǐng)域都有應(yīng)用,比如在信號處理領(lǐng)域的SAX方法。使用NLP的方法,比如word2vec來訓(xùn)練這些“詞”或“文檔”的向量。同樣,我們利用訓(xùn)練的基線向量來進(jìn)行異常檢測或其他任務(wù)。
高維數(shù)據(jù)中,我們可以拓展這種方法到更多的故障模式的學(xué)習(xí)中。
四、結(jié) 語
在這里,我們提出了一種對于連續(xù)數(shù)據(jù)的符號化的特征表示的方法用于異常檢測,作為常規(guī)異常檢測技術(shù)的補(bǔ)充。
這種方法使用對連續(xù)數(shù)據(jù)離散化處理,使之符號化,進(jìn)而尋找符號映射到數(shù)學(xué)空間的表達(dá)。在文章的例子中,“符號”表示了一種兩種變量間的統(tǒng)計關(guān)系,并且,在這種方法中,我們認(rèn)為這些“符號”和詞語在語料庫中一樣,具有穩(wěn)定的統(tǒng)計分布。這種方法之所以可以用于異常檢測,在于從物理模型上,該“符號”表達(dá)了我們關(guān)注量的物理關(guān)系。
更多精彩內(nèi)容歡迎關(guān)注我們:天澤智云CyberInsight(微信ID:CPS-China)
提交
駿業(yè)日新 大展宏圖 | 天澤智云上海分公司成長記
在智能化落地過程中我們學(xué)到了什么?
工業(yè)智能技術(shù)在軌道交通領(lǐng)域的應(yīng)用實踐分享
基于GenPro的工業(yè)智能建模案例分享
工業(yè)智能為軌道交通安全高效運營保駕護(hù)航 天澤智云與您相約RT FORUM