目錄
一、NIO Power 業務背景" >一、NIO Power 業務背景
#1、蔚來汽車能源服務系統" >#1、蔚來汽車能源服務系統
2、裝置運維的挑戰" >2、裝置運維的挑戰
二、NIO Power 設備運維解決方案" >二、NIO Power 設備運維解決方案
三、PHM 技術面臨的挑戰" >三、PHM 技術面臨的挑戰
四、PHM 尖端技術" >四、PHM 尖端技術
1、基於生成對抗網路(GAN)的無監督例外偵測" >1、基於生成對抗網路(GAN)的無監督例外偵測
(1)GAN 結構" >(1)GAN 結構
(2) GAN 損失函數" >(2) GAN 損失函數
(3)Auto-Encoder aided GAN for Anomaly Detection (AE-GAN)" >(3)Auto-Encoder aided GAN for Anomaly Detection (AE-GAN)
(2)問題設定" >(2)問題設定
(1)工業機理分析 " >(1)工業機理分析 
(4)鏈條鬆脫偵測模型設計" >(4)鏈條鬆脫偵測模型設計
(5)鏈條鬆動偵測資料與演算法互動流程" >(5)鏈條鬆動偵測資料與演算法互動流程
2、超充樁槍頭劣化故障診斷" >2、超充樁槍頭劣化故障診斷
(2)故障診斷流程" >(2)故障診斷流程
#① 收集故障樣本資料" >#① 收集故障樣本資料
② 模型建構" >② 模型建構
③ 模型預警" >③ 模型預警
六、問答環節" >六、問答環節
#Q1:在 AE-GAN 模型中,如何區分正常樣本和例外樣本? " >#Q1:在 AE-GAN 模型中,如何區分正常樣本和例外樣本?
Q2:GAN 網路訓練時候,使用的是小樣本故障資料和正常資料的混合資料嗎?兩種數據如何平衡? " >Q2:GAN 網路訓練時候,使用的是小樣本故障資料和正常資料的混合資料嗎?兩種數據如何平衡?
Q3:GAN 訓練中會出現模式崩潰嗎? " >Q3:GAN 訓練中會出現模式崩潰嗎?
Q4:RNN 隱藏層隨機固定的優點是什麼? " >Q4:RNN 隱藏層隨機固定的優點是什麼?
Q5:介紹下 Conceptor 模型的網路形態。 " >Q5:介紹下 Conceptor 模型的網路形態。
Q6:AE-GAN 中的 Encoder 網路的訓練過程是怎樣的?輸入和輸出分別是什麼? " >Q6:AE-GAN 中的 Encoder 網路的訓練過程是怎樣的?輸入和輸出分別是什麼?
Q7:文中所述兩種方法,是否有論文及相關開源程式碼? " >Q7:文中所述兩種方法,是否有論文及相關開源程式碼?
Q8:影像領域可以使用 AE-GAN 進行異常檢測嗎? " >Q8:影像領域可以使用 AE-GAN 進行異常檢測嗎?
Q9:異常偵測的評估指標如何?誤報和漏報,以及兩者一併評價。 " >Q9:異常偵測的評估指標如何?誤報和漏報,以及兩者一併評價。
Q10:如何符合故障樣本特徵? " >Q10:如何符合故障樣本特徵?
Q11:PHM 演算法如何進行模型選型? " >Q11:PHM 演算法如何進行模型選型?
Q12:如何透過 RNN 輸出的兩類概念矩陣來辨識異常? " >Q12:如何透過 RNN 輸出的兩類概念矩陣來辨識異常?
Q13:AE-GAN 網路中,異常閾值如何設定? " >Q13:AE-GAN 網路中,異常閾值如何設定?
Q14:AE-GAN 網路中的異常閾值會更新嗎? " >Q14:AE-GAN 網路中的異常閾值會更新嗎?
Q15:GAN 是如何訓練時間序列的? " >Q15:GAN 是如何訓練時間序列的?
Q16:AE-GAN 和傳統 GAN 相比,引入 GAN 的作用是什麼?可獲得那些提升? " >Q16:AE-GAN 和傳統 GAN 相比,引入 GAN 的作用是什麼?可獲得那些提升?
Q17:充電樁的時序數據,是否會出現假日整體抬升的情況?如何避免誤判? " >Q17:充電樁的時序數據,是否會出現假日整體抬升的情況?如何避免誤判?
Q18:模型上線後,無監督異常偵測的應用效果如何評估? " >Q18:模型上線後,無監督異常偵測的應用效果如何評估?
Q19:是否使用文中提到的兩種方法,針對換電站中電池進行異常檢測的嘗試? " >Q19:是否使用文中提到的兩種方法,針對換電站中電池進行異常檢測的嘗試?
Q20:時序資料如何統一長度?用 0 填充會導致梯度不下降嗎? " >Q20:時序資料如何統一長度?用 0 填充會導致梯度不下降嗎?
Q21:GAN 會出現過擬合的情況嗎? " >Q21:GAN 會出現過擬合的情況嗎?
Q22:訓練 GAN 模型,使用訓練資料的數量級,一般設定為多少會達到較好的效果? " >Q22:訓練 GAN 模型,使用訓練資料的數量級,一般設定為多少會達到較好的效果?
Q23:Conceptor 模型中的最小單元隱匿參數固定,是基於專家經驗設定嗎?和普通 RNN 相比,偏差如何?故障分析的標示量是多少?如何做到業務價值量化? " >Q23:Conceptor 模型中的最小單元隱匿參數固定,是基於專家經驗設定嗎?和普通 RNN 相比,偏差如何?故障分析的標示量是多少?如何做到業務價值量化?
Q24:如何決定故障開始時間,以及查準率查全率? " >Q24:如何決定故障開始時間,以及查準率查全率?
Q25:大量的正常資料是不是取值相同?這樣模型會不會重複學習相同的樣本? " >Q25:大量的正常資料是不是取值相同?這樣模型會不會重複學習相同的樣本?
Q26:什麼特徵的故障適用 GAN,什麼特徵的故障適用 RNN? " >Q26:什麼特徵的故障適用 GAN,什麼特徵的故障適用 RNN?
Q27:「人員違規行為偵測」這類特殊場景,能否使用本文提到的模型? " >Q27:「人員違規行為偵測」這類特殊場景,能否使用本文提到的模型?
Q28:Conceptor Distance 是相似度判斷嗎?是否是帶參數學習的? " >Q28:Conceptor Distance 是相似度判斷嗎?是否是帶參數學習的?
Q29:每個故障都要訓練一個模型嗎? " >Q29:每個故障都要訓練一個模型嗎?
Q30:模型訓練時間和訓練成本如何? " >Q30:模型訓練時間和訓練成本如何?
Q31:模型訓練時,正常樣本的訓練集是什麼樣的?時序滑窗切片時,每個時序子集的時間數有最小個數建議嗎? " >Q31:模型訓練時,正常樣本的訓練集是什麼樣的?時序滑窗切片時,每個時序子集的時間數有最小個數建議嗎?
Q32:RNN 網路得到的特徵矩陣維度大概是多少? " >Q32:RNN 網路得到的特徵矩陣維度大概是多少?
Q33:為什麼不使用 GAN 中的判別器作為分類器?判別器只學習正常數據,對異常數據會被分割到虛假數據範疇。這個方法的缺點是什麼? " >Q33:為什麼不使用 GAN 中的判別器作為分類器?判別器只學習正常數據,對異常數據會被分割到虛假數據範疇。這個方法的缺點是什麼?
Q34:小樣本學習的模型如何保證泛化能力? " >Q34:小樣本學習的模型如何保證泛化能力?
Q35:輸入資料需要如何進行資料預處理? " >Q35:輸入資料需要如何進行資料預處理?
Q36:GAN 和孤立森林、AE 等傳統的無監督方向對比如何? " >Q36:GAN 和孤立森林、AE 等傳統的無監督方向對比如何?
Q37:如果判別器在後期幾乎無法判別正常樣本和偽造樣本,那麼 GAN 部分的意義就不大了,此時 AE-GAN 會退化成 AE 嗎? " >Q37:如果判別器在後期幾乎無法判別正常樣本和偽造樣本,那麼 GAN 部分的意義就不大了,此時 AE-GAN 會退化成 AE 嗎?
Q38:有嘗試使用 Transformer 取代 RNN 嗎? " >Q38:有嘗試使用 Transformer 取代 RNN 嗎?
Q39:AE-GAN 和 VAE 的差別是什麼? " >Q39:AE-GAN 和 VAE 的差別是什麼?
Q40:實驗中訊號特徵會有資料雜訊嚴重或缺失的情況出現嗎?有哪些較好的特徵清洗的方法? " >Q40:實驗中訊號特徵會有資料雜訊嚴重或缺失的情況出現嗎?有哪些較好的特徵清洗的方法?
Q41:在訓練中可以增加 APA 這類增強策略嗎? " >Q41:在訓練中可以增加 APA 這類增強策略嗎?
Q42:在4.1.(3) 的第二步驟中,如果正常範圍跨越區間很大,假如有  3 個樣本1、2、3,其中樣本1、2 為正常樣本,樣本3 為異常樣本;樣本1 和樣本2 位於正常範圍的兩邊,而樣本3 位於樣本1 旁邊不遠處但是已經超出正常範圍,那麼會不會出現樣本1 和2 之間的重構誤差大於樣本1 和3 的情況? " >Q42:在4.1.(3) 的第二步驟中,如果正常範圍跨越區間很大,假如有  3 個樣本1、2、3,其中樣本1、2 為正常樣本,樣本3 為異常樣本;樣本1 和樣本2 位於正常範圍的兩邊,而樣本3 位於樣本1 旁邊不遠處但是已經超出正常範圍,那麼會不會出現樣本1 和2 之間的重構誤差大於樣本1 和3 的情況?
首頁 科技週邊 人工智慧 蔚來汽車深度學習演算法實踐

蔚來汽車深度學習演算法實踐

May 15, 2023 am 11:07 AM
機器學習 演算法 深度學習

蔚來汽車深度學習演算法實踐

一、NIO Power 業務背景

#1、蔚來汽車能源服務系統

NIO Power 業務團隊的目標是建立全球創新的智慧能源服務體系,基於行動互聯網的加電解決方案,擁有廣泛佈局的充電換電設施網絡,依托蔚來雲技術,搭建「可充可換可升級」的能源服務體系,為車主提供全場景化的加電服務。

蔚來汽車深度學習演算法實踐

2、裝置運維的挑戰

#NIO Power 設備維運服務主要包括蔚來換電站、蔚來超充樁、7KW 家充樁2.0、20KW 家用快充樁等設備;該服務目前面臨諸多挑戰,主要包括:

① 保障設備無安全隱患。

② 使用者抱怨:加電體驗不佳。

③ 因設備故障導致的充換電成功率降低。

④ 因裝置故障而導致的停機。

⑤ 維運成本較高。

二、NIO Power 設備運維解決方案

蔚來汽車深度學習演算法實踐

公司的4 類主要充放電設備(換電站、超充樁、7KW 家充樁、20KW 家用快充樁)都包含大量感測器,因此將感測器即時採集的資料統一接入蔚來能源雲進行統一儲存和管理,並引入基於PHM(故障預測與健康管理)預測性維護技術,透過一系列AI 演算法,例如:GAN(生成對抗網路)和Conceptor(概念器網路),得到設備的異常檢測情況以及故障診斷情況,並根據此診斷預測結果為設備提供最優的預測性維護決策方案,並下發相關運維工單,實現:

① 消除設備安全隱憂。

② 減少使用者對於加電體驗不佳方面的投訴。

③ 提升充換電成功率。

④ 減少因裝置故障導致的停機。

⑤ 降低維運成本。

因此,PHM 技術和演算法的引入,有效地幫助公司改善了智慧能源服務體系,並形成閉環,從而提升和優化 NIO Power 的服務能力。

三、PHM 技術面臨的挑戰

#尖端的PHM 技術都是基於數據驅動的人工智慧技術,「數據驅動」依賴大量樣本和標籤來建立模型,而模型往往都是在理想的場景下建構的,然而真實的場景往往並不理想。

蔚來汽車深度學習演算法實踐

#從上圖可以看出,真實場景常具備以下特點:

① 故障樣本少。

#

② 故障樣本標註困難。

由此帶來了該場景下面臨的兩類問題:一類是無監督學習問題,另一類是小樣本學習問題。

四、PHM 尖端技術

#針對真實場景下面臨的這兩類問題,我們提出了以下幾種PHM 前沿技術,並應用於NIO Power 場景下。

1、基於生成對抗網路(GAN)的無監督例外偵測

(1)GAN 結構

生成式對抗網絡,於2014 年提出,是一類基於深度學習的無監督學習技術,主要由生成器和判別器這兩個子網路構成。

蔚來汽車深度學習演算法實踐

#上圖中紅色G 網路即為生成器網絡,而藍色D 網絡即為判別器網路。

生成器網路#輸入隨機數分佈(如高斯分佈),輸出使用者指定的特定分佈;從樣本的角度來看,將100 個從隨機數分佈中抽樣得到的資料輸入給G 網絡,G 網路會將這100 個樣本映射到與真實資料相同的空間中,形成分佈G(z),並利用判別器網路得到G(z) 與真實資料X 這兩種分佈的差異,隨後優化G 網路直至G(z) 分佈接近真實資料X 分佈。 G 網路會輸出這 100 個資料並形成一個特定的分佈 G(z)。

判別器網路#的核心是建構了G(z) 分佈與真實資料x 分佈的近似Jensen-Shanon 散度,以此來衡量產生的分佈與真實的分佈的差異。近似 Jensen-Shanon 散度是透過標準的基於二項交叉熵的二分類網路來實現,判別器網路輸出是個從 0 到 1 的連續值。如果輸出為 1,則認為輸入樣本 X 是來自真實的分佈;如果輸出為 0,則認為輸入樣本 X 是假的,是仿造的。

在GAN 網路的訓練形式上,生成器產生的樣本嘗試與真實樣本的分佈接近,而判別器嘗試區分出生成的樣本為假的,以此為生成器提供更準確的Jensen-Shanon 散度值的梯度,可以讓生成器朝著更優的方向迭代。最後這兩種形成了對抗關係,生成器「拼命」生成假數據,判別器「拼命」對輸入資料進行真假區分。 GAN 網路最終將達到一種均衡的狀態:產生所得的資料分佈 G(z) 剛好完整覆蓋所有的真實樣本 X 的分佈。

(2) GAN 損失函數

#從數學的角度理解 GAN 網絡,可以從損失函數理解。損失函數可使用價值函數V(G,D),透過常見的minmax 優化,同時優化G 網路和D 網路的參數;對於給定的G 網絡,最佳化目標就是最小化價值函數,如下公式所示:

蔚來汽車深度學習演算法實踐

#公式中JSD 為此損失函數最核心的最佳化項,是兩種分佈間差異性的一種測量方式。從公式中可以看出,此最佳化的本質就是最小化 X 和 G(z) 之間的分佈差異;分佈差異越小,說明 G 網路訓練越成功。

(3)Auto-Encoder aided GAN for Anomaly Detection (AE-GAN)

##基於GAN 網絡,引入Auto-Encoder 實現設備運行資料的異常檢測。 #

蔚來汽車深度學習演算法實踐

#具體實作方式是:

##第一步,搭建GAN 模型並訓練得到一個G 網絡,該網絡剛好重構了設備運行資料的分佈。

第二步,丟棄GAN 網路中的D 網路部分,固定G 網路參數並在G 網路之前引入Encoder網路;這樣,Encoder 網路和G網絡組合形成一套標準的Auto-Encoder 網絡,此網絡的損失函數為重構誤差。

這樣,我們透過優化Auto-Encoder 網絡,即可完成異常檢測,背後的原則是:不管輸入樣本如何,透過Auto-Encoder 網絡輸出的樣本都會處於正常樣本區間範圍內。因此,如果輸入樣本為正常樣本,則生成樣本和原樣本同處於相同區間內,因此重建誤差會很小甚至接近0;而如果輸入樣本為異常樣本,生成樣本仍在正常樣本區間範圍內,這樣會導致重構誤差較大;因此,透過重構誤差可以判斷樣本是否正常。

第三步,透過一小批正常樣本來獲得一系列重構誤差分數,並以其最大值作為異常檢測的重建誤差閾值。

一原理已經完整論述在論文中,論文於2022 年發表在IEEE in  Transactions on Intelligent Transportation Systems 上,論文資訊如下:

M. Xu, P. Baraldi, X. Lu and E. Zio, "Generative Adversarial Networks With AdaBoost Ensemble Learning for Anomaly Detection in High-Speed Train Automatic Doors," IEEE in  Transactions on Intelligent Transportation Systems, 2022.

2、基於無監督RNN(Conceptor)的小樣本故障診斷

#我們使用的第二類技術是一種無監督RNN(命名為概念器網路:Conceptor)的小樣本故障診斷技術。

(1)無監督RNN

蔚來汽車深度學習演算法實踐

先介紹該技術的背景-無監督RNN。無監督 RNN 和普通 RNN 相比,最特別的一點在於此網路輸入層神經元的連接權重和隱藏層的連接權重是隨機初始化,並且在整個訓練和推理的過程中是固定不變的。這意味著,我們不需要對輸入層和隱藏層的權重參數進行訓練;因此,相較於普通RNN 網絡,我們可以將隱藏層神經元設定得非常大,這樣網絡的記憶週期和記憶容量會很大,對輸入的時間序列的記憶週期會更長久。這種特殊的無監督 RNN 的隱藏層神經元通常被稱為 Reservoir。

① Reservoir State Update

#狀態更新方式和標準 RNN 更新方式相同。

② Long-term temporal dependencies representation by Conceptor

蔚來汽車深度學習演算法實踐

基於這種無監督RNN 開發一種無監督的表徵學習方式,具體來說,輸入可變長度的多維時間序列,經過Reservoir 得到每個時間步的RNN 隱藏神經元狀態;使用Conceptor 方法(上圖淺藍色方框所示),得到一個N×N 維度的概念矩陣。用線性代數的方式去理解,此矩陣的意義是:在處理時間序列的時候,對於每個時間步,將時間序列訊號投射到 N 維空間(N 對應隱藏神經元的尺度)。

如果有 t#i## 個時間步長,則該N 維空間內的這 ti 個點形成點雲;這樣的點雲橢球體可解構成N 個相互正交的方向,並且得到每個方向上的特徵向量和特徵值。

而Conceptor 的作用是捕捉特徵值和特徵向量,並對特徵值進行歸一化;對於這N 個特徵向量,可理解成是在時間序列中捕捉到的N 種性質(如週期性、趨勢性、波動性等複雜時間序列特徵),即隱式特徵的提取;而所有被提取到的特徵資訊均被保留到這個N 維矩陣中(即Conceptor 矩陣,上圖右側深藍色方框部分)。

③ Similarity measure of time series with variable length

##根據矩陣的基本特性,將兩個時間序列的Conceptor 矩陣相減,並提取Frobenius 範數,即得到兩個時間序列的Conceptor 距離;這個標量可用來表徵兩個時間序列的差異性。

(2)基於Conceptor 的小樣本故障診斷

基於Conceptor 的上述特性,可用於進行小樣本故障診斷分析。

蔚來汽車深度學習演算法實踐

假如存在少量的實際故障樣本(例如只有不到10 個故障樣本),將對應的時間序列全部輸入到Conceptor 網路中,聚合形成對應的概念矩陣,作為該類別故障模式的抽象表徵;同樣,正常的樣本也會聚合成一個正常的概念矩陣。在測試的時候,將輸入的時間序列以相同的方法提取對應的概念矩陣,並分別與正常樣本和異常樣本的概念矩陣進行比較分析,計算對應的概念差異。若輸入樣本和某一特定故障模式的概念矩陣相似度很高,則可認為該樣本屬於該種故障模式。

此方法也被完整論述在下述論文中:

Mingjing Xu , Piero Baraldi, Zhe Yang, Enrico Zio, A two-stage estimation method based on Conceptors-aided unsupervised clustering and convolutional neural network classification for the estimation of the degradation le Partvel of industrial evel, . 2023, 118962.

五、智慧型運維PHM技術應用案例

##1、換電站電池倉鏈條鬆脫監測

(1)背景

換電站電池倉的鏈條配合電池倉提昇機,將入倉的電池提升至充電倉進行充電。鏈條如果故障會發生鬆動甚至斷裂的情況,從而在運送至充電倉的過程中會導致卡倉、無法入倉。此外,如果鏈條斷裂將導致電池墜落,從而引發電池損壞甚至火災事故的發生。

因此,需要建立模型提前偵測鏈條的鬆動情況,提前杜絕相關安全事故的發生,將風險降到最低。

#

(2)問題設定

蔚來汽車深度學習演算法實踐

#和鏈條鬆動直接相關的變數主要是振動相關訊號,然而振動資料的擷取和儲存成本較高,因此大多數設備並未擷取振動相關的訊號。

在振動資料缺失的情況下,可以透過鏈條驅動馬達的扭力、位置、速度等訊號來偵測鏈條的鬆動情況。

(3)工業機理分析

#對比下圖中的鏈條鬆動數據和鏈條正常數據,可以明顯看出,電池倉鏈條鬆動會使得扭力訊號發生明顯的週期性波動,波動的幅度呈現衰減趨勢。

蔚來汽車深度學習演算法實踐

該故障的實際樣本數很少,少於20 個樣本;然而這類故障重要性很高,因此對預測模型的準確率和召回率要求非常高。

(4)鏈條鬆脫偵測模型設計

蔚來汽車深度學習演算法實踐

① 首先將原始資料進行時間序列分割,長時間序列擷取出勻速過程的扭力資料。

② 進而進行時間序列分解,僅保留時間序列的波動特性。

③ 進一步對序列進行頻譜分析,最終得到頻譜特徵。

然而,發生故障時刻的頻率波段不只一種,並且不同頻段下的振幅服從特定的分佈,因此用傳統的方式去識別,準確率較低,會造成較多的誤警報和漏警報。因此,選擇 AE-GAN 模型,更精確地捕捉故障模式下特定的故障分佈,最終得到設備異常分數。

(5)鏈條鬆動偵測資料與演算法互動流程

蔚來汽車深度學習演算法實踐

鬆動偵測資料和演算法互動主要包括以下幾層:數倉,資料層,特徵層,演算法層以及模型層。

其中,特徵層主要是前文所述特徵工程所涉及的演算法模組;本案例中,演算法層使用AE-GAN 演算法;基於演算法層的異常分數結果,以及特徵層中特徵表的資料記錄,在模型層中進行進一步判斷和決策;最後輸出工單下發給專員來處理。

基於上述流程,將傳統的專家經驗檢測升級成 AI 演算法檢測,準確率提升超過 30%。

2、超充樁槍頭劣化故障診斷

(1)工業機理分析 

首先基於充電槍的充電電流、電壓、溫度等物理訊號建立物理模型以獲得槍頭的溫升係數物理量,並以此作為特徵訊號進行進一步的故障診斷。然而這種基於物理的特徵工程,通常使用時間滑窗進行特徵生成,最終得到一個新的時間序列作為特徵結果;這樣的特徵序列往往雜訊較大。

以下圖為例,專案通常選取一週或一月的資料作為時間窗口,得到類似下圖的特徵時間序列。圖中可以看出,該序列的雜訊很大,很難直接分辨劣化樣本和正常樣本。

#

蔚來汽車深度學習演算法實踐

此外,在實際故障樣本中,劣化槍頭樣本數往往小於 50。

基於上述兩點原因,引入 Conceptor 模型,擺脫人工經驗,並透過模型自動捕捉劣化樣本的時間序列特徵。

(2)故障診斷流程

蔚來汽車深度學習演算法實踐

#① 收集故障樣本資料

  1. 公司共投產數千個超充樁,其中僅數十個超充樁曾更換槍頭。
  2. 基於槍頭更換記錄匹配對應時段的故障樣本數據,作為模型的訓練集。
  3. 故障資料包含 6 維時間序列,且序列長度不一。

② 模型建構

  1. #此故障背後蘊含的物理機理較為複雜,因此基於先驗知識、專家經驗、物理機理進行建模相對難以實現,且模型難以泛化。
  2. 而本文提到的Conceptor 模型方法,基於純資料驅動方法實現,未引入任何先驗物理資訊擷取特徵,可大幅降低模型的複雜度,提升建模效率。
  3. 透過 Conceptor 模型方法,將例外時段的多維時序資料輸入模型中,得到對應的概念表徵矩陣。

a、假如輸入50 個故障樣本,則會得到50 個概念表徵矩陣;

b、將這50 個矩陣進行平均值聚合,並乘以故障模式的表徵矩陣重心,得到該故障模式下的表徵矩陣;

c、模型測試階段,對輸入測試資料計算概念矩陣,將其與故障模式的表徵矩陣進行對比,進而得到異常分數。

③ 模型預警

  1. #1)基於模型結果,根據提前劃分的3 個不同等級的警報規則,依照不同的劣化程度進行判斷,最終實現分級預警。

基於上述流程,將傳統的機理模型偵測方法升級成機理模型結合AI 演算法偵測方法,可將模型誤警報率減少至原來的1/5。

六、問答環節

#Q1:在 AE-GAN 模型中,如何區分正常樣本和例外樣本?

A1:訓練好的AE-GAN 模型,輸入一個樣本到Auto-Encoder 中,得到樣本的重建誤差即異常分數;如果分數小於指定閾值,則認為該樣本正常,反之則為異常樣本。此方法的使用前提是,訓練資料全部為正常樣本資料。

#

Q2:GAN 網路訓練時候,使用的是小樣本故障資料和正常資料的混合資料嗎?兩種數據如何平衡?

A2:GAN 網路訓練時,要麼使用正常數據,要麼使用某種特定模式下的異常數據,不會使用混合資料進行訓練,因此不會出現樣本不均衡這類問題。如果實際資料中兩類資料樣本懸殊,一般會針對正常樣本訓練出一個GAN 網路1,再針對某種固定模式異常樣本訓練出GAN 網路2,並基於這兩種網路的重構誤差對測試樣本進行最終判斷。

Q3:GAN 訓練中會出現模式崩潰嗎?

A3:模式崩潰是 GAN 模型訓練中遇到的最核心的問題。首先要理解模式崩潰,其次要關注 GAN 訓練的核心任務。

模式崩潰#,是生成器產生的資料聚焦在某個特定區域;出現這樣情況的原因是GAN網路中損失函數定義的忽略。 GAN 網路訓練過程中,通常會將 G 網路的損失和 D 網路的損失分開計算,而常常忽略兩個網路的聯合損失函數(即公式中的 JSD 損失)。如果出現訓練模式崩潰情況,往往 JSD 損失並未收斂;因此,在訓練過程中將 JSD 損失進行視覺化,可有效避免模式崩潰情況發生。這也是近期許多改進版的 GAN 模型能夠脫穎而出產生較好效果的原因;此外,在標準 GAN 網路中引入特定 trick,也可以達到類似的效果。

Q4:RNN 隱藏層隨機固定的優點是什麼?

A4:對於正負樣本懸殊的場景,如果使用常用的LSTM、RNN、GRNN 等模型,往往會面臨損失函數不收斂的問題;因此這類問題的處理思路,往往是從無監督學習出發,隨機固定主網絡隱藏層的weight,並使用特定方法對生成的概念矩陣的特徵分量進行正則化處理;雖然weight 參數是隨機的,但是得到的表徵分量可以反映時間序列隱藏的特性,足以對小樣本場景加以區分,以上是RNN 隱藏層隨機固定的優勢。

Q5:介紹下 Conceptor 模型的網路形態。

A5:模型如下圖所示。

蔚來汽車深度學習演算法實踐

#其中,Reservior 部分和一般RNN 網路基本上相同,唯一的不同是 Win #和W 是隨機設定的(注意只隨機產生一次);後續每個時間步長下的神經元隱藏狀態進行計算和更新,並得到對應的概念矩陣。以上是 Conceptor 的完整版形態。

Q6:AE-GAN 中的 Encoder 網路的訓練過程是怎樣的?輸入和輸出分別是什麼?

A6:下圖是 Encoder 網路的訓練過程。

蔚來汽車深度學習演算法實踐

首先會訓練一個標準GAN,並在此基礎上固定G 網路中隱藏層的參數;然後在G網路前插入一個Encoder 網絡,將兩個網路連接形成Auto-Encoder 網路。 Auto-Encoder 網路的輸入是原始的資料樣本,輸出是重構的資料樣本;AE-GAN 網路透過建構重構樣本進而對異常資料進行辨識。

#

Q7:文中所述兩種方法,是否有論文及相關開源程式碼?

A7:論文詳見文章正文相關章節,程式碼暫未開源。

Q8:影像領域可以使用 AE-GAN 進行異常檢測嗎?

A8:可以使用。不過影像領域相比普通的訊號,其維度更高,資料分佈更複雜,訓練所需資料量更大。因此,如果用來作影像分類,且資料樣本較少,模型效果會打折扣;如果用作異常檢測,效果還是不錯的。

Q9:異常偵測的評估指標如何?誤報和漏報,以及兩者一併評價。

A9:評估指標最直觀的就是誤報率和漏報率,更科學的指標包括查全率、查準率、F-score 等。

Q10:如何符合故障樣本特徵?

A10:如果沒有更直接、更快捷的方法得到故障特徵,一般採用純資料驅動的方法進行故障樣本特徵挖掘,一般是建構深度學習網路去學習故障樣本關鍵特徵,並表徵為概念矩陣。

Q11:PHM 演算法如何進行模型選型?

A11:對於少量樣本,一般使用無監督RNN 方法勝場概念矩陣來表徵資料特徵;如果對於異常檢測問題,存在大量正常樣本,則可使用AE-GAN 網路來實現。

Q12:如何透過 RNN 輸出的兩類概念矩陣來辨識異常?

A12:RNN 輸出的概念矩陣,可以理解成輸入的時間序列中所有特徵的集合;由於相同狀態下資料的特徵是相似的,因此將該狀態下所有樣本的概念矩陣作均值聚合,即抽像出該類狀態下的概念中心矩陣;對於未知狀態的輸入時間序列,透過計算其概念矩陣並和概念中心矩陣進行比較,相似度最高的概念中心矩陣即為輸入資料對應的類別。

Q13:AE-GAN 網路中,異常閾值如何設定?

A13:完成網路訓練後,使用小批量正常樣本資料進行重構誤差的計算,並取其中最大值作為閾值。

Q14:AE-GAN 網路中的異常閾值會更新嗎?

A14:一般情況下不會更新,但是如果原始資料分佈發生變化(如運行工況發生變化),則可能需要重新訓練閾值,甚至可能將遷移學習相關方法引入GAN 網路中,對閾值進行微調。

Q15:GAN 是如何訓練時間序列的?

A15:GAN 一般不是訓練原始的時間序列,而是訓練基於原始時間序列提取的特徵。

Q16:AE-GAN 和傳統 GAN 相比,引入 GAN 的作用是什麼?可獲得那些提升?

A16:傳統 GAN 也常用來進行異常檢測。 AE-GAN 對 GAN 的原理剖析更加深入,因此也能最大程度地避免模式坍塌等問題;而 Auto-Encoder 的引入,可確保異常檢測的原理被準確無誤地執行,從而減少誤報率。

Q17:充電樁的時序數據,是否會出現假日整體抬升的情況?如何避免誤判?

A17:故障診斷模型劃分很多層級,模型層的結果僅為決策層的依據而並非最終結果,一般會結合其他業務邏輯輔助判斷。

#

Q18:模型上線後,無監督異常偵測的應用效果如何評估?

A18:一般基於異常偵測的結果,會指定技術專員到現場真實場景中進行確認。

Q19:是否使用文中提到的兩種方法,針對換電站中電池進行異常檢測的嘗試?

A19:正在進行相關的嘗試。

Q20:時序資料如何統一長度?用 0 填充會導致梯度不下降嗎?

A20:文中提到的Conceptor 模型可以處理任意長度的時間序列,因此無需填充0,同時也避免了參數「訓練」過程,因此可以規避這類問題。

Q21:GAN 會出現過擬合的情況嗎?

A21:如果僅用於異常檢測領域,其實越「過度擬合」則模型表現會越好。此外,由於 GAN 模型的 G 網路在訓練過程中存在較大的隨機性,因此一般不會發生過擬合的情況。

Q22:訓練 GAN 模型,使用訓練資料的數量級,一般設定為多少會達到較好的效果?

A22:這類問題一般取決於神經網路的規模,隱藏神經元的維度等。一般來講,對於2 層神經網路、每層100 個神經元這種規模的模型,訓練資料的體積需要比隱藏層維度大1-2 個數量級,才能達到較好的效果,同時還需要使用一些trick 來避免模式坍塌的發生。

Q23:Conceptor 模型中的最小單元隱匿參數固定,是基於專家經驗設定嗎?和普通 RNN 相比,偏差如何?故障分析的標示量是多少?如何做到業務價值量化?

A23:目前上線的許多Conceptor 模型都使用相同的一套經驗參數,沒有進行進一步調參;根據實務經驗來看,相關參數設定從10 到100,對結果的影響差異很小,唯一的差異在於計算成本。如果故障資料的樣本量較小而希望結果更精準,則可將參數設為128、256 甚至更高,相應地,計算成本也會更高。故障分析的標籤量,一般在 1 到 10 之間。業務價值量化,一般用誤警報和漏警報來衡量,因為誤警報和漏警報可以直接折算成定量的業務價值影響。

Q24:如何決定故障開始時間,以及查準率查全率?

A24:可以採用 Conceptor 方法,利用時間成長視窗形成多個概念矩陣;並對概念矩陣進行頻譜聚類,進而確定故障發生時間。詳見 Conceptor 章節相關論文。

Q25:大量的正常資料是不是取值相同?這樣模型會不會重複學習相同的樣本?

A25:在真實的場景下,由於裝置有不同的運作工況,正常的資料往往也是千差萬別的。

Q26:什麼特徵的故障適用 GAN,什麼特徵的故障適用 RNN?

A26:這兩種模型的具體使用場景很難進行明確的劃分;一般來說,GAN 更擅長解決資料分佈特殊、很難用分類網路來刻畫的這類問題,而無監督RNN 更適合處理小樣本問題。

#

Q27:「人員違規行為偵測」這類特殊場景,能否使用本文提到的模型?

A27:對於領域特定場景,如能引入領域特定知識提取高階特徵,則一般是可以的;如果僅使用影像進行檢測,如果影像樣本量很大,且能夠表徵正常行為,則可將問題轉化為CV 領域細分場景檢測,可以使用本文提到的模型加以檢測。

Q28:Conceptor Distance 是相似度判斷嗎?是否是帶參數學習的?

A28:是無參數的。

Q29:每個故障都要訓練一個模型嗎?

A29:要看具體的場景,包括模型的需求、故障的樣本量、以及分佈的複雜度等。如果兩種故障的時序波箱相似性很高,一般無需單獨訓練模型,只需要建立多分類模型確定分類邊界即可;而兩種故障模式的資料形態差異很大,則可藉助GAN 模型進行更精準的識別。

Q30:模型訓練時間和訓練成本如何?

A30:Conceptor 模型的訓練成本很小,可用來提取特徵;GAN 模型訓練時間相對更長一些,不過對於常見的結構化的表格數據,訓練時間也不會太長。

Q31:模型訓練時,正常樣本的訓練集是什麼樣的?時序滑窗切片時,每個時序子集的時間數有最小個數建議嗎?

A31:兩個模型本身對正負樣本的數量都沒有要求;考慮到模型訓練時間,一般近選取上千個具有代表性的樣本進行訓練。時序子集的時間個數一般沒有最小個數建議。

Q32:RNN 網路得到的特徵矩陣維度大概是多少?

A32:特徵矩陣的維度和隱藏神經元的數量直接相關,如果 N 個隱藏神經元,則特徵矩陣的維度為 N×N。考慮到模型的複雜度以及計算效率,一般不會將 N 設得太大,常用的設定值為 32。

Q33:為什麼不使用 GAN 中的判別器作為分類器?判別器只學習正常數據,對異常數據會被分割到虛假數據範疇。這個方法的缺點是什麼?

A33:根據GAN 的原理,D 網路用來區分正常樣本和偽造樣本;而偽造樣本如果訓練成「完全體」狀態,會非常接近正常樣本,造成正常樣本和異常樣本之間難以區分;而AE-GAN 網路假定正常樣本和異常樣本具備一定的區分性,這是使用AE-GAN 的理論基礎。

Q34:小樣本學習的模型如何保證泛化能力?

A34:模型的泛化能力,需要基於一個先驗假設:所有同類型的故障,其資料分佈也是相似的。如果同類故障資料分佈差異較大,則一般需要對故障類別進行進一步的細分,才能確保模型的泛化能力。

Q35:輸入資料需要如何進行資料預處理?

A35:對於文中提到的兩個模型,資料只需進行歸一化即可。

Q36:GAN 和孤立森林、AE 等傳統的無監督方向對比如何?

A36:GAN 透過理論的完備性,更完善地描繪正常樣本資料的分佈情況,由此建構出更完整的決策邊界。而普通的 AE、孤立森林以及 One Class SVM 等方法不具備理論上的完整性,無法建構更完整的決策邊界。

#

Q37:如果判別器在後期幾乎無法判別正常樣本和偽造樣本,那麼 GAN 部分的意義就不大了,此時 AE-GAN 會退化成 AE 嗎?

A37:如果判別器確實無法辨識正常樣本和偽造樣本,從側面可以說明產生器的訓練是很成功的;而在異常檢測階段,只用到生成器而沒有用到判別器。 GAN 網路中生成器的意義重大,因此 AE-GAN 不會退化成 AE,可將其理解成 AE 的升級版,是正規化的 AE。

Q38:有嘗試使用 Transformer 取代 RNN 嗎?

A38:在小樣本、可解釋性要求高的場景下,還沒有這樣的嘗試,後期可能會進行相關嘗試。

Q39:AE-GAN 和 VAE 的差別是什麼?

A39:VAE 也是異常檢測常用的方法,VAE 在隱藏層使用了先驗高斯分佈,並對先驗高斯分佈改變形狀進而擬合真實數據,使得兩個分佈等價;然而VAE 使用的損失函數是KL 散度而不是JSD 散度,而KL 散度是不對稱的,因此在複雜樣例中可能效果不佳。

Q40:實驗中訊號特徵會有資料雜訊嚴重或缺失的情況出現嗎?有哪些較好的特徵清洗的方法?

A40:文中的充電槍案例,就是噪音嚴重的案例。一些基於時間序列的分解方法可以將時間序列中的週期項、趨勢項、雜訊項等分解出來;特徵缺失,可用資料不全的方法進行處理。

Q41:在訓練中可以增加 APA 這類增強策略嗎?

A41:以 GAN 為例,主要是透過增加雜訊的方式進行樣本增強,沒有使用到 APA 增強策略。

Q42:在4.1.(3) 的第二步驟中,如果正常範圍跨越區間很大,假如有  3 個樣本1、2、3,其中樣本1、2 為正常樣本,樣本3 為異常樣本;樣本1 和樣本2 位於正常範圍的兩邊,而樣本3 位於樣本1 旁邊不遠處但是已經超出正常範圍,那麼會不會出現樣本1 和2 之間的重構誤差大於樣本1 和3 的情況?

A42:這篇分享提供的參考文獻中,包含了許多極端的例子,例如你舉出的例子是典型的 two-gaussian ball 的例子。 AE-GAN 可以解決這類問題。

#

以上是蔚來汽車深度學習演算法實踐的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

<🎜>:泡泡膠模擬器無窮大 - 如何獲取和使用皇家鑰匙
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
北端:融合系統,解釋
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
Mandragora:巫婆樹的耳語 - 如何解鎖抓鉤
3 週前 By 尊渡假赌尊渡假赌尊渡假赌

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Java教學
1664
14
CakePHP 教程
1423
52
Laravel 教程
1321
25
PHP教程
1269
29
C# 教程
1249
24
一文帶您了解SHAP:機器學習的模型解釋 一文帶您了解SHAP:機器學習的模型解釋 Jun 01, 2024 am 10:58 AM

在機器學習和資料科學領域,模型的可解釋性一直是研究者和實踐者關注的焦點。隨著深度學習和整合方法等複雜模型的廣泛應用,理解模型的決策過程變得尤為重要。可解釋人工智慧(ExplainableAI|XAI)透過提高模型的透明度,幫助建立對機器學習模型的信任和信心。提高模型的透明度可以透過多種複雜模型的廣泛應用等方法來實現,以及用於解釋模型的決策過程。這些方法包括特徵重要性分析、模型預測區間估計、局部可解釋性演算法等。特徵重要性分析可以透過評估模型對輸入特徵的影響程度來解釋模型的決策過程。模型預測區間估計

超越ORB-SLAM3! SL-SLAM:低光、嚴重抖動和弱紋理場景全搞定 超越ORB-SLAM3! SL-SLAM:低光、嚴重抖動和弱紋理場景全搞定 May 30, 2024 am 09:35 AM

寫在前面今天我們探討下深度學習技術如何改善在複雜環境中基於視覺的SLAM(同時定位與地圖建構)表現。透過將深度特徵提取和深度匹配方法相結合,這裡介紹了一種多功能的混合視覺SLAM系統,旨在提高在諸如低光條件、動態光照、弱紋理區域和嚴重抖動等挑戰性場景中的適應性。我們的系統支援多種模式,包括拓展單目、立體、單目-慣性以及立體-慣性配置。除此之外,也分析如何將視覺SLAM與深度學習方法結合,以啟發其他研究。透過在公共資料集和自採樣資料上的廣泛實驗,展示了SL-SLAM在定位精度和追蹤魯棒性方面優

使用C++實現機器學習演算法:常見挑戰及解決方案 使用C++實現機器學習演算法:常見挑戰及解決方案 Jun 03, 2024 pm 01:25 PM

C++中機器學習演算法面臨的常見挑戰包括記憶體管理、多執行緒、效能最佳化和可維護性。解決方案包括使用智慧指標、現代線程庫、SIMD指令和第三方庫,並遵循程式碼風格指南和使用自動化工具。實作案例展示如何利用Eigen函式庫實現線性迴歸演算法,有效地管理記憶體和使用高效能矩陣操作。

你所不知道的機器學習五大學派 你所不知道的機器學習五大學派 Jun 05, 2024 pm 08:51 PM

機器學習是人工智慧的重要分支,它賦予電腦從數據中學習的能力,並能夠在無需明確編程的情況下改進自身能力。機器學習在各個領域都有廣泛的應用,從影像辨識和自然語言處理到推薦系統和詐欺偵測,它正在改變我們的生活方式。機器學習領域存在著多種不同的方法和理論,其中最具影響力的五種方法被稱為「機器學習五大派」。這五大派分別為符號派、聯結派、進化派、貝葉斯派和類推學派。 1.符號學派符號學(Symbolism),又稱符號主義,強調利用符號進行邏輯推理和表達知識。該學派認為學習是一種逆向演繹的過程,透過現有的

Flash Attention穩定嗎? Meta、哈佛發現其模型權重偏差呈現數量級波動 Flash Attention穩定嗎? Meta、哈佛發現其模型權重偏差呈現數量級波動 May 30, 2024 pm 01:24 PM

MetaFAIR聯合哈佛優化大規模機器學習時所產生的資料偏差,提供了新的研究架構。據所周知,大語言模型的訓練常常需要數月的時間,使用數百甚至上千個GPU。以LLaMA270B模型為例,其訓練總共需要1,720,320個GPU小時。由於這些工作負載的規模和複雜性,導致訓練大模型存在著獨特的系統性挑戰。最近,許多機構在訓練SOTA生成式AI模型時報告了訓練過程中的不穩定情況,它們通常以損失尖峰的形式出現,例如Google的PaLM模型訓練過程中出現了多達20次的損失尖峰。數值偏差是造成這種訓練不準確性的根因,

可解釋性人工智慧:解釋複雜的AI/ML模型 可解釋性人工智慧:解釋複雜的AI/ML模型 Jun 03, 2024 pm 10:08 PM

譯者|李睿審校|重樓人工智慧(AI)和機器學習(ML)模型如今變得越來越複雜,這些模型產生的產出是黑盒子-無法向利害關係人解釋。可解釋性人工智慧(XAI)致力於透過讓利害關係人理解這些模型的工作方式來解決這個問題,確保他們理解這些模型實際上是如何做出決策的,並確保人工智慧系統中的透明度、信任度和問責制來解決這個問題。本文探討了各種可解釋性人工智慧(XAI)技術,以闡明它們的基本原理。可解釋性人工智慧至關重要的幾個原因信任度和透明度:為了讓人工智慧系統被廣泛接受和信任,使用者需要了解決策是如何做出的

AlphaFold 3 重磅問世,全面預測蛋白質與所有生命分子相互作用及結構,準確度遠超以往水平 AlphaFold 3 重磅問世,全面預測蛋白質與所有生命分子相互作用及結構,準確度遠超以往水平 Jul 16, 2024 am 12:08 AM

编辑|萝卜皮自2021年发布强大的AlphaFold2以来,科学家们一直在使用蛋白质结构预测模型来绘制细胞内各种蛋白质结构的图谱、发现药物,并绘制每种已知蛋白质相互作用的「宇宙图」。就在刚刚,GoogleDeepMind发布了AlphaFold3模型,该模型能够对包括蛋白质、核酸、小分子、离子和修饰残基在内的复合物进行联合结构预测。AlphaFold3的准确性对比过去许多专用工具(蛋白质-配体相互作用、蛋白质-核酸相互作用、抗体-抗原预测)有显著提高。这表明,在单个统一的深度学习框架内,可以实现

改進的檢測演算法:用於高解析度光學遙感影像目標檢測 改進的檢測演算法:用於高解析度光學遙感影像目標檢測 Jun 06, 2024 pm 12:33 PM

01前景概要目前,難以在檢測效率和檢測結果之間取得適當的平衡。我們研究了一種用於高解析度光學遙感影像中目標偵測的增強YOLOv5演算法,利用多層特徵金字塔、多重偵測頭策略和混合注意力模組來提高光學遙感影像的目標偵測網路的效果。根據SIMD資料集,新演算法的mAP比YOLOv5好2.2%,比YOLOX好8.48%,在偵測結果和速度之間達到了更好的平衡。 02背景&動機隨著遠感技術的快速發展,高解析度光學遠感影像已被用於描述地球表面的許多物體,包括飛機、汽車、建築物等。目標檢測在遠感影像的解釋中

See all articles