論文筆記—LSTM-based Anomaly Detection on Big Data for Smart Factory Monitoring?
基于lstm的智能工廠監(jiān)控大數(shù)據(jù)異常檢測(cè)
本文提出了一種基于大數(shù)據(jù)的機(jī)器學(xué)習(xí)方法來(lái)分析時(shí)間序列數(shù)據(jù),用于工業(yè)復(fù)雜系統(tǒng)的異常檢測(cè)。長(zhǎng)短時(shí)記憶(LSTM)網(wǎng)絡(luò)已被證明是RNN的改進(jìn)版本,并已成為許多任務(wù)的有效輔助。基于LSTM的模型學(xué)習(xí)了更高層次的時(shí)間特征和時(shí)間模式,然后利用預(yù)測(cè)器對(duì)未來(lái)的數(shù)據(jù)進(jìn)行預(yù)測(cè)。預(yù)測(cè)誤差是預(yù)測(cè)器的預(yù)測(cè)輸出與實(shí)際輸入值的差值。利用高斯分布建立了誤差分布估計(jì)模型,計(jì)算了觀測(cè)值的異常值。這樣,我們就從單一異常的概念過(guò)渡到集體異常的概念。該工作可以協(xié)助智能工廠的監(jiān)控和管理,將故障最小化,提高制造質(zhì)量.
Ⅰ. Introduction
為充分利用信息技術(shù)、電氣電子技術(shù)以及先進(jìn)制造技術(shù)的快速發(fā)展優(yōu)勢(shì),政府作為工業(yè)4.0[1]的名稱,一直在研究將制造企業(yè)的生產(chǎn)方式從數(shù)字化向智能化轉(zhuǎn)變的資源。這種情況導(dǎo)致在復(fù)雜系統(tǒng)中占主導(dǎo)地位,其中有成百上千的工業(yè)部件,子系統(tǒng)在復(fù)雜的連接中一起工作。結(jié)果,來(lái)自工業(yè)過(guò)程的監(jiān)控?cái)?shù)據(jù)量、智能工廠的[2]不斷增加。這就需要一個(gè)智能系統(tǒng)來(lái)讓管理人員對(duì)這些收集到的數(shù)據(jù)進(jìn)行心理處理,從而發(fā)現(xiàn)工廠中整個(gè)組件的事件或運(yùn)行狀態(tài)。大數(shù)據(jù)與運(yùn)營(yíng)技術(shù)戰(zhàn)略的結(jié)合運(yùn)用,目前正在揭示包括轉(zhuǎn)型過(guò)程、資產(chǎn)健康、能源、安全、監(jiān)管和質(zhì)量改進(jìn)在內(nèi)的商業(yè)洞見(jiàn)。與大數(shù)據(jù)分析一樣,最大的挑戰(zhàn)之一就是以可伸縮、可靠和一致的方式收集數(shù)據(jù)。我們將在下一節(jié)介紹Hadoop提供的支持流、存儲(chǔ)和查詢的可用工具大數(shù)據(jù)框架。
近年來(lái),基于計(jì)算機(jī)、網(wǎng)絡(luò)數(shù)據(jù)通信和圖形用戶界面的工業(yè)過(guò)程監(jiān)控與數(shù)據(jù)采集(SCADA)系統(tǒng)對(duì)工業(yè)過(guò)程進(jìn)行監(jiān)控,實(shí)現(xiàn)了對(duì)工業(yè)過(guò)程的高層次監(jiān)控管理,使工業(yè)過(guò)程監(jiān)控變得越來(lái)越復(fù)雜。這使得實(shí)時(shí)做出正確決策的過(guò)程變得非常困難和更具挑戰(zhàn)性。多年來(lái),許多制造系統(tǒng)集成了使用傳感器進(jìn)行大數(shù)據(jù)流傳輸?shù)腟CADA系統(tǒng)。這些數(shù)據(jù)集包含有關(guān)此類系統(tǒng)狀態(tài)的有用線索和信息。因此,我們應(yīng)該有效地利用這一資源進(jìn)行監(jiān)測(cè)系統(tǒng)和實(shí)時(shí)異常識(shí)別和檢測(cè)。工業(yè)過(guò)程、電力工業(yè)、配水和煉油廠等需要連續(xù)監(jiān)測(cè)和控制的使用控制和數(shù)據(jù)采集(SCADA)系統(tǒng)的幾個(gè)例子。他們中的許多人控制著國(guó)家的關(guān)鍵部件,如核能發(fā)電、公共交通、污水處理廠等。我們證明了智能系統(tǒng)的管理和維護(hù)是棘手的,因此我們需要一個(gè)高效的流程,涵蓋實(shí)時(shí)信息傳輸、分析和決策框架,并有大數(shù)據(jù)分析的潛在支持。這是本文的主要目的,旨在進(jìn)行異常識(shí)別和及時(shí)報(bào)警。此外,我們希望利用現(xiàn)代機(jī)器學(xué)習(xí)技術(shù),生成關(guān)于系統(tǒng)中發(fā)生異常的知識(shí),即時(shí)發(fā)出警告/報(bào)警。換句話說(shuō),我們正在嘗試自動(dòng)化實(shí)時(shí)/接近實(shí)時(shí)的情況分析。
針對(duì)這一問(wèn)題,研究目標(biāo)是受時(shí)間驅(qū)動(dòng)的,采用基于機(jī)器學(xué)習(xí)的方法處理序列數(shù)據(jù)是有意義的。請(qǐng)記住,機(jī)器學(xué)習(xí)(ML)應(yīng)該是現(xiàn)代工業(yè)信息與控制系統(tǒng)[2]的核心部件之一。本研究工作將探索復(fù)雜系統(tǒng)中子系統(tǒng)退化狀態(tài)的隱式信息,識(shí)別運(yùn)行過(guò)程中的異常事件,實(shí)現(xiàn)實(shí)時(shí)維護(hù)規(guī)劃程序[5]。實(shí)時(shí)維護(hù)對(duì)于節(jié)約成本和提高設(shè)備的可用性非常有用。在現(xiàn)實(shí)世界中,諸如發(fā)動(dòng)機(jī)、工業(yè)子系統(tǒng)、可操作部件等機(jī)械設(shè)備通常由各種物理傳感器來(lái)記錄目標(biāo)的行為和狀態(tài)。根據(jù)監(jiān)測(cè)信號(hào),專家可以確定當(dāng)前的狀態(tài)和他們的健康程度。例如,我們分析來(lái)自傳感器內(nèi)置智能工廠的信號(hào),以識(shí)別出哪里出了問(wèn)題,需要更換和修復(fù)。對(duì)于運(yùn)行過(guò)程中的監(jiān)控狀態(tài),我們希望能夠區(qū)分所考慮的系統(tǒng)[1]的正常狀態(tài)和異常狀態(tài)。通常,異常檢測(cè)是不符合給定數(shù)據(jù)集的期望模式的數(shù)據(jù)點(diǎn)、模式、觀察或事件的標(biāo)識(shí)。使用異常檢測(cè)系統(tǒng)對(duì)行為分析非常有幫助,或支持其他類型的分析,如檢測(cè)、識(shí)別和預(yù)測(cè)這些異常的發(fā)生。然而,在許多情況下,正常數(shù)據(jù)并不總是能夠與正常數(shù)據(jù)進(jìn)行比較,因此基于正常信號(hào)的異常檢測(cè)變得很有挑戰(zhàn)性。該方法采用預(yù)測(cè)模型進(jìn)行異常檢測(cè)。
為了通過(guò)異常檢測(cè),立即修復(fù),系統(tǒng)維護(hù),減少智能工廠的計(jì)劃外故障,我們必須預(yù)先了解零件在正常情況下的行為,然后識(shí)別出異常狀態(tài)。因此,基于機(jī)器學(xué)習(xí)的大數(shù)據(jù)分析集成框架是一個(gè)目標(biāo)。此外,還將提出復(fù)雜系統(tǒng)的實(shí)時(shí)異常檢測(cè)問(wèn)題。這將通過(guò)使用未來(lái)值、預(yù)測(cè)模型的輸出來(lái)實(shí)現(xiàn)。該預(yù)測(cè)器使用數(shù)據(jù)庫(kù)中歷史SCADA傳感器數(shù)據(jù)中的源/控制部件退化信息作為輸入數(shù)據(jù)進(jìn)行建模。擬議框架的成功實(shí)施將使維修計(jì)劃、檢查和維修更快,成本也更低,因?yàn)橄擞?jì)劃外維修時(shí)間表[3]引起的停機(jī)時(shí)間。
本文其余部分的配置如下:第2節(jié)簡(jiǎn)要介紹Hadoop框架的背景、大數(shù)據(jù)中的機(jī)器學(xué)習(xí)以及基于機(jī)器學(xué)習(xí)的異常方法文獻(xiàn)。第三部分重點(diǎn)介紹了提出的框架,設(shè)計(jì)了LSTM體系結(jié)構(gòu)作為異常檢測(cè)事件的預(yù)測(cè)器,如何離線訓(xùn)練模型,部署在線異常檢測(cè)算法。然后,第四部分的主要內(nèi)容是應(yīng)用不同領(lǐng)域的數(shù)據(jù)來(lái)研究性能。最后,在第五部分,我們總結(jié)和討論未來(lái)的工作。
Ⅱ. Related Works
綜上所述,有必要將大數(shù)據(jù)分析技術(shù)集成到基于SCADA的系統(tǒng)中進(jìn)行實(shí)時(shí)監(jiān)測(cè)、異常檢測(cè)。本節(jié)首先介紹大數(shù)據(jù)平臺(tái)的概念,大數(shù)據(jù)平臺(tái)在整個(gè)系統(tǒng)中起著至關(guān)重要的作用。接下來(lái)是如何在大數(shù)據(jù)中使用機(jī)器學(xué)習(xí)技術(shù)。最后,介紹了機(jī)器學(xué)習(xí)技術(shù)在時(shí)間序列數(shù)據(jù)學(xué)習(xí)中的應(yīng)用背景及其在異常檢測(cè)中的應(yīng)用。
2-1 Big Data framework
在工業(yè)操作中,認(rèn)識(shí)到數(shù)據(jù)的數(shù)量和頻率與典型的業(yè)務(wù)提要有很大的不同是非常重要的,因?yàn)橛糜诓僮鞯膫鞲衅鞯臄?shù)量可以數(shù)以百萬(wàn)計(jì),并且需要長(zhǎng)期的歸檔、索引和報(bào)告。Hadoop框架目前正在成為大數(shù)據(jù)分析以及分布式數(shù)據(jù)、流數(shù)據(jù)的最佳選擇。Hadoop生態(tài)系統(tǒng)是我們工作的一個(gè)很好的選擇,因?yàn)樗梢蕴幚矸植际酱髷?shù)據(jù)。Hadoop生態(tài)系統(tǒng)框架既包含官方Apache開源項(xiàng)目,又包含各種商業(yè)工具和組件,在解決大數(shù)據(jù)情況下的問(wèn)題方面具有熟練的優(yōu)勢(shì)。也許,每個(gè)組件都是按照各自的目標(biāo)用不同的體系結(jié)構(gòu)開發(fā)的;然而,將它們聚集在一個(gè)屋檐下的原因是,它們的功能都來(lái)自Hadoop的可伸縮性和強(qiáng)大功能。Hadoop生態(tài)系統(tǒng)由四個(gè)不同的層組成:數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)處理、數(shù)據(jù)訪問(wèn)或數(shù)據(jù)管理。如上圖所示,Hadoop框架包含了MapReduce[7]、Yarn、Flume[8]、Hive[9]、Pig、Sqoop、Oozie、Zookeeper、HBase等不同的功能模塊。取決于Hadoop上的應(yīng)用程序
集群,我們可以使用這個(gè)或另一個(gè)來(lái)滿足需求。例如,Hive是一種SQL方言,Pig是一種數(shù)據(jù)流語(yǔ)言,用于隱藏在更適合用戶目標(biāo)的高級(jí)抽象后面創(chuàng)建MapReduce作業(yè)的單調(diào)。HBase是一個(gè)運(yùn)行在HDFS之上的面向NoSQL列的數(shù)據(jù)庫(kù)管理系統(tǒng)。Sqoop用于在關(guān)系數(shù)據(jù)庫(kù)和Hadoop之間傳輸數(shù)據(jù)。此外,我們還使用額外的齊柏林飛艇[10]作為分布式、通用數(shù)據(jù)處理系統(tǒng)的協(xié)作數(shù)據(jù)分析和可視化工具。
2-2大數(shù)據(jù)機(jī)器學(xué)習(xí)
機(jī)器學(xué)習(xí)(ML)在學(xué)習(xí)能力的各種應(yīng)用中不斷展示著它的強(qiáng)大功能。[11]指出,大數(shù)據(jù)使ML算法能夠發(fā)現(xiàn)更多的細(xì)粒度模式,并比以往任何時(shí)候都更及時(shí)和準(zhǔn)確地執(zhí)行。本研究還介紹了一個(gè)基于大數(shù)據(jù)的機(jī)器學(xué)習(xí)框架,如圖1所示。它包含四個(gè)交互的、不同的組件,包括大數(shù)據(jù)、用戶、域和系統(tǒng)??傊髷?shù)據(jù)將為培訓(xùn)階段提供培訓(xùn)數(shù)據(jù),培訓(xùn)階段生成輸出模型或意義信息,這些信息可以返回成為大數(shù)據(jù)的一部分。此外,用戶可以通過(guò)提供領(lǐng)域知識(shí)、個(gè)人偏好和響應(yīng)[11]來(lái)反饋或與ML交互,從而利用性能。而領(lǐng)域既可以作為指導(dǎo)ML的知識(shí)來(lái)源,也可以作為應(yīng)用所學(xué)模型的上下文;系統(tǒng)架構(gòu)對(duì)學(xué)習(xí)算法的運(yùn)行方式和運(yùn)行效率有影響,同時(shí)滿足ML可能導(dǎo)致系統(tǒng)架構(gòu)的共同設(shè)計(jì)。

ML是揭示如何通過(guò)經(jīng)驗(yàn)[12]自動(dòng)改進(jìn)計(jì)算機(jī)系統(tǒng)的過(guò)程。數(shù)據(jù)預(yù)處理、學(xué)習(xí)模型和評(píng)價(jià)三個(gè)主要部分。預(yù)處理塊負(fù)責(zé)將原始數(shù)據(jù)準(zhǔn)備為過(guò)濾后的數(shù)據(jù),結(jié)構(gòu)化格式的下一步。將這些數(shù)據(jù)轉(zhuǎn)換成一種形式,通過(guò)清洗、提取特征和融合來(lái)作為學(xué)習(xí)的輸入。學(xué)習(xí)塊主要是選擇學(xué)習(xí)算法,對(duì)模型參數(shù)進(jìn)行調(diào)優(yōu),得到期望的模型。在實(shí)際應(yīng)用前,通過(guò)評(píng)價(jià)步驟對(duì)訓(xùn)練后的模型進(jìn)行性能評(píng)價(jià)
2-3 Machine Learning based Anomaly detection
近年來(lái),基于深度神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)成為熱門趨勢(shì),成為機(jī)器學(xué)習(xí)中增長(zhǎng)最快、最令人興奮的領(lǐng)域之一,尤其是與大數(shù)據(jù)合作發(fā)現(xiàn)隱藏信息。與生物神經(jīng)的操作方式類似,神經(jīng)網(wǎng)絡(luò)是由相互連接的神經(jīng)元組成的一系列模型,這些神經(jīng)元之間的連接可以調(diào)整并適應(yīng)輸入。深度神經(jīng)網(wǎng)絡(luò)是指具有多個(gè)隱含層的神經(jīng)網(wǎng)絡(luò),或者稱為深層結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò),為了提高高層特征學(xué)習(xí)能力,每一層都可以對(duì)上一層的輸出進(jìn)行非線性變換,得到輸出[11],同時(shí)也可以作為下一層的輸入。工業(yè)廠房傳感器數(shù)據(jù)是時(shí)間序列數(shù)據(jù)的典型實(shí)例。我們需要分析它們背后隱藏的信息來(lái)理解序列模式的行為,并確定被認(rèn)為是異常模式的異常值模式。傳統(tǒng)的異常檢測(cè)方法通常是基于統(tǒng)計(jì)測(cè)度的,我們必須識(shí)別給定數(shù)據(jù)中的不規(guī)則性,標(biāo)記出偏離分布的常見(jiàn)統(tǒng)計(jì)屬性(包括均值、中值、模式和數(shù)量[13])的數(shù)據(jù)點(diǎn)。由于特征來(lái)自于特殊的單元“記憶單元”[14]LSTM神經(jīng)網(wǎng)絡(luò),因此它也被用來(lái)克服遞歸神經(jīng)網(wǎng)絡(luò)(RNN)所經(jīng)歷的消失梯度問(wèn)題。LSTM網(wǎng)絡(luò)是遞歸神經(jīng)網(wǎng)絡(luò)(RNN)[15]的改進(jìn)版本,由于具有學(xué)習(xí)長(zhǎng)期依賴關(guān)系的能力,已被用于許多序列學(xué)習(xí)任務(wù)。[16]提出了一種非監(jiān)督的方法來(lái)檢測(cè)集體水平上的異常。這在概率上聚集了單個(gè)異常對(duì)檢測(cè)顯著異常組的貢獻(xiàn)。由于采用無(wú)監(jiān)督的集體異常評(píng)分方式,可以采用無(wú)監(jiān)督和監(jiān)督兩種方法對(duì)個(gè)體異常進(jìn)行評(píng)分。在移動(dòng)起重機(jī)和油耗數(shù)據(jù)集上對(duì)模型進(jìn)行了評(píng)估。在聲新奇檢測(cè)方面,[17]提出了一種基于LSTM的非線性預(yù)測(cè)去噪自編碼器(DA)分離異常聲信號(hào)的新方法。長(zhǎng)短時(shí)記憶(LSTM)循環(huán)去噪自編碼器根據(jù)前一幀預(yù)測(cè)下一幀的聽(tīng)覺(jué)光譜特征。自動(dòng)編碼器的輸入與輸出之間的重構(gòu)誤差作為一種激活信號(hào),起著檢測(cè)新穎信號(hào)的作用。在[14]中,Malhotra等人使用LSTM網(wǎng)絡(luò)對(duì)時(shí)間序列數(shù)據(jù)進(jìn)行異常檢測(cè)。疊置LSTM網(wǎng)絡(luò)只對(duì)正常數(shù)據(jù)進(jìn)行訓(xùn)練,經(jīng)過(guò)一定的時(shí)間步長(zhǎng)生成預(yù)測(cè)器。對(duì)誤差信號(hào)的分布概率進(jìn)行估計(jì),并對(duì)異常評(píng)分的可能性進(jìn)行評(píng)估?;贚STM的異常分類器可分為正常分類器和異常分類器兩類。事實(shí)上,記錄異常數(shù)據(jù)的成本很高,甚至?xí)骨闆r變得危險(xiǎn)而無(wú)法控制。培訓(xùn)班之間的平衡并不能保證。從[14]的思想和基于窗口的自適應(yīng)誤差測(cè)量方法[18]的具體應(yīng)用出發(fā),本文采用LSTM建立異常系統(tǒng)的預(yù)測(cè)模型是較好的選擇。該異常功能可以集成到基于監(jiān)視控制和數(shù)據(jù)采集(SCADA)[19]的工廠系統(tǒng)中,從工業(yè)設(shè)備中收集傳感器數(shù)據(jù),分析和發(fā)現(xiàn)信息,并通過(guò)SCADA或儀表板網(wǎng)站進(jìn)行可視化或報(bào)警
Ⅲ.System Overview
3-1 Overview Framework
圖2為集成到智能工業(yè)工廠的實(shí)時(shí)異常檢測(cè)框架。在物理和環(huán)境應(yīng)力作用下,制造系統(tǒng)的任何部位都可能發(fā)生異常。為了保持制造系統(tǒng)的效率,為更智能的決策處理數(shù)據(jù)和減少停機(jī)時(shí)間,SCADA系統(tǒng)對(duì)于工業(yè)組織來(lái)說(shuō)變得至關(guān)重要。它們有助于控制本地和遠(yuǎn)程的工業(yè)過(guò)程。如圖所示,SCADA塊直接與傳感器、閥門、泵、電機(jī)等設(shè)備交互,監(jiān)控、收集、記錄事件到數(shù)據(jù)庫(kù)中,并支持處理實(shí)時(shí)數(shù)據(jù)。交互可以通過(guò)人機(jī)界面(HMI)軟件進(jìn)行。在實(shí)驗(yàn)中,我們使用了一種數(shù)據(jù)庫(kù)可視化事件的解決方案。該框架還對(duì)來(lái)自智能工廠的大數(shù)據(jù)(通過(guò)內(nèi)置的狀態(tài)監(jiān)測(cè)傳感器(CMS)從所有組件發(fā)送信號(hào))進(jìn)行基于機(jī)器學(xué)習(xí)的異常檢測(cè),然后將這些傳感器數(shù)據(jù)存儲(chǔ)到結(jié)構(gòu)數(shù)據(jù)庫(kù)或非結(jié)構(gòu)化數(shù)據(jù)中,用于大數(shù)據(jù)/云計(jì)算。

這些數(shù)據(jù)的處理對(duì)于組件未來(lái)狀態(tài)的預(yù)測(cè)至關(guān)重要,這是通過(guò)使用屬于機(jī)器學(xué)習(xí)技術(shù)的不同模型來(lái)對(duì)數(shù)據(jù)建模來(lái)實(shí)現(xiàn)的。我們將在后面詳細(xì)介紹基于機(jī)器學(xué)習(xí)的方法。在得到該模型時(shí),我們將其應(yīng)用于預(yù)測(cè)過(guò)程、異常檢測(cè)算法或向人工操作者發(fā)布預(yù)警公告,以便于快速修復(fù)解決方案。在智能工廠中,必須配備閉路電視系統(tǒng),以協(xié)助管理員有效地管理工廠。當(dāng)檢測(cè)到異常時(shí),通過(guò)SCADA的自動(dòng)化程序可以在異常發(fā)生的位置激活多個(gè)攝像機(jī)。對(duì)于高質(zhì)量的流媒體視頻,智能工廠可以為多視圖攝像系統(tǒng)提供先進(jìn)的多視圖視頻編碼(MVC)等技術(shù)。該技術(shù)將多攝像機(jī)的視圖組合在一起,形成異常位置的概覽,以支持適當(dāng)?shù)姆磻?yīng)。如果我們想從遙遠(yuǎn)的地方監(jiān)控工廠,移動(dòng)邊緣計(jì)算(MEC)將是智能制造的解決方案。MEC使制造商能夠利用機(jī)器生成的大數(shù)據(jù),形成有洞察力和可操作的數(shù)據(jù)。更具體地說(shuō),MEC充當(dāng)控制中心和智能工廠之間的中間層。例如,監(jiān)控視頻是用超高質(zhì)量(4K)錄制的,無(wú)法有效地傳輸?shù)娇刂浦行?。MEC支持兩個(gè)位置之間的編碼/解碼。特別是,MEC可以減少延遲,這在實(shí)時(shí)SCADA系統(tǒng)中是至關(guān)重要的。
3-2 Long Short Term Memory Network
遞歸神經(jīng)網(wǎng)絡(luò)(RNN)是由細(xì)胞單元之間的連接(注釋為a)沿序列生成有向圖的一類人工神經(jīng)網(wǎng)絡(luò)。這種結(jié)構(gòu)有助于處理時(shí)間序列數(shù)據(jù)的時(shí)間行為,而不是只處理靜態(tài)輸入數(shù)據(jù)。由于能夠隨著時(shí)間的推移記住相關(guān)事件,RNN使自己比傳統(tǒng)的前饋網(wǎng)絡(luò)更具動(dòng)態(tài)性。我們想象這樣的網(wǎng)絡(luò)是有循環(huán)結(jié)構(gòu)的,它允許信息沿著時(shí)間軸持續(xù)存在,如圖3所示。

我們看到,遞歸神經(jīng)網(wǎng)絡(luò)在時(shí)間序列預(yù)測(cè)、音樂(lè)節(jié)奏檢測(cè)、語(yǔ)音識(shí)別、語(yǔ)言模型、機(jī)器翻譯等方面的應(yīng)用越來(lái)越廣泛。然而,由于相關(guān)信息之間存在著許多實(shí)際問(wèn)題,且存在較長(zhǎng)時(shí)間的滯后性,使得RNNs的學(xué)習(xí)十分困難。反向傳播誤差的快速衰減是造成這一問(wèn)題的主要原因。這就是為什么我們認(rèn)為長(zhǎng)、短期記憶網(wǎng)絡(luò)是RNN的一個(gè)特殊版本,它通過(guò)強(qiáng)制執(zhí)行錯(cuò)誤恒流來(lái)發(fā)揮解決方案的作用。幾乎所有基于遞歸神經(jīng)網(wǎng)絡(luò)的激動(dòng)人心的結(jié)果都來(lái)自于LSTM, LSTM是一種特殊的遞歸神經(jīng)網(wǎng)絡(luò),在許多任務(wù)上都比標(biāo)準(zhǔn)的遞歸神經(jīng)網(wǎng)絡(luò)有效得多。
因此,我們將在下一節(jié)中探討LSTMs以及它在異常檢測(cè)任務(wù)中的應(yīng)用。遞歸神經(jīng)網(wǎng)絡(luò)最初具有長(zhǎng)期記憶,是指信息從原來(lái)的細(xì)胞傳遞到現(xiàn)在的細(xì)胞。因此,一個(gè)被稱為長(zhǎng)短時(shí)記憶[15]的擴(kuò)展模型將繼承這種自然特性;此外,它能夠處理長(zhǎng)時(shí)間序列。與標(biāo)準(zhǔn)的RNNs一樣,LSTMs也具有這種帶有重復(fù)模塊的鏈狀結(jié)構(gòu),但是重復(fù)模塊的內(nèi)部結(jié)構(gòu)不同。它不是只有一個(gè)單一的神經(jīng)網(wǎng)絡(luò)層,而是包含四個(gè)層,在特殊的過(guò)程[20]中交互,如圖4所示。

LSTM單元有幾種體系結(jié)構(gòu),但一般的體系結(jié)構(gòu)受內(nèi)存單元、輸入門、輸出門和遺忘門的開/關(guān)狀態(tài)控制。刪除或向單元狀態(tài)添加信息的選項(xiàng)取決于稱為gate的結(jié)構(gòu)的操作,它根據(jù)接收到的信號(hào)運(yùn)行。LSTM門通常使用邏輯函數(shù)來(lái)計(jì)算激活。直覺(jué)上,輸入門控制的一個(gè)新值流入細(xì)胞,忘記門控制的程度值仍然在細(xì)胞中,和輸出門控制的程度細(xì)胞中的值用于計(jì)算輸出的激活LSTM單位。作為神經(jīng)網(wǎng)絡(luò)節(jié)點(diǎn)的思想,門結(jié)構(gòu)用自己的一組權(quán)值來(lái)阻塞或傳遞信息。這些權(quán)重,就像調(diào)節(jié)輸入和隱藏狀態(tài)的權(quán)重一樣,是通過(guò)循環(huán)網(wǎng)絡(luò)學(xué)習(xí)過(guò)程來(lái)調(diào)整的。猜測(cè)、反向傳播誤差和調(diào)整權(quán)重的學(xué)習(xí)迭代過(guò)程仍然是基于梯度下降的
3-3 LSTM based approach for anomaly detection
采用LSTM-RNN作為序列預(yù)測(cè)模型,以時(shí)間序列形式輸入數(shù)據(jù)。在本研究中,我們使用訓(xùn)練后的模型來(lái)估計(jì)預(yù)測(cè)誤差的分布。預(yù)測(cè)誤差模型驗(yàn)證了異常行為的可能性。我們的方法克服了許多異常數(shù)據(jù)不足的情況下的局限性。異常識(shí)別的整個(gè)流程如圖5所示。

假設(shè)時(shí)序數(shù)據(jù)X,長(zhǎng)度為L(zhǎng),每個(gè)x是一個(gè)m維向量
該體系結(jié)構(gòu)由三個(gè)堆疊的LSTM層組成,LSTM層的單元數(shù)分別為{64,256,100},如圖6所示,之后是一個(gè)完全連接的層。我們還使用dropout操作0.2(20%)在每一層之間進(jìn)行正則化。此外,我們可以在預(yù)測(cè)配置中使用一個(gè)以上的前瞻步驟,因?yàn)轭A(yù)測(cè)精度仍然得到保證。如果不是必須的,我們應(yīng)該將前瞻性步驟定義為1。The 正常 訓(xùn)練 用于 預(yù)測(cè) models. 學(xué)習(xí)我們使用Adam optimizer,學(xué)習(xí)率為0.1。我們還配置了100個(gè)提前停止的訓(xùn)練腳本,得到了用于異常檢測(cè)算法的訓(xùn)練模型。
The 誤差 向量 計(jì)算 正常 validation-1 時(shí)間 序列 被 用來(lái) 估計(jì) , ∑ Normal 分布 使用 Maximum Likelihood Estimation (MLE) algorithm. The 閾 值 選擇 與 最大 .

where, P 是 precision, R 召回 在 驗(yàn)證 序列 和 。我們認(rèn)為異常候選人屬于積極類,正常候選人屬于消極類。我們認(rèn)為異常候選人屬于積極類,正常候選人屬于消極類。

為了在實(shí)時(shí)/流模式下檢測(cè)異常,我們提出了一種實(shí)時(shí)異常檢測(cè)算法,利用數(shù)據(jù)庫(kù)中存儲(chǔ)的歷史數(shù)據(jù)訓(xùn)練分類器模型、預(yù)測(cè)器模型和誤差模型來(lái)處理流數(shù)據(jù)。根據(jù)培訓(xùn)數(shù)據(jù)的時(shí)序,將其劃分為批量學(xué)習(xí),學(xué)習(xí)整個(gè)培訓(xùn)數(shù)據(jù)。而在線學(xué)習(xí)則可以實(shí)現(xiàn)基于每個(gè)新輸入的模型更新。

算法1稱為“實(shí)時(shí)異常檢測(cè)”,它同時(shí)使用預(yù)測(cè)模型和誤差分布模型來(lái)檢測(cè)事件的時(shí)間信息。在進(jìn)行實(shí)時(shí)異常檢測(cè)之前,對(duì)基于LSTM-RNN的預(yù)測(cè)模型和誤差分布模型進(jìn)行了訓(xùn)練。為了降低計(jì)算成本,采用基于窗口的方法(滑動(dòng)窗口=時(shí)間間隔(?T))累計(jì)點(diǎn)數(shù),或者取平均值轉(zhuǎn)換為時(shí)間序列數(shù)據(jù)。這里可以實(shí)現(xiàn)一些預(yù)處理。其次,已經(jīng)學(xué)習(xí)了正常數(shù)據(jù)行為的預(yù)測(cè)器可以利用正常的歷史信號(hào)預(yù)測(cè)未來(lái)的信號(hào)。為了檢驗(yàn)輸入信號(hào)與正常信號(hào)的匹配程度,計(jì)算實(shí)際信號(hào)與預(yù)測(cè)信號(hào)的絕對(duì)差值,通過(guò)誤差分布模型估計(jì)異常值。From 優(yōu)化 閾 值 基于 , 我們 可以 確定 異常 候選人 (anomaly point) 之前 集體 detection. 異常
Ⅳ. Experiments


我們用來(lái)進(jìn)行實(shí)驗(yàn)的數(shù)據(jù)集是52周內(nèi)的功耗。每個(gè)樣本數(shù)據(jù)對(duì)應(yīng)每15分鐘一次??偣灿?5040個(gè)數(shù)據(jù)點(diǎn)。為了訓(xùn)練異常檢測(cè)系統(tǒng)的必要模型,我們將異常視為低功耗的工作日。顯然,我們注意到星期六和星期日是例外,因?yàn)橹苣?。按照之前的培?xùn)流程,我們將給定的數(shù)據(jù)分為32周的培訓(xùn)數(shù)據(jù)集、6周的測(cè)試數(shù)據(jù)集和其余的驗(yàn)證數(shù)據(jù)集。LSTM模型是用Python和Tensorflow后臺(tái)使用Keras深度學(xué)習(xí)庫(kù)實(shí)現(xiàn)的。設(shè)計(jì)了基于PyQt的圖形用戶界面。采用偽模式部署基于Hadoop的體系結(jié)構(gòu),使用Hapdoop流API在python腳本中運(yùn)行Hadoop MapReduce編程,實(shí)現(xiàn)實(shí)時(shí)異常檢測(cè)。此外,數(shù)據(jù)倉(cāng)庫(kù)Hive構(gòu)建在Hadoop之上,用于訪問(wèn)/解析位于HDFS存儲(chǔ)上的內(nèi)容Json文件。為了查看異常檢測(cè)系統(tǒng)結(jié)果的性能,結(jié)果輸出如圖7所示。上圖為預(yù)測(cè)模型(綠破折號(hào))的預(yù)測(cè)結(jié)果,預(yù)測(cè)誤差以實(shí)紅線的形式表示。下圖為異常評(píng)分和學(xué)習(xí)閾值。這個(gè)接近于零的閾值用于指定樣本是否為異常候選。異常點(diǎn)檢測(cè)候選點(diǎn)用橙色標(biāo)記。
最后,我們使用Xisom[21]開發(fā)的工業(yè)自動(dòng)化軟件解決方案,對(duì)傳統(tǒng)SQL數(shù)據(jù)庫(kù)中的時(shí)間序列數(shù)據(jù)、異常檢測(cè)和查詢數(shù)據(jù)進(jìn)行可視化,進(jìn)行監(jiān)控操作,如圖8所示。
Ⅴ. Conclusion
本文從工業(yè)4.0現(xiàn)有的大數(shù)據(jù)基礎(chǔ)設(shè)施出發(fā),介紹了一個(gè)基于大數(shù)據(jù)的智能工廠異常檢測(cè)框架?;诠I(yè)監(jiān)控和數(shù)據(jù)采集(SCADA)的管理系統(tǒng)利用大數(shù)據(jù)和機(jī)器學(xué)習(xí)的優(yōu)點(diǎn)來(lái)理解時(shí)間序列數(shù)據(jù)。我們的SCADA場(chǎng)景的總體架構(gòu),由提議的來(lái)自深度學(xué)習(xí)的知識(shí)生成支持。這種設(shè)計(jì)與我們?cè)趥鹘y(tǒng)數(shù)據(jù)庫(kù)上看到的傳統(tǒng)商業(yè)SCADA解決方案不同。在異常檢測(cè)方面,基于LSTM的預(yù)測(cè)器可以很好地對(duì)時(shí)間序列數(shù)據(jù)進(jìn)行預(yù)測(cè),學(xué)習(xí)用于異常模式檢測(cè)的時(shí)間信號(hào)特征。該異常檢測(cè)模型在工業(yè)復(fù)雜系統(tǒng)(溫度、電、水位、濕度等)的不同時(shí)間序列數(shù)據(jù)中具有很強(qiáng)的應(yīng)用潛力。目前,所需要的模型是使用數(shù)據(jù)庫(kù)/云中的常規(guī)數(shù)據(jù)離線訓(xùn)練,并申請(qǐng)實(shí)時(shí)應(yīng)用。未來(lái),我們將研究在線學(xué)習(xí)技術(shù),并將更多的數(shù)據(jù)挖掘、基于機(jī)器學(xué)習(xí)的算法集成到系統(tǒng)中,以及移動(dòng)邊緣計(jì)算技術(shù)。