人工智能并不能解決所有問題,但如果應用得當,它可以在短時間內(nèi)產(chǎn)生很大的變化。 您或許已經(jīng)聽說過機器學習和人工智能(AI)的前景。這兩個技術(shù)概念,已經(jīng)引起了全世界的關(guān)注。自動駕駛汽車、人形機器人、設備預測維護——這些應用不僅僅限于消費者領域,工業(yè)界也開始瘋狂了??纯醋罱饕I(yè)出版物的諸多頭條新聞就知道了。這種趨勢仍將繼續(xù),實際上,未來它可能無處不在。因此,您不妨了解一下。 AI的興起 傳統(tǒng)上,分析是統(tǒng)計學家的專長。在工業(yè)領域普及計算機之前,分析師使用鉛筆和紙完成分析工作。而現(xiàn)在的分析,是描述數(shù)據(jù)科學的總稱。 例如,沿著一條簡單的線找到一個點,通常屬于標準數(shù)據(jù)分析的范疇。該線被認為是“回歸”。沿著線找到點是“回歸分析”。執(zhí)行簡單的回歸分析司空見慣。 機器學習可以看作是AI 的子集,盡管這兩個術(shù)語通常可以互換使用。機器學習是AI的統(tǒng)計方面,其中還包括認知計算和建模。每個類別的邊界可能是模糊的。 表征AI的另一種方法,是使用真實世界數(shù)據(jù)得出結(jié)論的計算機代碼。如果以此方式建立系統(tǒng),則可以根據(jù)這些結(jié)論自動做出決策。然后,可以將更多信息輸入系統(tǒng)并做出更多的決策。對AI 的描述,反映了當今流行文化的對AI 的理解,它反映了人類的思想方式。我們接受信息,得出結(jié)論并做出決定。 人類思想常??梢杂谩叭绻?,那么”的形式來表達,當然也可以用其它形式表示。與此類似,我們也可以用用其中一種算法來實例化AI。根據(jù)功能對算法進行分組很有用。我們來了解一下機器學習算法的主要類別。 聚類分析 一些算法將事物進行“分組”。例如,假設正在生產(chǎn)零部件。質(zhì)保部門或在線測量系統(tǒng)將把兩個測量功能與零件關(guān)聯(lián):寬度和高度。將這些數(shù)據(jù)用于生成圖表??梢允褂妙伾珌砻鞔_分類方案。如果您使用的是Excel 向?qū)?,則可以自己生成圖形,在新零件通過時將其繪制到圖表上(見圖1)。 圖1 可以使用顏色對零件進行分類,但是如果相關(guān)參數(shù)太多而無法使用傳統(tǒng)的可視化技術(shù)顯示,該怎么辦?本文圖片來源:inductiveAutomation 隨著將更多信息添加到架構(gòu)中,集群功能變得更強大。假設添加了有關(guān)次品的信息。結(jié)果顯示,藍色組代表的次品占比將近80%,而綠色組則占大約20%。 但是為什么要停在那里?假設我們也開始收集長度信息。想象一下在三個維度上繪制圖表。先進的繪圖程序可以做到這一點,因此可以繼續(xù)手動輸入和分組信息。當分組得到改善后,藍色組顯示的次品占比達到85%。 此時,如果使用機器學習算法完成聚類,它將執(zhí)行分類,但是只能自動執(zhí)行可以手動完成的操作。那為什么機器學習是更好的選擇? 更多維度 這個時候,如果需要增加另一個維度怎么辦?也許電導率是有意義的參數(shù),或者是濕度讀數(shù),或者是陽極氧化電流。但是3D 圖只能具有三個維度。另一方面, 使用機器學習算法意味著可以繪制四個、五個、六個甚至一百個維度的圖形。 聚類算法根據(jù)每個零件的屬性繪制圖形,將彼此接近的零件識別為一組。一旦完成此操作,就更容易看到哪些屬性或?qū)傩缘慕M合最有可能產(chǎn)生次品。 這意味著可以根據(jù)其它屬性自動對分組進行進一步細化,并且可能對藍色組進行充分細化,以預測95%或99%的次品。對于最有可能需要返工的產(chǎn)品,洞察力得到了顯著改善??赡艿倪x擇是在采取不必要的步驟之前,將其從生產(chǎn)環(huán)節(jié)中撤出,從而可以節(jié)省時間和成本。 決策樹 決策樹是另一種在概念上具有重大意義的簡單技術(shù)。在數(shù)據(jù)挖掘中決策樹訓練是一個常用的方法。目標是創(chuàng)建一個模型來預測樣本的目標值。在日常生活中,我們經(jīng)常會建立決策樹,以回答諸如以下問題:交通狀況如何?天氣如何?我今天應該給媽媽打電話嗎(請參見圖2)?構(gòu)建一個算法是一項簡單任務。首先,確定描述過程的數(shù)據(jù)以及有關(guān)結(jié)果的信息。結(jié)果生成的算法,將構(gòu)建一棵映射預測結(jié)果的樹。它會通過多種可能性(也許是數(shù)千甚至更多種),來構(gòu)想出盡可能準確的樹。 圖2 決策樹從簡單元素開始,但可以用來預測高度復雜過程的結(jié)果。 模型與訓練 其它重要的分析概念,還包括建模和訓練。當將過程數(shù)據(jù)輸入到機器學習算法中時,就會進行訓練,從而生成模型,進而識別出好的和壞的過程示例。 想象一下,有人坐下來用筆寫出一個決策樹。然后他們寫了一個又一個決策樹。之后,就可以確定最佳決策樹,然后放棄其它決策樹。最終的決策樹就是模型。對于聚類算法,該模型將僅被稱為“聚類模型”或“模型”。 換句話說,使用最佳決策樹可以利用一組數(shù)據(jù)基于處理流程來獲得預測?;氐角懊娴氖纠谝粋€語句可能是“如果寬度小于23.5,那么xxx”,第二個語句可能是,“如果高度大于43.3,那么xxx?!睓C器學習算法創(chuàng)建問題,以獲得它所能得到的最佳答案。 決策樹在預測性維護應用中具有很大的實用性。如前所述,回歸分析可能很簡單。但當涉及到機器學習算法時,它可能會很復雜。 回歸分析 同樣,回歸分析的基礎可以通過在一條線上找到一個點來說明。要畫一條線,首先要確定畫一條什么類型的線。它是曲線嗎?是直線嗎?它有很多曲線嗎?如果將其繪制在x-y 二維平面中,這很容易做到。當將機器學習應用于復雜數(shù)據(jù)和更多維度時,它會大放異彩。手工繪制100 個維度,永遠是不切實際的,但是一種算法可以輕松地解決這一問題,并且可以輕松找到最佳擬合回歸(如果存在的話)。 回歸分析在過程調(diào)整和生產(chǎn)預測中非常有用。并非所有數(shù)據(jù)都適合進行回歸分析(例如,聚類數(shù)據(jù)),但是對于那些某個因素會影響其它因素的項目可能非常有用。 深度學習 也許您聽說過深度學習和神經(jīng)網(wǎng)絡,那您真的了解它們是什么嗎?深度學習是機器學習的分支,是一種以人工神經(jīng)網(wǎng)絡為架構(gòu),對數(shù)據(jù)進行表征學習的算法。神經(jīng)網(wǎng)絡是包含數(shù)千或數(shù)百萬個節(jié)點的模型,這些節(jié)點是計算機代碼的小塊,每個塊都可以接受輸入并產(chǎn)生輸出。所謂神經(jīng)網(wǎng)絡是因為它們旨在模擬神經(jīng)元在大腦中的工作方式。就像我們大腦中的神經(jīng)元一樣,節(jié)點之間的某些連接相對較強,其它可能相對較弱。 圖3 可以將神經(jīng)網(wǎng)絡設計為大致類似于大腦的工作方式。 對于神經(jīng)網(wǎng)絡,算法不只是配置節(jié)點。它們自我構(gòu)建,從而可以建立具有數(shù)百萬個節(jié)點的模型來處理數(shù)據(jù)。 當神經(jīng)網(wǎng)絡“消化”數(shù)據(jù)時,它會變形和變化,直到在預測結(jié)果或提供分類方面達到設定目標為止。經(jīng)過訓練,它可以做幾乎所有事情??赡苄枰@取最近的傳感器讀數(shù)并經(jīng)計算獲得問題出現(xiàn)的可能性。或者,它可以評估一組1 和0,以確定是否描繪了一只貓。所有這些數(shù)百萬個節(jié)點,都以某種方式“理解”了圖像。對每個節(jié)點只是簡單的數(shù)學運算,但節(jié)點的排列和權(quán)重都可以以某種形式用于獲得結(jié)論。 這就是為什么很少能有人真正理解它們的原因。要求數(shù)據(jù)科學家解釋神經(jīng)網(wǎng)絡,他們可能能夠解釋數(shù)學問題。如果請同一位數(shù)據(jù)科學家解釋如何在這些字節(jié)中識別“怪獸”,他可能會用“魔法”來解釋。 神經(jīng)網(wǎng)絡如此令人印象深刻,它們在工業(yè)領域也提出了難題。如果算法告訴您要做某事,您會做嗎?如果是決策樹、回歸分析或聚類模型分配建議,則可以跟蹤獲得結(jié)論的方式。但是,神經(jīng)網(wǎng)絡可能不會讓你了解獲得系統(tǒng)的“原因”。它只是給出一個可以相信與否的答案。如果這些決定可能會導致停機或生產(chǎn)瓶頸,則可能會遭到質(zhì)疑,為什么要使用算命先生的魔法水晶球來制定決策。 未來就在這里 世界正在變化,人工智能和機器學習技術(shù)將不斷發(fā)展,并且在更多行業(yè)得到應用。人工智能技術(shù)已經(jīng)證明了其價值,采用的企業(yè)看到了已經(jīng)獲得的領先優(yōu)勢。人工智能并不能解決所有問題,但如果應用得當,它可以在短時間內(nèi)產(chǎn)生很大的變化。所以放開手腳,大膽的去建立模型吧,你會在過程中找到答案的。 實施AI項目的7個注意事項 如果你正在學習或計劃實施機器學習或人工智能項目,有一些事要優(yōu)先考慮。 01 識別問題 首先選擇要改進的過程、區(qū)域或技術(shù)。在機器學習或AI 似乎可以提供幫助的地方,找到最需要解決的問題和目標。 02 收集數(shù)據(jù) 數(shù)據(jù)越多越好。成千上萬的數(shù)據(jù)點,盡可能多的幫助訓練模型。確保使用高質(zhì)量的數(shù)據(jù)。不良數(shù)據(jù)很容易引發(fā)算法失敗。數(shù)據(jù)預處理和數(shù)據(jù)清理,是影響成功的關(guān)鍵因素。 03 整理統(tǒng)計數(shù)據(jù) 了解采樣技術(shù)以及因果關(guān)系和相關(guān)性。了解結(jié)果的質(zhì)量,有助于避免發(fā)生錯誤。 04 具有專業(yè)知識 了解過程或技術(shù)對于了解結(jié)果是否合理至關(guān)重要。數(shù)據(jù)科學家很棒,但是僅僅關(guān)注某些數(shù)據(jù),不會取得好的結(jié)果。 05 創(chuàng)建模型 這可以與現(xiàn)有的任何機器學習軟件一起使用?,F(xiàn)代的監(jiān)控和數(shù)據(jù)采集(SCADA)系統(tǒng),內(nèi)置了一些流行的機器學習算法。許多云產(chǎn)品和平臺都將這種類型的算法作為選項。 06 部署模型 通常,可以在機器旁邊或內(nèi)部運行模型,甚至構(gòu)建在云上或利用其它工具。尋找運行模型的最佳方法。如果是關(guān)鍵過程的一部分,則在本地運行是理想選擇。 07 監(jiān)控是否成功 如果無法衡量成功,就沒有人會知道它的存在??梢詫⑾惹暗倪^程數(shù)據(jù)與最新數(shù)據(jù)進行比較。如果模型需要改進,請返回到第5 步。請記住,有時嘗試幾種模型或?qū)追N模型組合會產(chǎn)生更好的結(jié)果。 |
|