人工智能(AI)本身是一種顛覆性的技術,而聯合式學習(federated
learning)則可能會是顛覆AI的一種方法──瑞士洛桑聯邦理工學院(Ecole Polytechnique Federale de
Lausanne,EPFL)教授暨嵌入式系統(tǒng)實驗室(Embedded Systems Laboratory)總監(jiān)David
Atienza率先開發(fā)了一種解決方案,可替代傳統(tǒng)集中式的機器學習(ML)。
關鍵的差異在于,聯合式學習是在多個保存本地數據樣本而不會交換它們的去中心化邊緣裝置或服務器上進行特定ML訓練,這可降低對隱私保護的疑慮以及能源消耗,因為數據不會移動到云端或是中央數據庫。
聯合式學習在蔓延全球的新冠病毒疫情中也能發(fā)揮作用。Atienza領導的EPFL團隊正在實驗一種能結合來自各種咳嗽癥狀監(jiān)測裝置的數據,以提升初始診斷精確度的AI系統(tǒng)──根據世界衛(wèi)生組織(WHO)統(tǒng)計,有三分之二的新冠病毒肺炎患者會出現干咳的癥狀,而醫(yī)護人員若能在就醫(yī)者進入急診室時先掌握到這類癥狀,可早期發(fā)現確診病患。
透過該AI系統(tǒng),工程師能將從不同咳嗽樣本取得的個別數據相關聯,以創(chuàng)建一個更復雜精密的模型。Atienza接受《EE
Times》訪問時表示,該AI系統(tǒng)項目就是采用聯合式學習的概念,讓設計者能使用一系列傳感器來觀察特定的征象。雖然這些傳感器無法全面觀察被指派的對象,但有助于建立一個簡化的模型并與其他類似的模型結合,然后生成一個完整的AI模型。
AI運算新篇章聯合式學習是2017年由Google所提出,為需要利用具備龐大運算力之集中式數據中心來執(zhí)行的傳統(tǒng)機器學習提供可行替代方案,也為無力負擔大型數據中心的新創(chuàng)公司與中小企業(yè)提供了自建ML模型的途徑。此外,在大型數據中心進行訓練的機器學習模型,其數據隱私保護往往是一個主要顧慮,這種新架構是在裝置本地儲存數據,對于隱私較有保障。
Atienza在介紹聯合式學習概念時表示,人們可以想象這是收集數據以訓練AI模型的中央輔助系統(tǒng);而聯合式學習也能讓物聯網(IoT)更具適應性,從位于不同據點的小型數據集(dataset)中學習。他補充指出,分散各處的傳感器收集數據進行模型訓練并非獨立作業(yè),而是透過一個做為數據交換數據庫的(加密)共享端點。
在傳感器內部執(zhí)行學習時,該共享數據庫或服務器會協助傳感器將觀察到的數據同步化,并建立共享模型。Atienza解釋:“在完全分布式的學習中,沒有將裝置聯合并同步化的數據庫;因此像是傳感器等裝置無法互相溝通,也沒有一個中央單元負責協調?!?br> 除了完全分布式的系統(tǒng)會更復雜,聯合式學習還有助于解決許多問題并提供良好結果。例如在醫(yī)療應用中,不同的診所能聯合開發(fā)AI模型,又不直接分享敏感的病患個資。
在醫(yī)療應用環(huán)境采用聯合式學習。(圖片來源:Carnegie) 聯合式學習也為AI開啟了全新的運算典范,工程師能執(zhí)行本地的神經網絡訓練,并為有效的訓練找到正確數據。Atienza表示,這有助于促進機器學習應用的發(fā)展,例如自然語言處理以及檔案/文件處理。
他指出:“現在AI解決方案的焦點集中在人類無法做得很好的任務上,設計工程師(透過聯合式學習)能在數據集中納入可取得的數據與叢集以支持特定算法;在將數據進行分類后,就能建立更好、個人化的機器學習模型?!?br>
可編程的“迷你”加速器聯合式學習需要什么樣的硬件?對此Atienza表示,相較于目前支持特定機器學習應用的AI加速器,聯合式學習所需的硬件解決方案必須更“多才多藝”;他指出,像是一群迷你加速器的粗粒度可重配置數組(coarse
grained reconfigurable array,CGRA)解決方案,就能針對特定使用案例進行配置。
Atienza解釋,CGRA解決方案能保留一種基礎架構,也就是設計工程師能在不同的AI應用使用相同的芯片,只更改芯片的可編程部分。
支持某個聯合學習應用的CGRA解決方案。(圖片來源:EPFL) CGRA網狀網絡能藉由利用多樣化運算核心(computational kernels)的可重配置解決方案提供高度靈活性;與FPGA設計相似,是緊密互連的2D可重配置單元(recon?gurable cells,RCs)網狀網絡結構。但這種技術能讓加速器在作業(yè)層級(operation level)可編程,不同于FPGA是位層級(bit level)的可重配置數組、具備相當的功耗開銷。
Atienza預期,支持這種聯合式學習新技術的硬件,將會有越來越多的可配置功能,藉由芯片的編程來根據目前市場趨勢、支持不同種類的AI任務;“聯合式學習應用將會帶動對可重新編程、利用大量迷你加速器的AI硬件之需求?!?br> (原文發(fā)表于ASPENCORE旗下EDN姐妹網站EETimes,參考鏈接 :Federated Learning Demands More Programmable Hardware,編譯:Judith Cheng;責編:Demi Xia)
|