本月初,浪潮在今年的財(cái)年大會(huì)上,正式對(duì)外公布成立人工智能部,持續(xù)推出面向AI應(yīng)用的創(chuàng)新計(jì)算平臺(tái)。 當(dāng)然,浪潮廣為人知的自然是在其深耕的服務(wù)器領(lǐng)域。根據(jù)賽迪顧問(wèn)此前發(fā)布的數(shù)據(jù),2016年度,浪潮服務(wù)器出貨量份額穩(wěn)居中國(guó)市場(chǎng)第一,達(dá)到20.4%,并保持高速增長(zhǎng)。那么,此次發(fā)力人工智能,浪潮有何背書(shū)? 計(jì)算力可謂深度學(xué)習(xí)的“前提” 那么,傳統(tǒng)計(jì)算力提供者轉(zhuǎn)型做深度學(xué)習(xí)有什么優(yōu)勢(shì)呢?換句話(huà)講,計(jì)算力和深度學(xué)習(xí)有什么關(guān)系? Geoffrey Hinton Yoshua Bengio Yann LeCun 其實(shí),深度學(xué)習(xí)可追溯到20世紀(jì)40年代,而經(jīng)過(guò)數(shù)十年的發(fā)展,直到2006年左右,Hinton、Bengio、LeCun等大牛先后發(fā)布了多篇論文,才算正式掀起了深度學(xué)習(xí)的熱潮,也拉開(kāi)了AI第三次熱潮的帷幕。 眾所周知,深度學(xué)習(xí)技術(shù)的原理是采用高性能計(jì)算機(jī)建立模擬人腦進(jìn)行分析學(xué)習(xí)的深度神經(jīng)網(wǎng)絡(luò),讓機(jī)器能夠像人一樣思考。為什么深度學(xué)習(xí)到第三次AI熱潮的時(shí)間點(diǎn)才得以爆發(fā)呢?上世紀(jì)90年代,神經(jīng)網(wǎng)絡(luò)取得了重要進(jìn)展,Hochreiter和Bengio采用LSTM(長(zhǎng)短期記憶)來(lái)解決對(duì)長(zhǎng)序列進(jìn)行建模的難題。但是,很快這股熱潮就退卻了。其中,很大一部分原因就是因?yàn)槟莻€(gè)時(shí)候,人們認(rèn)為深度網(wǎng)絡(luò)是難以訓(xùn)練的,其計(jì)算代價(jià)太高,而以當(dāng)時(shí)可用的硬件難以進(jìn)行足夠的實(shí)驗(yàn)。 從更深層次說(shuō),人工神經(jīng)網(wǎng)絡(luò)在20世紀(jì)50年代就已經(jīng)成功實(shí)驗(yàn),為什么深度學(xué)習(xí)到現(xiàn)在才被認(rèn)為是關(guān)鍵技術(shù)?答案是與日俱增的數(shù)據(jù)量。 由于人類(lèi)的生產(chǎn)生活越來(lái)越多的依賴(lài)計(jì)算機(jī),越來(lái)越多的數(shù)據(jù)就被記錄在計(jì)算機(jī)上,而互聯(lián)網(wǎng)將計(jì)算機(jī)與計(jì)算機(jī)由鏈接起來(lái),“大數(shù)據(jù)”就產(chǎn)生了,而大數(shù)據(jù)才使得機(jī)器學(xué)習(xí)更加容易。 根據(jù)粗算,監(jiān)督式的深度學(xué)習(xí)算法要想達(dá)到“可接受”的程度,每類(lèi)給定的標(biāo)注樣本需要5000個(gè),要想“超越”人類(lèi)表現(xiàn),所需的標(biāo)注樣本的數(shù)據(jù)集要超過(guò)1000萬(wàn)個(gè)。 總而言之,為了實(shí)現(xiàn)機(jī)器像人一樣思考,需要進(jìn)行海量數(shù)據(jù)的模型訓(xùn)練和提升應(yīng)用擴(kuò)展性,這對(duì)超算的計(jì)算效率要求十分巨大,數(shù)字說(shuō)明一切。 圖片來(lái)源:image-net.org 首先說(shuō)說(shuō)ImageNet,Geoffrey Hinton在2012年成功發(fā)表論文《ImageNet Classification with Deep Convolutional Neural Networks》,而此論文之所以得以發(fā)布正是基于Imagenet數(shù)據(jù)集,因此帶來(lái)了計(jì)算機(jī)視覺(jué)領(lǐng)域的“革命”,極大推動(dòng)了ImageNet對(duì)深度學(xué)習(xí)的貢獻(xiàn)。而事實(shí)是,Imagenet數(shù)據(jù)集有1400多萬(wàn)幅圖片,涵蓋2萬(wàn)多個(gè)類(lèi)別;其中有超過(guò)百萬(wàn)的圖片有明確的類(lèi)別標(biāo)注和圖像中物體位置的標(biāo)注。 圖片來(lái)源:research.google.com/youtube8m/ 比如谷歌發(fā)布的Youtube-8M,該數(shù)據(jù)集是開(kāi)源的視頻數(shù)據(jù)集,視頻來(lái)自youtube,為了保證標(biāo)簽視頻數(shù)據(jù)庫(kù)的穩(wěn)定性和質(zhì)量,谷歌只采用瀏覽量超過(guò)1000的公共視頻資源。據(jù)統(tǒng)計(jì),Youtube-8M上共計(jì)有8百萬(wàn)個(gè)視頻、總時(shí)長(zhǎng)50萬(wàn)小時(shí)、4800類(lèi)。 圖片來(lái)源:lemurproject.org 再比如Clueweb09,它是用來(lái)支持信息檢索和相關(guān)人類(lèi)語(yǔ)言技術(shù)研究的資料庫(kù),包含了從2009年1月到2月間收集的大約10億個(gè)網(wǎng)頁(yè)、共10種語(yǔ)言。如果采用RNN算法模型訓(xùn)練Clueweb09英文數(shù)據(jù)集的話(huà),需要涉及到200億的參數(shù)變量,用現(xiàn)有的計(jì)算技術(shù)需要180年才能訓(xùn)練完所有數(shù)據(jù)。 也就是說(shuō),以現(xiàn)在超算的計(jì)算力,還無(wú)法完成“海量”的機(jī)器學(xué)習(xí)任務(wù)。 機(jī)器人圈在之前的文章(為何人工智能的發(fā)展離不開(kāi)先進(jìn)的計(jì)算平臺(tái)?)曾經(jīng)解釋過(guò),對(duì)于線(xiàn)下訓(xùn)練,GPU異構(gòu)并行計(jì)算的技術(shù)架構(gòu)比較適合模型的訓(xùn)練。而對(duì)于線(xiàn)上識(shí)別,F(xiàn)PGA的異構(gòu)計(jì)算模式因低功耗、高性能、易編程等特點(diǎn),就成為了深度學(xué)習(xí)的首選。 目前,浪潮已具備覆蓋單機(jī)2、4、8卡在內(nèi)的業(yè)界最全GPU服務(wù)器產(chǎn)品線(xiàn),支持百度開(kāi)發(fā)了專(zhuān)為訓(xùn)練優(yōu)化的單機(jī)16卡擴(kuò)展的PBOX-AI整機(jī)柜,并是唯一可提供深度學(xué)習(xí)FPGA加速卡的主流服務(wù)器廠(chǎng)商。 GPU方面,浪潮支持百度研發(fā)了面向更大規(guī)模數(shù)據(jù)集和深層神經(jīng)網(wǎng)絡(luò)的超級(jí)AI計(jì)算模塊——PBOX-AI整柜機(jī),這是行業(yè)首個(gè)單模塊支持16GPU,并可堆疊擴(kuò)展至64GPU的超高密度計(jì)算方案。而在FPGA方面,浪潮與英特爾合作研發(fā)的FPGA加速卡F10A,是目前業(yè)界支持OpenCL的最高密度最高性能的FPGA加速設(shè)備;同時(shí),浪潮與Altera和科大訊飛,完成了基于OpenCL的FPGA線(xiàn)上深度學(xué)習(xí)語(yǔ)音識(shí)別加速方案。 超算大賽設(shè)“AI”賽題 ASC超算競(jìng)賽是浪潮聯(lián)合亞洲超算協(xié)會(huì)共同發(fā)起的,至今已經(jīng)舉辦了6年,其宗旨是推動(dòng)青年人才培養(yǎng)的問(wèn)題。今年比賽中的人工智能賽題來(lái)自百度深度學(xué)習(xí)研究院,讓隊(duì)員用提供的計(jì)算框架和真實(shí)的交通數(shù)據(jù),自行開(kāi)發(fā)腦模型訓(xùn)練數(shù)據(jù),并快速、精準(zhǔn)的預(yù)測(cè)出某個(gè)城市未來(lái)的交通情況。(詳情請(qǐng)見(jiàn):ASC17超算大賽總決賽來(lái)了!為何PaddlePaddle深度學(xué)習(xí)框架入賽題?) 其實(shí),ASC超算競(jìng)賽中對(duì)人工智能的關(guān)注,不僅為學(xué)生搭建了深入了解、掌握最新人工智能算法等前沿科技的平臺(tái),還有助于鍛煉學(xué)生動(dòng)手解決問(wèn)題的能力,幫助他們成為面向未來(lái)的復(fù)合型科技精英。這亦是希望通過(guò)比賽,能夠激發(fā)更多年輕人對(duì)人工智能與超算的興趣,解決目前中國(guó)AI人才準(zhǔn)備不足的問(wèn)題。 轉(zhuǎn)型之年可期 接下來(lái),浪潮在A(yíng)I領(lǐng)域會(huì)有哪些動(dòng)作呢?機(jī)器人圈了解到,近期浪潮將推出業(yè)界計(jì)算性能最強(qiáng)的深度學(xué)習(xí)超算服務(wù)器,持續(xù)開(kāi)發(fā)優(yōu)化開(kāi)源并行深度學(xué)習(xí)框架,并為客戶(hù)提供訓(xùn)練集群管理軟件和性能優(yōu)化工具,同時(shí)浪潮還將面向醫(yī)療、安防、金融等行業(yè)提供“端到端”人工智能解決方案,與合作伙伴一起構(gòu)建完整的產(chǎn)業(yè)生態(tài)。 其實(shí),一直在A(yíng)I領(lǐng)域頗為低調(diào)的浪潮在該領(lǐng)域深入開(kāi)拓。據(jù)統(tǒng)計(jì),浪潮已占有中國(guó)AI計(jì)算服務(wù)器市場(chǎng)60%以上份額,與百度、阿里、騰訊、科大訊飛、奇虎360、搜狗、今日頭條、Face++等人工智能領(lǐng)先公司保持在系統(tǒng)與應(yīng)用方面的深入緊密合作,幫助客戶(hù)在語(yǔ)音、圖像、視頻、搜索、網(wǎng)絡(luò)等方面取得數(shù)量級(jí)的應(yīng)用性能提升。 浪潮人工智能與高性能產(chǎn)品部總經(jīng)理劉軍在財(cái)年大會(huì)上表示,浪潮希望為高速發(fā)展的人工智能應(yīng)用需求不斷創(chuàng)新設(shè)計(jì)&提供頂尖的AI計(jì)算產(chǎn)品方案。2017年浪潮將在人工智能計(jì)算的數(shù)據(jù)中心產(chǎn)品創(chuàng)新、深度學(xué)習(xí)算法框架優(yōu)化、生態(tài)系統(tǒng)建設(shè)等方向全面發(fā)力。 2017將成為浪潮的戰(zhàn)略轉(zhuǎn)型關(guān)鍵之年,想必會(huì)動(dòng)作頻頻,值得持續(xù)關(guān)注。 |
|