人工智能、區(qū)塊鏈、云計算等新技術(shù) 開啟了新的 ABC(AI、Blockchain、Cloud Computing)時代人工智能迎來了新一輪的發(fā)展高潮 如何讓人工智能為人類所用,產(chǎn)生價值? 如何在云計算的大潮中通過智能化應(yīng)用脫穎而出? 7 月 5 日 AWS 首席云計算顧問 費良宏 在首屆“零一科技節(jié)”上進行了 《云計算推動的人工智能革命》 主題演講 演講實錄 費良宏 AWS 首席云計算顧問 大家好,很高興跟大家分享關(guān)于云計算與人工智能的話題。人工智能、云計算可以說是這個時代最熱門的話題,這些概念背后有什么樣的新聞?對于人們來說這些高新的技術(shù)出現(xiàn)又意味著什么? 我們知道,2018 年在新聞媒體當(dāng)中有許多關(guān)于人工智能以及相關(guān)應(yīng)用的進展的報道,我們看到了許許多多令人驚訝的成就,在醫(yī)療健康、智能交通、新一代零售等領(lǐng)域都可以看到這些新興技術(shù)的影子。同時很多人也在幻想人工智能的時代會不會突然出現(xiàn)在我們的面前。 從技術(shù)層面來看,人工智能已經(jīng)成為一個新的發(fā)展方向,這個方向與眾不同之處在于“它幾乎成為了所有新興技術(shù)的支撐載體”。目前在技術(shù)發(fā)展的趨勢預(yù)測當(dāng)中,人工智能已經(jīng)與這些技術(shù)發(fā)展方向融為一體,甚至是與所有相關(guān)的新概念、新技術(shù)融合在一起。無論是區(qū)塊鏈、物聯(lián)網(wǎng)、云計算還是其他的任何一種新興概念,都會看到人工智能在其中發(fā)揮的巨大作用。 所以,可以預(yù)見的一點就是人工智能已經(jīng)成為新的科技競技場。今天在座的各位以及任何一個行業(yè)的朋友,都可能在未來遇到這樣的場景,我們競爭的主要手段和最有效的工具恐怕就是人工智能。人工智能的發(fā)展并不是一夜之間出現(xiàn)的,它經(jīng)歷了一個漫長的發(fā)展過程,我們今天所看到人工智能的爆發(fā)是在長期積累之后出現(xiàn)的。 人工智能的發(fā)展及飛輪模式的爆發(fā) 通過人工智能過去 60 年發(fā)展經(jīng)歷,可以總結(jié)出它的發(fā)展曲線和軌跡。從1955 年人工智能概念之父麥卡錫提出人工智能的概念開始,到 1956 年著名的達(dá)特茅斯會議上正式奠定了人工智能學(xué)科的基礎(chǔ),二十幾位科學(xué)家通過他們的思維碰撞,產(chǎn)生智慧的火花,推動了人工智能的發(fā)展。 1957 年 Rosenblatt 提出了感知器的概念,這使得我們今天的人工智能有了一個非常好的理論支持,感知器是我們看到人工智能深度學(xué)習(xí)的基礎(chǔ)概念。1965 年烏克蘭數(shù)學(xué)家 Alexey Grigorevich Ivakhnenko 也是我們熟知的深度學(xué)習(xí)之父,提出了所謂的“深度學(xué)習(xí)”的概念,而深度學(xué)習(xí)已經(jīng)成為今天人工智能最主要的發(fā)展方向。1975 年偉大的反向傳播算法的出現(xiàn)使得我們對于神經(jīng)網(wǎng)絡(luò)的處理能力得到了極大的提升,反向傳播算法現(xiàn)在已經(jīng)成為深度學(xué)習(xí)最重要的算法。1989 年 Yann LeCun 第一個利用反向傳播算法實現(xiàn)了對手寫字符識別的應(yīng)用?;蛟S今天看起來微不足道,但是所有這一切的努力都奠定了今天的人工智能爆發(fā)。 再舉一個簡單的例子:卷積神經(jīng)網(wǎng)絡(luò)。這是目前深度學(xué)習(xí)應(yīng)用的重要技術(shù),而圍繞這個領(lǐng)域的理論基礎(chǔ)及算法的實踐目前已經(jīng)日趨成熟,并在許多領(lǐng)域產(chǎn)生了巨大的成果。這些成果包括了大家可能較為熟悉的自動駕駛技術(shù)。在過去的幾年里,自動駕駛技術(shù)已經(jīng)成為了推動整個行業(yè)發(fā)展的重要助力,假以時日,L4 級別的無人駕駛技術(shù)應(yīng)該很快就會走進我們的生活當(dāng)中。 另外一個極具價值的場景就是醫(yī)療健康,2017 年 Arterys 開發(fā)的輔助醫(yī)療診斷系統(tǒng),利用人工智能的診斷系統(tǒng)得到了美國食品藥品監(jiān)督局的批準(zhǔn),正式走向了臨床。從此醫(yī)生可以通過人工智能的建??梢暬晒瑢υ\斷結(jié)果的準(zhǔn)確性達(dá)到進一步提高。我們相信隨著越來越多技術(shù)和應(yīng)用的發(fā)展,人工智能幫助我們在醫(yī)療健康領(lǐng)域做出巨大突破指日可待。 另外還有很多傳統(tǒng)行業(yè)也在利用相關(guān)的技術(shù)發(fā)展并從中受益。其中一家就是 Expedia,如果大家是一個旅游達(dá)人的話,一定對這個網(wǎng)站不會感到陌生。我們經(jīng)常通過這個軟件預(yù)訂酒店,但是這家企業(yè)也曾遇到過發(fā)展瓶頸。當(dāng)它面對全球 35 萬家酒店的 1,000 萬張各種圖片的時候,就發(fā)現(xiàn)用傳統(tǒng)的處理方式已經(jīng)無法有效地完成最佳圖片的匹配。于是這家企業(yè)開始嘗試使用人工智能中的深度學(xué)習(xí)技術(shù),利用了 AWS 云計算的計算實例,基于我們已經(jīng)成熟的深度學(xué)習(xí) Keras 框架,實現(xiàn)了圖片的自動匹配 —— 當(dāng)我們試圖訪問任何一家酒店的時候,在這個網(wǎng)站上呈現(xiàn)的圖片應(yīng)該是與你希望的內(nèi)容最為匹配的結(jié)果。 所有的這些進展已經(jīng)讓我們感到驚訝。我們應(yīng)該歸納一下這些在業(yè)務(wù)上的創(chuàng)新應(yīng)用有什么共性?我想通過一個飛輪模型跟大家分享一下我所觀察到的現(xiàn)象。 一個成功的企業(yè)應(yīng)該遵循這樣的模式,這種模式特征是在企業(yè)面對客戶時可以積累大量數(shù)據(jù),通過這些數(shù)據(jù)針對市場進行深入分析,之后就可以開發(fā)出來最好的產(chǎn)品,而好的產(chǎn)品又會吸引更多的用戶。有了這樣的基礎(chǔ)之后,這個飛輪就會不停地旋轉(zhuǎn)下去,從而帶動企業(yè)不斷向前發(fā)展。 基于過去幾十年 IT 技術(shù)的不斷發(fā)展,我們在數(shù)據(jù)管理方面有很多積累,大量來自于互聯(lián)網(wǎng)、移動端的數(shù)據(jù)已經(jīng)成為我們大數(shù)據(jù)的基礎(chǔ),對于數(shù)據(jù)的存儲、分析相關(guān)的處理能力的進展使我們已經(jīng)具備了各種復(fù)雜場景下的分析能力。而在產(chǎn)品方面,一個新技術(shù)的引入可以幫助我們在產(chǎn)品的設(shè)置、研發(fā)以及相關(guān)的部署方面有巨大的提升,這種技術(shù)就是我們今天所介紹的人工智能。 我們可以想象在這種飛輪模式中,當(dāng)它真正運轉(zhuǎn)起來,大數(shù)據(jù)分析工具、人工智能的算法會使飛輪以更高的速度不停旋轉(zhuǎn),使我們的業(yè)務(wù)能夠更快速地發(fā)展,在市場上獲得更大的優(yōu)勢。 云計算成為人工智能最好的解決思路 在過去的幾年里面,我們積累了很多關(guān)于 AI 應(yīng)用的經(jīng)驗,也充分地了解了一些應(yīng)用規(guī)律,在開發(fā)的流程方面我們形成了一套行之有效的流程規(guī)則和方法,涉及了數(shù)據(jù)的采集、管理、特征提取、模型訓(xùn)練、部署和應(yīng)用等等。也許大家看到這樣的流程時會有這樣的感覺:人工智能的應(yīng)用開發(fā)還是比較復(fù)雜的,它涉及了許多環(huán)節(jié)。在眾多的環(huán)節(jié)中我們需要重新了解、學(xué)習(xí)相關(guān)知識和經(jīng)驗?,F(xiàn)階段這種模式在某種程度也束縛了人工智能真正與我們的生產(chǎn)活動緊密地結(jié)合在一起。 如何解決此類問題?對于一個人工智能應(yīng)用來說,最重要的就是這幾個因素:算法、數(shù)據(jù)以及計算能力。這三個因素最好的解決方案是什么?我想云計算就是我們的答案。 借助云計算采集、加工、處理分析我們的數(shù)據(jù),利用云計算提供的計算資源來實現(xiàn)我們的算法并訓(xùn)練我們的模型,并將我們的算法模型部署到云計算的環(huán)境中。云計算就成為了我們解決這個問題最有效的方法和突破口。 當(dāng)我們孤立地談人工智能的時候,會發(fā)現(xiàn)有許許多多的問題,但是一旦將人工智能對接到云計算上,這些所謂的困難恐怕就會迎刃而解。這就是人工智能和云計算結(jié)合的結(jié)果,兩者結(jié)合的倍增效應(yīng)會更好地推動人工智能在這個時代快速發(fā)展。 在過去的幾年,亞馬遜公司不斷地發(fā)布各種關(guān)于人工智能/機器學(xué)習(xí)的產(chǎn)品與服務(wù),這些產(chǎn)品面向的用戶包括了科學(xué)家、工程師和開發(fā)人員等。這些產(chǎn)品與服務(wù)支持了市場上最熱門的一些開源的深度學(xué)習(xí)框架,比如說 Tensorflow MXNet 等。任何一個開發(fā)人員、科學(xué)家和工程師都可以將自己原有經(jīng)驗應(yīng)用于云計算之上并產(chǎn)品化。如果想簡化這些復(fù)雜的工作,一種新的選擇將會出現(xiàn)在大家的面前,就是亞馬遜推出的人工智能平臺服務(wù),利用這種平臺使我們在最大程度上做到更快部署、更容易地訓(xùn)練我們需要的模型,當(dāng)然所有這些都需要開發(fā)的能力和深度的算法經(jīng)驗。 或許大家困惑的是如果沒有這種能力與經(jīng)驗,有沒有可能加速人工智能的應(yīng)用發(fā)展呢?對于云計算來說,一種新的人工智能應(yīng)用模式出現(xiàn)了,這種模式就是人工智能應(yīng)用服務(wù)。比如說在亞馬遜人工智能/機器學(xué)習(xí)的產(chǎn)品與服務(wù)清單中,你會看到面向圖片/圖像分析、語音處理、自然語言理解等相關(guān)服務(wù),它們都是以一種云計算的服務(wù)的形式出現(xiàn)。這些高級的人工智能/機器學(xué)習(xí)服務(wù)不需要了解參數(shù),不需要了解算法,不需要科學(xué)家們參與其中,它通過一個更簡單的方式加速這些成熟的人工智能領(lǐng)域應(yīng)用。哪怕我們沒有更高深的知識、技能或相關(guān)經(jīng)驗的儲備,我們同樣可以獲得人工智能的能力,我相信對于廣大的企業(yè)用戶來講,這是一個非常好的消息。 AI 應(yīng)用的三趨勢 今天我們看到在全球范圍內(nèi),有數(shù)以萬計的用戶利用云計算的人工智能來幫助他們進行創(chuàng)新和突破,將人工智能與他們所從事的領(lǐng)域結(jié)合在一起,產(chǎn)生了巨大的效應(yīng)。歸納目前的行業(yè)發(fā)展,我認(rèn)為人工智能在云計算的發(fā)展方向上有三個趨勢: 第一,關(guān)于數(shù)據(jù)。數(shù)據(jù)對于人工智能的算法和利用,是最重要的一個環(huán)節(jié)。 第二,人工智能應(yīng)用不是一個狹窄的概念,它具有更廣泛的概念。未來應(yīng)用的模式將會非常靈活,可以從簡單到復(fù)雜,各種形態(tài)都可能會出現(xiàn)。 第三,對于開發(fā)人員來說,我們在應(yīng)用人工智能方面要強調(diào)速度。 我們再來看一下這三個特點究竟背后有哪些不為人知的地方。 先看看數(shù)據(jù)的概念?;趲啄昵暗拇髷?shù)據(jù)發(fā)展,我們已經(jīng)知道數(shù)據(jù)的處理分析對于人工智能數(shù)據(jù)有特別的含義。首先在云計算上積累了大量的用戶數(shù)據(jù),包括用戶的行為、交易等等,而這些都已經(jīng)存儲在云計算之上;第二,我們將傳統(tǒng)的數(shù)據(jù)遷移到云計算上,因為云計算能夠提供最廉價、最好的數(shù)據(jù)管理平臺;第三,對于數(shù)據(jù)的加密審計以及合規(guī),對從業(yè)人員的要求越來越苛刻,我們就需要有這樣的工具平臺幫助我們實現(xiàn)對于數(shù)據(jù)的管控。對于企業(yè)來說我們面對的是數(shù)據(jù)服務(wù),而數(shù)據(jù)服務(wù)最好的載體恐怕就是云計算。還有一種新的嘗試方法就是我稱之為“眾包”的人工標(biāo)注。在人工智能的應(yīng)用中,大家都知道需要有高質(zhì)量的標(biāo)注數(shù)據(jù)作為訓(xùn)練的基礎(chǔ),高質(zhì)量的人工標(biāo)注數(shù)據(jù)非常昂貴和復(fù)雜,眾包是解決這個難題很有效的方法。 我們利用這些數(shù)據(jù)可以做什么?是否可以不再受限于只能算法進行處理?我們不僅可以實現(xiàn)對靜態(tài)數(shù)據(jù)進行處理,在很多場景下也可以對數(shù)據(jù)流進行實時分析。我們在計算資源上沒有了內(nèi)存的限制,可以對海量的數(shù)據(jù)進行訓(xùn)練和建模。甚至我們訓(xùn)練的過程不再是重復(fù)的過程,每一次訓(xùn)練結(jié)果可以作為再訓(xùn)練的基礎(chǔ),也意味著我們的訓(xùn)練速度大大加快。 同時,數(shù)據(jù)應(yīng)用的形態(tài)在某種意義上已經(jīng)出現(xiàn)了人工智能服務(wù)的概念。通過云計算將成熟的人工智能能力以一種服務(wù)的形式提供給社會,我們可以利用這樣的技術(shù)加速人工智能的處理數(shù)據(jù)速度。比如 AWS 云計算平臺上各種圖像處理、自然語言處理、語音處理的成熟應(yīng)用,我們可以利用它作為我們?nèi)斯ぶ悄芡黄频囊粋€選擇。 在算法的選擇上我們有很多可以嘗試的地方,一種思路就是利用云計算提供的平臺來進行算法的訓(xùn)練和部署,還可以將我們已經(jīng)訓(xùn)練好的成熟算法部署到云計算平臺上。同樣,我們也可以選擇最容易被大家接受的框架和技術(shù)。例如,與目前比較熱門的容器結(jié)合在一起,將容器深度學(xué)習(xí)的框架以更有效的方式打包部署應(yīng)用,這一切將帶來巨大的靈活性和便捷性。 我們再看看所謂的速度意味著什么,對于開發(fā)人員來講,開發(fā)一個人工智能應(yīng)用對速度的要求是非常嚴(yán)格的。 實現(xiàn)這些需求有哪些方法?首先,拋硬幣來決定,它有 50% 的準(zhǔn)確性,但是大家會覺得這一切如同兒戲。我們可以用邏輯回歸來推理,它的精度可以達(dá)到 74%,而神經(jīng)網(wǎng)絡(luò)的準(zhǔn)確率可以達(dá)到 82%,如果我們不斷地迭代使用了特征選擇的機制,它的精度就被提升到 92%。也就是說這種精度足以媲美人類,可以應(yīng)用到我們的生產(chǎn)環(huán)境當(dāng)中。 在迭代的選擇方面有很多可以嘗試的方向。比如說可以在本地利用大家熟悉的 Notebooks 模式進行訓(xùn)練,也可以考慮利用 AWS 發(fā)布的 SageMaker 服務(wù)。在 AWS 有一款處理能力達(dá)到千億次的計算服務(wù)——就是 P3 實例,這種能力將使得難題挑戰(zhàn)都可以迎刃而解。在未來發(fā)展趨勢方面,人工智能具備另外一個優(yōu)勢就是分布式能力,這樣未來所面臨的問題尤其是計算資源不足的問題,都可以加以解決。 最近有一款很有意思的攝像頭產(chǎn)品將會在美國上市,名字是 AWS Deep Lens。這是一款面向開發(fā)人員的應(yīng)用深度學(xué)習(xí)技術(shù)的攝像頭。它提供了實用深度學(xué)習(xí)模型來處理計算視覺的能力。我們可以很容易地用它進行開發(fā)圖像/視頻相關(guān)的智能應(yīng)用。未來這種類型的產(chǎn)品可能會越來越多,并會普及到我們生活、工作的許多場景當(dāng)中。可以想象,有了云的支持,這個產(chǎn)品的爆發(fā)是指日可待的。 我們的目標(biāo)是什么?我們?yōu)槭裁匆鋈斯ぶ悄??我們的目?biāo)就是要將人工智能能力放到每個開發(fā)者和數(shù)據(jù)科學(xué)家的手上。這就是 AWS 的使命。 人工智能+云計算將創(chuàng)造新的機遇 最后分享一個小小的案例:大家可能聽到許多關(guān)于人工智能不斷創(chuàng)新的故事,我想大家可能更關(guān)心在一個企業(yè)當(dāng)中人工智能究竟能為我們帶來什么?我選這個案例是一家名為 Intuit 的美國公司。這是一家歷史悠久的公司,成立于 1983 年,經(jīng)歷了 DOS、Windows、Web、移動應(yīng)用、云計算多個技術(shù)年代。這樣的企業(yè),它在人工智能領(lǐng)域做了怎樣的嘗試? 熟悉的人知道這是一家面向個人提供金融服務(wù)的軟件服務(wù)商,提供了很多例如報稅、資產(chǎn)管理、帳單管理的應(yīng)用。這家企業(yè)的技術(shù)發(fā)展歷程可以讓我們看到在新時代里面,一個企業(yè)如何通過新的技術(shù)不斷獲得新生。 在 2013 年這家公司開始全面擁抱云計算,幫助它加速了業(yè)務(wù)發(fā)展。它所利用的云計算應(yīng)用包括四個階段: 一,利用云計算的基礎(chǔ)設(shè)施,這是比較初級的階段; 二,將應(yīng)用布局到云計算之上; 三,利用云計算進行數(shù)據(jù)管理和處理; 四,使用人工智能幫助它實現(xiàn)業(yè)務(wù)突破。 這是這家公司在使用的 AWS 資源和產(chǎn)品服務(wù),他們在云計算這個問題采用了全面擁抱的姿態(tài),這是值得我們?nèi)ソ梃b的思維角度。 對于人工智能云計算來說,云計算所帶來的優(yōu)勢是什么? 第一,彈性能力。對于計算資源、網(wǎng)絡(luò)存儲來說,彈性就是沒有任何局限,可以針對用戶的需求不斷進行調(diào)整和優(yōu)化; 第二,同時具備快速部署能力,產(chǎn)品從原型到真正的產(chǎn)品速度大大提升; 第三,利用云計算提供的數(shù)據(jù)分析能力,真正實現(xiàn)了數(shù)據(jù)湖的分析; 第四,人工智能帶來的加速和諸多好處。 傳統(tǒng)的人工智能應(yīng)用有這樣的經(jīng)歷,我們需要進行架構(gòu)設(shè)計、選擇計算資源、連接到數(shù)據(jù)、構(gòu)建我們的服務(wù)。服務(wù)本身要實現(xiàn)可均衡,這是架構(gòu)設(shè)計需要的幾個環(huán)節(jié),每個環(huán)節(jié)都有巨大的不確定性和風(fēng)險挑戰(zhàn),需要我們在這過程中解決。 以現(xiàn)在的眼光來看,這個方法也許已經(jīng)過時了,新的方法就是在云計算的平臺上提供一種真正的解決思路,這種思路使數(shù)據(jù)科學(xué)真正成為了數(shù)據(jù)科學(xué)家,而不再重復(fù)繁瑣的工作。 所有的部署管理和架構(gòu)設(shè)計,都是基于一個成熟的生態(tài)體系來完成的,所有這一切的努力帶來最明顯的變化就是在云計算上一個機器學(xué)習(xí)的模型和部署的時間,從之前的六個月簡化到不到一個星期。 今天這家企業(yè)還在不斷地嘗試和發(fā)展,他們也看到了新的應(yīng)用場景,比如持續(xù)訓(xùn)練的模型,使用 Spark 集群用于數(shù)據(jù)處理,也在嘗試將語音轉(zhuǎn)換為文本,甚至針對用戶的數(shù)據(jù)進行語義分析??梢栽O(shè)想這些嘗試一旦得到驗證,這些服務(wù)將會對企業(yè)帶來何等意義的幫助。 從這家公司的應(yīng)用來看,云計算和人工智能的結(jié)合帶給他們的是強大的洞察力。可以實現(xiàn)個性化的產(chǎn)品,可以針對用戶的需求進行更好地預(yù)測,而且不僅僅局限在傳統(tǒng)的業(yè)務(wù)范圍,而是有更廣泛的空間,更重要的是速度遠(yuǎn)超以往,帶來了無限的可能。 AWS + Intuit,這個故事告訴我們,無論什么樣的企業(yè)都可以通過人工智能和云計算的結(jié)合帶給我們新的機遇。談了許多的人工智能和云計算,不如我們?nèi)バ袆?,也借助今天告訴大家,這個時代需要我們?nèi)バ袆樱枰獙⑷斯ぶ悄芎驮朴嬎闩c我們的工作結(jié)合在一起,也預(yù)祝大家未來在這條不斷創(chuàng)新的路有更好的成果,謝謝大家。 (完) |
|