Derrick Harris | 2016-02-28 21:30
從語音控制到圖像搜索,再到無人駕駛汽車,人工智能最近很火爆,也的確值得關(guān)注。但感知與現(xiàn)實之間往往存在差異。百度首席科學(xué)家吳恩達(dá)接受《財富》專訪,解釋了為什么人工智能變得如此熱門,公司如何利用人工智能賺錢,以及人們對人工智能大災(zāi)變的擔(dān)憂為什么是不切實際的。
如今,人工智能似乎無處不在,它被用于智能手機(jī)上的語音控制和圖像搜索,并提供了無人駕駛汽車和機(jī)器人的大腦。在這一領(lǐng)域,最受關(guān)注的是美國谷歌、Facebook和微軟公司,但中國的搜索巨頭百度同樣是一支重要的力量。
百度人工智能的研發(fā)公司由該公司首席科學(xué)家吳恩達(dá)領(lǐng)銜,他之前在斯坦福大學(xué)教授機(jī)器學(xué)習(xí),參與創(chuàng)建在線課程平臺Coursera和谷歌大腦項目。2012年,谷歌大腦項目證明,計算機(jī)可以通過自我學(xué)習(xí)識別出YouTube視頻中的貓,由此激發(fā)了大眾對深度學(xué)習(xí)這一人工智能領(lǐng)域的興趣。吳恩達(dá)在加州森尼維爾創(chuàng)建了百度人工智能實驗室。在此次采訪中,他解釋了為什么人工智能現(xiàn)在變得如此熱門,公司如何利用人工智能賺錢,以及為什么人們對未來的人工智能大災(zāi)變的擔(dān)憂是不實際的。
以下是本次獨家專訪的主要內(nèi)容:
《財富》雜志:你如何定義人工智能,至少就商業(yè)上可行的人工智能應(yīng)用而言?
吳恩達(dá):過去幾年,我們看到,計算機(jī)在吸收數(shù)據(jù)進(jìn)行預(yù)測方面做得越來越好。其中包括預(yù)測用戶最有可能點擊哪類廣告,識別圖片中的人,預(yù)測網(wǎng)頁中哪些內(nèi)容與你的搜索關(guān)鍵詞最相關(guān)——這樣的例子不勝枚舉。這些應(yīng)用帶來了更好的用戶體驗,而且為一些公司帶來了更多收入。
《財富》:是不是可以說,主流人工智能更多的是識別數(shù)據(jù)模式,而不是創(chuàng)建能像人一樣思考的計算機(jī)?
吳恩達(dá):盡管人工智能非常火爆,但我認(rèn)為,它們的發(fā)展程度遠(yuǎn)遠(yuǎn)低于人們的想象。目前的人工智能所創(chuàng)造的價值均來自一類技術(shù)——監(jiān)督學(xué)習(xí)。所謂監(jiān)督學(xué)習(xí)是指根據(jù)系統(tǒng)已經(jīng)看到的其他輸入示例,預(yù)測結(jié)果或?qū)κ录M(jìn)行分類,例如“給出一張圖片,找出其中的人”?;蛘摺敖o出一個網(wǎng)頁,預(yù)測用戶是否會點擊這個網(wǎng)頁。”或者“給出一封電子郵件,確定這是不是垃圾郵件?!?
語音識別是另外一個例子,其中輸入的是音頻片段,輸出的是說話內(nèi)容的文本。
《財富》:蘋果新發(fā)布的Siri功能,使語音識別技術(shù)成為媒體關(guān)注的焦點。未來可以采取哪些措施使助手類應(yīng)用變得更加有用?
吳恩達(dá):我們的期望是,努力使與計算機(jī)交談變得像與真人交談一樣自然。這是一個遙遠(yuǎn)的目標(biāo),短期內(nèi)不會實現(xiàn),但一旦我們能夠?qū)崿F(xiàn)這個目標(biāo),就會有更多用戶使用它。今天,使用語音功能的主要是科技發(fā)燒友。大多數(shù)人在與計算機(jī)互動的過程中并不會使用語音。
與一臺機(jī)器交談的感覺,和與真人交流的感覺仍有明顯差異:你只能說某些事情,你不能打斷計算機(jī)。有時候,等待機(jī)器做出回應(yīng)需要較長的時間。有時候你說出某些內(nèi)容,機(jī)器無法理解。舉一個典型的例子:比如我對著一臺電腦說:“請呼叫卡洛兒555-1000……不,等一下,是1005,”計算機(jī)能夠準(zhǔn)確理解這些話,并完成正確的操作嗎?
《財富》:幾年前,似乎很少有面向消費者的人工智能,但如今,語音識別和能夠識別圖片的算法等技術(shù)似乎變得非常普遍,這期間到底發(fā)生了哪些變化?
吳恩達(dá):計算能力的提高和數(shù)據(jù)的增多,推動機(jī)器學(xué)習(xí)領(lǐng)域取得了很大的進(jìn)步,盡管這種觀點在學(xué)術(shù)界并不受歡迎。以造火箭來打個比方:你需要一臺巨大的火箭引擎,你還要有足夠的燃料。如果你的火箭引擎太小,卻有大量的燃料,你的火箭可能無法起飛。如果你有一臺巨大的火箭引擎但燃料較少,你可能無法讓火箭進(jìn)入軌道。
只有一臺巨大的引擎和足夠的燃料,才能讓火箭到達(dá)有趣的地方。在這個比喻中,火箭引擎便是大型計算機(jī)——在百度,也就是我們正在建造的超級計算機(jī)——而火箭燃料便是我們擁有的大量數(shù)據(jù)。
過去十年間,數(shù)據(jù)的積累或者說火箭燃料的增加,超出了我們建造火箭引擎吸收這些燃料的能力。但現(xiàn)在,我們有能力增大我們的火箭引擎,甚至已經(jīng)超越了提供火箭燃料的能力。你必須努力增大同步提高這兩方面的能力。
似乎每一次將深度學(xué)習(xí)應(yīng)用到一項任務(wù)當(dāng)中,都會產(chǎn)生最佳的結(jié)果。我們能否將其應(yīng)用于公司的銷售數(shù)據(jù),從而比傳統(tǒng)的企業(yè)軟件或流行的“大數(shù)據(jù)”工具更快生成有意義的見解?
深度學(xué)習(xí)所面臨的一個重要限制是,其創(chuàng)造的幾乎所有價值都在輸入-輸出映射當(dāng)中。如果在企業(yè)數(shù)據(jù)中,X代表亞馬遜的一個用戶賬號,Y代表“他們是否曾進(jìn)行購物?”而且你有大量X-Y配對的數(shù)據(jù),那么你就可以采用深度學(xué)習(xí)。但我想說的是,在自行檢索數(shù)據(jù)和發(fā)現(xiàn)價值方面,這類算法仍處在起步階段。
這也是為什么我認(rèn)為人工智能將催生殺手機(jī)器人和超級智能屬于過分炒作。這種X-Y類映射是一種非常狹隘的學(xué)習(xí)方式。人類的學(xué)習(xí)方式要更加豐富。用術(shù)語來說,這種方式叫監(jiān)督學(xué)習(xí),我認(rèn)為到目前為止,我們還沒有找到其他學(xué)習(xí)類型的正確思路。
根據(jù)數(shù)據(jù)去探索世界的無監(jiān)督學(xué)習(xí)便是其他學(xué)習(xí)類型之一。人類在這方面似乎很有天分。計算機(jī)雖然有令人不可思議的基礎(chǔ)算法,可以進(jìn)行一定程度的無監(jiān)督學(xué)習(xí),但遠(yuǎn)遠(yuǎn)達(dá)不到人腦的水平。
《財富》:谷歌和Facebook在美國獲得了極大的關(guān)注,請告訴我們百度正在進(jìn)行哪些由人工智能驅(qū)動的工作?
吳恩達(dá):百度之前進(jìn)行的一項工作是創(chuàng)建內(nèi)部的深度學(xué)習(xí)平臺。我們所作的是讓全公司的工程師,包括非人工智能研究人員,以各種創(chuàng)造性的方式使用深度學(xué)習(xí)——許多方式是我和其他人工智能研究人員不可能想到的。以深度學(xué)習(xí)驅(qū)動的創(chuàng)造性產(chǎn)品有很多,不僅僅限于我們的網(wǎng)頁搜索、圖片搜索和廣告等核心業(yè)務(wù)。
比如:我們的計算機(jī)安全產(chǎn)品使用深度學(xué)習(xí)來識別威脅。我本來不可能想到這一點,也不可能知道如何實現(xiàn)。我們使用深度學(xué)習(xí)來嘗試提前預(yù)測硬盤會在哪一天出現(xiàn)故障,而這提高了我們的數(shù)據(jù)中心的可靠性,降低了成本。
《財富》:百度也創(chuàng)造出一項與谷歌眼鏡類似的技術(shù),一個數(shù)字助手,甚至還有一款智能自行車。這些產(chǎn)品有市場嗎?或者目前只是有趣的實驗品?
吳恩達(dá):我認(rèn)為它們目前仍處在研究探索階段。不過根據(jù)社區(qū)反饋,這些產(chǎn)品肯定會有需求,比如智能自行車和可穿戴攝像機(jī)。
實際上,我們之前在中國演示了一款名叫Dulife的新產(chǎn)品,這款產(chǎn)品采用計算機(jī)視覺和自然語言處理,告訴盲人前方有什么。例如,在中國,多種不同面值的鈔票尺寸相同,盲人必須通過觸摸來確定它們的區(qū)別。但一張鈔票在流通一段時間之后,觸摸部分會被磨損,盲人便很難確定鈔票的面值。在這個應(yīng)用案例中,簡單的計算機(jī)視覺可以告訴你,你手中的鈔票是20元還是50元。這是盲人迫切需要的一項應(yīng)用。
《財富》:作為百度的主要市場,在移動或可穿戴設(shè)備方面,中國市場與美國市場或其他市場有何區(qū)別?
吳恩達(dá):中國市場迥然不同。差異之一是,中國目前最大、最熱門的科技潮流是O2O或線上線下電子商務(wù)。
O2O的概念是指,利用移動設(shè)備連接到周圍的實體服務(wù),比如洗車、送餐、尋找當(dāng)?shù)氐恼劭垭娪?、尋找美甲店或聘請一位廚師到家中為你烹飪美食等。美國也有這樣的服務(wù),但我想中國的人口密度已經(jīng)推動O2O迅速崛起。
此外,許多中國用戶的第一臺計算設(shè)備是智能手機(jī)。如果你的第一臺計算設(shè)備是手機(jī),你就會直接學(xué)習(xí)使用手機(jī)最有效的方式,不需要完成從電腦到手機(jī)的過渡。
《財富》:我們什么時候才不會將人工智能視為一項新奇事物,轉(zhuǎn)而將它看做一項理所當(dāng)然的主流技術(shù)?
吳恩達(dá):我感覺,在高德納技術(shù)成熟度曲線上,我們或許正在達(dá)到峰值。對超級人工智能的極度擔(dān)憂也許就是這個峰值,我們正在經(jīng)歷這個階段。實際情況很難預(yù)測,我也可能是錯的,但我希望未來對人工智能技術(shù)能少一些炒作,更多專注技術(shù)的進(jìn)步。
即便在計算機(jī)視覺領(lǐng)域,雖然培訓(xùn)計算機(jī)識別物品、人臉和手寫文字方面,我們已經(jīng)取得了顯著的進(jìn)步,但我們?nèi)绾卧诋a(chǎn)品中整合這項技術(shù),卻落后于技術(shù)本身的發(fā)展。
《財富》:所以,當(dāng)我們的應(yīng)用或設(shè)備可以識別人類或周圍的物品時,我們還無法做到泰然接受的地步?
吳恩達(dá):我想在計算機(jī)視覺方面,還需要一段時間,因為目前尚沒有太多計算機(jī)視覺產(chǎn)品出現(xiàn)。不過,我可以分享一種非常有市場前景的應(yīng)用。
在百度的廣告系統(tǒng)中,如果我們向用戶展示一段文字,效果很不錯。但有了深度學(xué)習(xí)技術(shù),它可以幫助廣告商選擇在向用戶提供文本的同時,展示一個小圖片。這樣一來,用戶不需要閱讀一大段關(guān)于在巴厘島度假的文字,廣告商會展示一張巴厘島的圖片,用戶一瞬間就能理解廣告的意圖。用戶可以用更快的速度理解廣告在講什么,這項技術(shù)也將對我們連接用戶和廣告商的能力產(chǎn)生顯著影響。(財富中文網(wǎng))
譯者:劉進(jìn)龍/汪皓
審校:任文科