(本文翻譯自thenextweb,原作者:Ben Dickson ) 隨著人工智能的深度學(xué)習(xí)技術(shù)持續(xù)進(jìn)步,一些最新的技術(shù)進(jìn)步毫無疑問重新點燃了人們對類人AI的興趣,這些類人AI指的是可以像人類一樣思考和行動的機(jī)器或通用人工智能。這種AI的需求是巨大的。現(xiàn)在人們的想法是,通過構(gòu)建更大更好的神經(jīng)網(wǎng)絡(luò),可以創(chuàng)造越來越接近創(chuàng)建人腦的數(shù)字版本。這有可能會實現(xiàn)嗎? 計算機(jī)科學(xué)家埃里克·拉森認(rèn)為,這是一個神話,因為所有證據(jù)都表明人類和機(jī)器智能完全不同。埃里克·拉森認(rèn)為,廣泛宣傳的對智能和推理的誤解,導(dǎo)致人工智能研究走上限制創(chuàng)新和科學(xué)發(fā)現(xiàn)的狹窄道路。 他警告說,除非科學(xué)家、研究人員和支持他們工作的機(jī)構(gòu)堅守初心,不改變方向,否則他們將注定要屈服于機(jī)器王國的爬行式進(jìn)步,在那里真正的發(fā)明被邊緣化,關(guān)于未來主義的言論會占據(jù)科學(xué)研究的主要,他們所鼓吹的方法卻往往來自根深蒂固的利益。 從科學(xué)的角度來看,人工智能的神話假設(shè)是這樣的:我們將通過在狹窄的應(yīng)用程序上取得進(jìn)展來實現(xiàn)通用人工智能 (AGI),例如對圖像進(jìn)行分類、理解語音命令或玩游戲。但是,這些狹義人工智能系統(tǒng)背后的技術(shù)并沒有解決一般智能能力必須解決的更廣泛的挑戰(zhàn),例如進(jìn)行基本對話、在家里完成簡單的家務(wù)或其他需要常識的任務(wù)。 “當(dāng)我們成功地應(yīng)用更簡單、更狹隘的智能版本時,這些智能版本受益于更快的計算機(jī)和大量數(shù)據(jù),我們并沒有取得漸進(jìn)式進(jìn)展,而是在摘取唾手可得的果實,這些果實在樹枝的最低端。”拉森寫道。人工智能神話的文化后果是忽視智能的科學(xué)奧秘,無休止地談?wù)撋疃葘W(xué)習(xí)和其他當(dāng)代技術(shù)的持續(xù)進(jìn)步。這個神話阻礙了科學(xué)家思考解決智力挑戰(zhàn)的新方法。 “如果我們選擇忽略核心謎團(tuán)而不是直面它,我們就不太可能獲得創(chuàng)新,”拉森寫道?!敖】档膭?chuàng)新文化強(qiáng)調(diào)探索未知事物,而不是大肆宣傳現(xiàn)有方法的擴(kuò)展……關(guān)于人工智能不可避免的成功的神話往往會扼殺真正進(jìn)步所必需的發(fā)明文化?!?/span> 演繹、歸納和溯因推理 來看一些簡單的邏輯例子:比如你走出家門,注意到街道是濕的。你的第一個想法是一定是下雨了。但是天氣晴朗,人行道干燥,因此您立即排除了下雨的可能性。當(dāng)你往旁邊看時,你看到一輛灑水車停在街上。您得出結(jié)論,道路是濕的,因為灑水車沖洗了它。 這是一個人的“推理”過程,從觀察到結(jié)論的行為,是智能生物的基本功能。我們不斷地根據(jù)我們所知道的和我們所感知的來推斷事物。這大多數(shù)情況是在潛意識中發(fā)生的,在我們的思想背景中,沒有重點和直接關(guān)注?!叭魏瓮评硐到y(tǒng)都必須具有一些基本的智能,因為使用已知的和觀察到的來更新信念的行為不可避免地與我們所說的智能相關(guān)聯(lián),”拉森表示。 AI 研究人員的系統(tǒng)基于兩種類型的推理機(jī)制:演繹和歸納。演繹推理使用先驗知識來推理世界。這是符號人工智能的基礎(chǔ),也是人工智能早期幾十年研究人員的主要關(guān)注點。工程師通過賦予它們一組預(yù)定義的規(guī)則和事實來創(chuàng)建符號系統(tǒng),人工智能使用這些知識來推理它接收到的數(shù)據(jù)。 在過去十年中,歸納推理在人工智能研究人員和科技公司中越來越受到關(guān)注,它是通過經(jīng)驗獲取知識。機(jī)器學(xué)習(xí)算法是歸納推理引擎。在相關(guān)示例上訓(xùn)練的 ML 模型將找到將輸入映射到輸出的模式。近年來,人工智能研究人員使用機(jī)器學(xué)習(xí)、大數(shù)據(jù)和高級處理器來訓(xùn)練超出符號系統(tǒng)能力的任務(wù)模型。 第三種推理,溯因推理,最早由美國科學(xué)家查爾斯·桑德斯·皮爾斯在 19 世紀(jì)提出。溯因推理是一種認(rèn)知能力,可以提出直覺和假設(shè),做出比隨機(jī)刺探真相更好的猜測。 例如,街道變濕的原因可能有很多(包括一些我們以前沒有直接經(jīng)歷過的),但溯因推理使我們能夠選擇最有希望的假設(shè),快速消除錯誤的假設(shè),尋找新的假設(shè)并得出可靠的結(jié)論。正如 Larson 在《人工智能的神話》中所說的那樣,“我們猜測,在有效無限可能性的背景下,哪些假設(shè)看起來可能或合理。” 溯因推理是許多人所說的“常識”。它是我們查看事實或數(shù)據(jù)的概念框架,也是將其他類型的推理結(jié)合在一起的粘合劑。它使我們能夠隨時關(guān)注我們頭腦中存在的大量信息和我們通過感官接收到的大量數(shù)據(jù)之間的相關(guān)內(nèi)容。問題在于 AI 社區(qū)還沒有對溯因推理給予足夠的重視。 人工智能與溯因推理 在20世紀(jì)80年代和90年代,溯因推理進(jìn)入人工智能的討論,試圖進(jìn)行機(jī)器邏輯的新方式,但這些努力都有缺陷,后來被放棄。拉森認(rèn)為“就在人工智能的邏輯方式上來說,溯因推理實際上是邏輯編程的重新表述,是演繹的一種變體。”溯因推理在 2010 年代獲得了另一個機(jī)會,貝葉斯網(wǎng)絡(luò)(又稱信念網(wǎng)絡(luò)),它是一種模擬人類推理過程中因果關(guān)系的不確定性處理模型。 但與早期的方法一樣,新的方法也有一個缺陷,即沒有捕捉到真正的原因。拉森說,貝葉斯和其他圖形模型“是歸納的變體”。在人工智能的神話中,他將它們稱為“名不副其實”。在大多數(shù)情況下,人工智能的歷史一直以演繹和歸納這兩種邏輯方式為主。 “當(dāng) [Alan] Newell、[Herbert] Simon、[John] McCarthy 和 [Marvin] Minsky 等早期人工智能先驅(qū)提出人工推理(人工智能的核心)的問題時,他們認(rèn)為編寫演繹式規(guī)則會足以產(chǎn)生智慧的思想和行動,”拉森說?!笆聦嵅⒎侨绱?,事實上,早先在關(guān)于我們?nèi)绾伍_展科學(xué)的討論中就應(yīng)該承認(rèn)這一點?!?/span> 幾十年來,研究人員試圖通過為符號 AI 系統(tǒng)提供手動編寫的規(guī)則和事實來擴(kuò)展它們的能力。前提是,如果你賦予人工智能系統(tǒng)人類所知道的所有知識,它就能像人類一樣聰明地行動。但純粹的符號人工智能由于種種原因而失敗了。符號系統(tǒng)無法獲取和添加新知識,這使得它們變得僵化。創(chuàng)建符號 AI 變成了無休止的追逐,添加新的事實和規(guī)則,結(jié)果卻發(fā)現(xiàn)系統(tǒng)犯了無法修復(fù)的新錯誤。我們的大部分知識都是隱含的,無法用規(guī)則和事實來表達(dá),也無法提供給符號系統(tǒng)。 “這很奇怪,沒有人真正明確地停下來說'等等,這行不通!’”拉爾森說。在過去的二十年里,隨著數(shù)據(jù)和計算資源的可用性不斷增加,機(jī)器學(xué)習(xí)算法——尤其是深度神經(jīng)網(wǎng)絡(luò)——已經(jīng)成為人工智能社區(qū)關(guān)注的焦點。深度學(xué)習(xí)技術(shù)已經(jīng)解鎖了許多以前超出計算機(jī)極限的應(yīng)用。它吸引了世界上一些最富有的公司的興趣和資金。 “我認(rèn)為隨著萬維網(wǎng)的出現(xiàn),人工智能被經(jīng)驗或歸納(以數(shù)據(jù)為中心)的方法接管了,而與演繹一樣的溯因,在很大程度上被遺忘了,”拉森說。 但機(jī)器學(xué)習(xí)系統(tǒng)也受到嚴(yán)重限制,包括缺乏因果關(guān)系、邊緣情況處理不當(dāng)以及需要太多數(shù)據(jù)。隨著研究人員嘗試將 ML 應(yīng)用于醫(yī)療保健和金融等敏感領(lǐng)域,這些限制變得越來越明顯和成問題。 包括強(qiáng)化學(xué)習(xí)先驅(qū) Richard Sutton 在內(nèi)的一些科學(xué)家認(rèn)為,我們應(yīng)該堅持使用可以隨著數(shù)據(jù)和計算的可用性而擴(kuò)展的方法,即學(xué)習(xí)和搜索。例如,隨著神經(jīng)網(wǎng)絡(luò)變得越來越大并接受更多數(shù)據(jù)的訓(xùn)練,它們最終會克服自己的限制并帶來新的突破。 Larson 認(rèn)為數(shù)據(jù)驅(qū)動的 AI 的擴(kuò)展“作為智能模型存在根本缺陷”。他重申,雖然搜索和學(xué)習(xí)都可以提供有用的應(yīng)用,但它們基于非溯因推理。 “如果沒有對推理進(jìn)行思考的革命,搜索將不會擴(kuò)展到常識或溯因推理,這還沒有發(fā)生。與機(jī)器學(xué)習(xí)類似,學(xué)習(xí)方法的數(shù)據(jù)驅(qū)動性質(zhì)本質(zhì)上意味著推理必須存在于數(shù)據(jù)中,可以這么說,而人們通常執(zhí)行的許多智能推理顯然并非如此,”拉森說?!拔覀儾恢皇腔仡欉^去,例如在大型數(shù)據(jù)集中捕獲,以找出對未來得出結(jié)論、思考或推斷的內(nèi)容?!?/span> 其他科學(xué)家認(rèn)為,將符號系統(tǒng)和神經(jīng)網(wǎng)絡(luò)結(jié)合在一起的混合人工智能將更有希望解決深度學(xué)習(xí)的缺點。一個例子是 IBM Watson,它在 Jeopardy(一個益智類節(jié)目) 中擊敗世界冠軍而出名。最近的概念驗證混合模型在符號 AI 和深度學(xué)習(xí)單獨表現(xiàn)不佳的應(yīng)用中顯示出令人欣慰的結(jié)果,這帶來了新的希望。 拉森認(rèn)為,混合系統(tǒng)可以填補(bǔ)僅機(jī)器學(xué)習(xí)或僅基于規(guī)則的方法的空白。作為自然語言處理領(lǐng)域的研究人員,他目前致力于將 GPT-3 等大型預(yù)訓(xùn)練語言模型與語義網(wǎng)絡(luò)上的舊工作以知識圖譜的形式相結(jié)合,以在搜索、問答、和其他任務(wù)。 “但演繹-歸納組合并不能讓我們進(jìn)行推理,因為這三種類型的推理在形式上是不同的,所以它們不會相互還原,也不能結(jié)合起來得到第三種,”他說。在人工智能的神話中,拉森將繞過溯因的嘗試描述為“推理陷阱”。 “無論計算機(jī)的速度有多快,像機(jī)器學(xué)習(xí)這樣的純粹歸納啟發(fā)的技術(shù)仍然不夠充分,而且像 Watson 這樣的混合系統(tǒng)也達(dá)不到一般的理解,”他寫道?!霸谛枰Z言理解等世界知識的開放式場景中,溯因是核心且不可替代的。正因為如此,將演繹和歸納策略結(jié)合起來的嘗試總是注定要失敗……該領(lǐng)域需要一個基本的溯因理論。與此同時,我們陷入了陷阱?!?/span> 人工智能的商業(yè)化 人工智能社區(qū)對數(shù)據(jù)驅(qū)動方法的狹隘關(guān)注已將研究和創(chuàng)新集中在少數(shù)擁有大量數(shù)據(jù)存儲和財力雄厚的組織中。隨著深度學(xué)習(xí)成為將數(shù)據(jù)轉(zhuǎn)化為有利可圖的產(chǎn)品的有用方法,大型科技公司現(xiàn)在陷入了招聘 AI 人才的激烈競爭中,通過提供豐厚的薪水將研究人員從學(xué)術(shù)界帶走。這種轉(zhuǎn)變使非營利實驗室和小公司很難參與 AI 研究。 (圖片來自thenextweb,僅做資料展示,如有侵權(quán)請聯(lián)系刪除) “當(dāng)你將人工智能的研究和開發(fā)與非常大的數(shù)據(jù)集的所有權(quán)和控制權(quán)聯(lián)系起來時,你就會為不擁有數(shù)據(jù)的初創(chuàng)企業(yè)設(shè)置一個進(jìn)入壁壘,”拉森說,數(shù)據(jù)驅(qū)動的人工智能本質(zhì)上創(chuàng)造了商業(yè)領(lǐng)域的“贏家通吃”情景。 人工智能的數(shù)據(jù)壟斷反過來又阻礙了科學(xué)研究。由于大型科技公司專注于創(chuàng)建可以利用其龐大數(shù)據(jù)資源保持領(lǐng)先于競爭對手的應(yīng)用程序。因此探索人工智能替代方法的動力很小。該領(lǐng)域的工作開始傾向于狹隘且有利可圖的應(yīng)用,而犧牲了可能導(dǎo)致新發(fā)明的努力。 “目前沒有人知道在沒有如此龐大的集中式數(shù)據(jù)集的情況下人工智能會是什么樣子,因此對于希望通過設(shè)計不同且更強(qiáng)大的人工智能進(jìn)行競爭的企業(yè)家來說,實際上沒有什么可提供的,”拉森說。 拉森警告了當(dāng)前的 AI 文化,這種文化“正在從唾手可得的果實中榨取利潤,同時繼續(xù)鼓吹 AI 神話?!彼麑懙?,對通用人工智能進(jìn)展的幻想可能導(dǎo)致另一個人工智能冬天。雖然人工智能寒冬可能會削弱對深度學(xué)習(xí)和數(shù)據(jù)驅(qū)動人工智能的興趣,但它可以為新一代思想家探索新途徑開辟道路??茖W(xué)家們應(yīng)該超越現(xiàn)有的方法。 在人工智能的神話中,拉森希望非專業(yè)人士有一些工具來對抗這種不科學(xué)的必然性思維,我的同事和其他人工智能科學(xué)家可以將其視為警鐘,由此開始研究非常真實的事物,該領(lǐng)域面臨的問題。 |
|