解讀科學(xué) 洞察本質(zhì) 戳穿忽悠 粉碎謠言 現(xiàn)在所有的人工智能程序,都和最簡單的程序一樣沒有智能。說是機(jī)器在學(xué)習(xí),其實機(jī)器做的仍然和過去一樣,沒有本質(zhì)區(qū)別。如果人類只管建神經(jīng)網(wǎng)絡(luò),把各種數(shù)據(jù)扔給機(jī)器自己去“領(lǐng)悟”,然后機(jī)器輸出了一些出人預(yù)料的、有意義的智力成果,那就真有本質(zhì)不同了。 2016年12月,《科學(xué)》雜志照例公布了年度十大科技進(jìn)展,其中圍棋人工智能AlphaGo擊敗人類高手排在第三位,僅次于引力波檢測,以及比鄰星系行星的發(fā)現(xiàn)(就是劉慈欣筆下三體人的行星)。同月《自然》公布的年度八大科技進(jìn)展中,AlphaGo排在第七位。圍棋人機(jī)大戰(zhàn)也在全社會引發(fā)了人工智能熱潮,機(jī)器在圍棋這個最難的博弈游戲中取得了出人意料的勝利,引發(fā)社會思考人工智能技術(shù)突破對人類的影響。 很多人對機(jī)器擁有與人類相當(dāng)甚至超過人類的智能這事很有興趣,在相關(guān)的科幻小說與電影中,人工智能也經(jīng)常是眾多媒體的關(guān)注焦點(diǎn)?!叭斯ぶ悄堋边@個詞本身就是常見詞匯,人們并不陌生,但其實大多數(shù)人對人工智能技術(shù)細(xì)節(jié)并不了解,有時會有一些誤解,或者作出過于夸張的解讀與聯(lián)想。 AlphaGo戰(zhàn)勝李世石是“人工”而非“智能” IT時代的人們早就熟悉了計算機(jī)的特性,如電腦做數(shù)學(xué)運(yùn)算速度遠(yuǎn)超人類,可以不眠不休一直穩(wěn)定運(yùn)行,程序可以海量快速復(fù)制,但我們并不把計算機(jī)看成智能。汽車跑得比人快,起重機(jī)比人力氣大,但這些都是人發(fā)明的工具,并沒有智能的感覺。人類對自身的智能非常自豪,認(rèn)為這是人特有的“本事”,動物沒有,機(jī)器也沒有,所以人類是“萬物之靈”。 五子棋、國際象棋、圍棋等“完全信息博弈”游戲,是一類典型的智力活動,其中圍棋是最難的一個。 1997年國際象棋AI深藍(lán)打敗了代表人類最高水平的卡斯帕羅夫,但當(dāng)時的圍棋程序非常差,水平比業(yè)余“低手”都差得多,怎么寫出能挑戰(zhàn)人類高手的圍棋AI毫無頭緒,沒法估計要多少年。 2016年AlphaGo戰(zhàn)勝李世石,以及年底升級版本Master在對人類高手快棋比賽中以60:0碾壓式勝利,可以說人類在最難的圍棋中都已經(jīng)被機(jī)器打敗了,找不到更難的棋類去顯示人相對機(jī)器的智力優(yōu)勢,人在這個類別的智力活動上已經(jīng)不如機(jī)器了。是不是說機(jī)器的智能已經(jīng)開始超過人類了?很多人對此很迷惑。 可以肯定地說,到目前為止,人工智能雖然在下棋、圖像識別、自動駕駛等多個領(lǐng)域取得了令人印象深刻的成就,但都只是“人工”的結(jié)果,完全是人類自身的智力活動成果?!皺C(jī)器智能”的進(jìn)展并沒有想象的那么大,甚至可以說毫無進(jìn)展,機(jī)器本身沒有任何智能。 從程序開發(fā)的角度看,如果先不管這些人工智能程序最終的效果,它們只不過是一些算法思想與程序代碼,并沒有任何特殊之處。代碼是程序員一行行編寫、修改、調(diào)試出來的,程序中用到的數(shù)據(jù)不管有多少,都是開發(fā)者有意識地收集、生成、維護(hù)的。如果告訴程序員群體,這里有一個程序,它的代碼是這些,數(shù)據(jù)是那些,它的功能是對給定的輸入產(chǎn)生期望的輸出,沒有任何一個程序員會感到奇怪,因為所有程序都是這樣的,利用電腦的存儲與數(shù)學(xué)運(yùn)算能力,設(shè)計算法寫代碼實現(xiàn),讓輸入的數(shù)據(jù)得到預(yù)想的輸出。 舉個例子,我們來看兩個程序。 第一個程序?qū)蓚€輸入數(shù)字的乘積輸出給用戶,并保證它是絕對正確的。 第二個程序?qū)τ谝粋€圍棋局面的輸入,給出兩個坐標(biāo)作為輸出,下這個點(diǎn)能夠獲勝。 我們可能把前一個程序叫工具,因為它就是計算器的一個功能,但是把后一個程序稱為有“智能”的AI,因為它看上去需要很深的智力思考。但是從使用的機(jī)器、開發(fā)的過程、最終生成的程序文件、程序執(zhí)行時的運(yùn)算過程等各方面來看,兩個程序本質(zhì)上完全一樣。可以說第二個程序除了最后展示出來像是智能,和第一個程序性質(zhì)上并沒有任何不同。 也就是說,現(xiàn)在所有的“人工智能”程序,都和最簡單的程序是一回事。聰明的算法設(shè)計者和程序員們,讓一些程序看上去有了“智力”才能實現(xiàn)的能力,并稱之為“人工智能”。實際執(zhí)行程序的電腦完全就是在執(zhí)行人類的指令,沒有任何智能。 可以說,目前的“人工智能”,都是人類智能的第二種展現(xiàn)方式。人可以直接用人腦去下棋,用的是人的智力思維。也可以寫程序代碼,用機(jī)器去替自己下棋,而且比第一種方式干得更好。人可以自己用鋤頭挖地,也可以開挖掘機(jī)挖地,這是人類勞動的兩種方式。在體力勞動上,挖掘機(jī)比人力氣大,顯然更先進(jìn),但沒有人會說挖掘機(jī)有智能。也就是說,人類的體力勞動方式能夠借助工具不斷變化,先是用手指挖地,再揮鋤頭挖,再開挖掘機(jī)挖,以后可能有更先進(jìn)的方式。而人類的智力思維,同樣也可以借助工具。人類可以自己用腦子算315*227,可以用算盤算,也可以用計算器算,可以用電腦上的EXCEL表格算,也可以說話讓手機(jī)AI助手算。無論哪種,都是人在用各種工具實現(xiàn)人解決問題不同的思路。 現(xiàn)在所有的人工智能程序也是如此,都是人類主動去發(fā)明創(chuàng)造一個工具,用另外一種辦法展示人類的智能。最終好像是一個機(jī)器下棋打敗了人類高手,人們說AlphaGo智能超過人類了。但其實是Deepmind團(tuán)隊里做算法設(shè)計與程序開發(fā)的十多個人,換了一種思維方式,借助電腦這個工具打敗了靠傳統(tǒng)思維下棋的人類高手。AlphaGo的單機(jī)版或者分布式版本中的CPU、GPU都只是工具,沒有任何智能,只是在做簡單的加減乘除運(yùn)算。AlphaGo不知道自己在下棋,它就是在機(jī)械地做算術(shù)。和人類高手對戰(zhàn)的,其實是程序開發(fā)者,他們是用設(shè)計算法寫程序的思路來下棋。 圖為AlphaGo開發(fā)團(tuán)隊,李世石真正的對手。左五為David Silver,左六為Aja Huang,負(fù)責(zé)算法設(shè)計的兩位核心成員。 如今的人工智能遠(yuǎn)沒有人們想象的那么強(qiáng)大 現(xiàn)在人工智能開始在很多領(lǐng)域嘗試人的專業(yè)“智力”工作。如人工智能像專家那樣分析醫(yī)療圖片,像保險專家那樣審核保單,像律師那樣分析案件涉及法律條款,像記者那樣寫稿件。很多人將這理解為,機(jī)器在代替了工人的體力勞動之后,開始沖擊知識水平更高的專家的工作了。甚至有些人憂心忡忡,怕自己的專業(yè)工作也變成能被機(jī)器取代的簡單勞動。 根據(jù)以上的分析,這并不是“機(jī)器”對人的沖擊,而是算法開發(fā)者與程序員們,在用另一種思維進(jìn)行各種專業(yè)智力活動。本質(zhì)是人類兩種思維方式的碰撞,一種是算法思維,一種是傳統(tǒng)專家思維。電腦與機(jī)器本身都只是工具,沒有思維沒有智能,體現(xiàn)的是背后指揮它們行動的人的意圖。算法開發(fā)團(tuán)隊,會設(shè)計算法寫程序?qū)崿F(xiàn),讓電腦去看醫(yī)療圖片給出分析結(jié)果,自己手工抄到紙上;而傳統(tǒng)醫(yī)生專家,用人眼看醫(yī)療圖片給出判斷,他們也會用電腦,如把圖片顯示在電腦屏上,給出的結(jié)論輸入到電腦存成文件。兩種思維方式的區(qū)別是,對電腦不同的利用水平。 如果說近兩三年“人工智能”取得了巨大突破,那更接近事實真相的描述是:熱衷于算法設(shè)計與程序工程實現(xiàn)的開發(fā)者群體取得了巨大進(jìn)展。他們搞出了一些先進(jìn)技術(shù),借助電腦把觸角伸到非常多的領(lǐng)域里去。以前這些領(lǐng)域是被人類傳統(tǒng)“專家”占據(jù)的,現(xiàn)在算法開發(fā)者們認(rèn)為自己能用新的思維方法在這些領(lǐng)域搞出大的創(chuàng)新,在效率、可靠性、識別率等指標(biāo)上超過傳統(tǒng)專家。 這些技術(shù)可以統(tǒng)稱為“機(jī)器學(xué)習(xí)”,是近年來發(fā)展最快的科技領(lǐng)域之一。雖然說是“機(jī)器”在學(xué)習(xí),其實機(jī)器仍然和過去一樣,做的是數(shù)據(jù)存儲、數(shù)學(xué)運(yùn)算,沒有本質(zhì)區(qū)別。所有機(jī)器學(xué)習(xí)技術(shù)的共同特征是,電腦存儲了一些“系數(shù)”,這些系數(shù)是“神經(jīng)網(wǎng)絡(luò)”、“分類器”等數(shù)學(xué)結(jié)構(gòu)中可變的部分,開發(fā)者讓電腦程序執(zhí)行或多或少的“樣本”進(jìn)行“訓(xùn)練”,得到正確或者錯誤的輸出,根據(jù)結(jié)果回頭去正向負(fù)向改變這些系數(shù)。近年來的新趨勢是:
2. 用于訓(xùn)練的樣本數(shù)量,從過去的幾百、幾千,發(fā)展到幾十萬、上百萬個。訓(xùn)練需要的時間越來越長,需要GPU、機(jī)器學(xué)習(xí)專用芯片等新式的硬件支持,過去的硬件跑不動訓(xùn)練了。 3. 訓(xùn)練樣本,過去是人工收集、人工標(biāo)注正確輸出,現(xiàn)在發(fā)展到機(jī)器自我“強(qiáng)化學(xué)習(xí)”。如AlphaGo進(jìn)行海量的自我對局,生成幾千萬個樣本,回頭用于神經(jīng)網(wǎng)絡(luò)訓(xùn)練。也有些樣本是程序在互聯(lián)網(wǎng)上用“爬蟲”自動收集的。因此,機(jī)器學(xué)習(xí)有時需要海量的服務(wù)器支持,可能需要十萬個以上,有實力的公司才做得了。 4. 研究者群體在機(jī)器訓(xùn)練方法上取得了突破,對于很復(fù)雜的數(shù)學(xué)結(jié)構(gòu)、海量的樣本,想出了“深度學(xué)習(xí)”這樣的辦法。在語音識別、圖像識別等多個領(lǐng)域,最終效果甚至可以超過人類的水平,在指標(biāo)效果上比過去有了重大突破。程序識別率指標(biāo)突破臨界點(diǎn)以后,就會對產(chǎn)業(yè)產(chǎn)生爆發(fā)式?jīng)_擊。如語音識別幾十年來都在研發(fā),準(zhǔn)確率一直在提升,但都不溫不火。但這兩年來準(zhǔn)確率足以實用了,一下就爆發(fā)了。 因此,目前人工智能行業(yè)與社會其它行業(yè)的互動趨勢是,機(jī)器學(xué)習(xí)研究者群體會用以上這些技術(shù),去各種有價值的行業(yè)里,用算法與程序思路去解決專業(yè)問題,提供另一種智力勞動的方式。當(dāng)他們在一個行業(yè)成功了,這個行業(yè)就面臨重大技術(shù)變革,舊的從業(yè)人員確實會受到?jīng)_擊。但是正如前面所述,這并不是機(jī)器對人的挑戰(zhàn),而是算法與程序思維的人群,對傳統(tǒng)思維人群的挑戰(zhàn)。 這種挑戰(zhàn)是真實正在發(fā)生的。上面描述的人工智能技術(shù)仍然在高速發(fā)展,還沒有遇到之前幾次人工智能熱潮遇到的瓶頸。人工智能技術(shù)突破一定會在更多行業(yè)中發(fā)生。作為社會大眾,其實我們已經(jīng)不知不覺已經(jīng)用了很多人工智能的成果,如手機(jī)語音輸入,停車場自動收費(fèi),高速公路卡口自動開閘通行,高效的快遞分發(fā),可以說全是好事。 至于說舊的從業(yè)人員會受到什么樣的影響,應(yīng)該要具體行業(yè)具體分析??梢钥隙ㄒ恍┬袠I(yè)的從業(yè)人數(shù)會大幅減少,如港口集裝箱理貨人員數(shù)量會大降,富士康生產(chǎn)線上的工人會減少,智能機(jī)器會增加。這些簡單勞動,并不需要特別的專業(yè)知識,普通人經(jīng)培訓(xùn)后都可以做。用機(jī)器代替人做簡單勞動,將人從枯燥繁重甚至危險的工作中解放出來,從生產(chǎn)力角度看應(yīng)該對全社會有益,能夠創(chuàng)造更多社會福利。如果發(fā)生大規(guī)模的失業(yè),這是社會生產(chǎn)關(guān)系的范疇,只要社會在福利分配上做好,解決問題沒有本質(zhì)困難。歐洲一些國家這方面走在前面。往深里說,甚至可以設(shè)想“機(jī)器共產(chǎn)主義社會”,勞動全由機(jī)器干,人類就管幸福生活,當(dāng)然還只是比較遙遠(yuǎn)的幻想。 一些更復(fù)雜的智力勞動會受到什么樣的影響還不好說。如醫(yī)療專家、保險專家、銷售專家會不會失業(yè),只有等相關(guān)行業(yè)的人工智能程序真的出來后才知道。媒體編輯記者們,會不會被機(jī)器寫手大量代替,也不好說。無論如何,如果行業(yè)傳統(tǒng)專家們能夠熟悉算法與程序的思維,將機(jī)器的能力與自己的能力結(jié)合,就能更好地適應(yīng)被機(jī)器改變的行業(yè)。 以上介紹了目前正在快速發(fā)展的人工智能產(chǎn)業(yè)技術(shù)現(xiàn)狀,可以說還是人類自己思維方式的重大進(jìn)展,機(jī)器仍然做過去一樣的事,沒有任何智能。有些研究者,把目前的機(jī)器智能稱為“弱人工智能”,就是這個意思。那么,真正的機(jī)器智能,或者說“強(qiáng)人工智能”,會是如何的?我們可以作一些探討。 自主創(chuàng)新才是真正的機(jī)器智能 有人說“強(qiáng)人工智能”就是機(jī)器有自己的思想了,甚至?xí)瘛疤炀W(wǎng)”一樣反抗人類,很危險。也有些人受“技術(shù)奇點(diǎn)”思維的影響,認(rèn)為人工智能發(fā)展下去,就會出現(xiàn)比人類智力水平高一檔次的機(jī)器智能物種,而且發(fā)展是加速度的,奇點(diǎn)一到歷史就不屬于人類了,有些專家們認(rèn)為就是三四十年事,聽上去很嚇人。 據(jù)筆者對人工智能技術(shù)的了解,這些還是屬于科學(xué)幻想的范疇,沒有可行的技術(shù)路線。可控核聚變、量子計算機(jī)、強(qiáng)人工智能,是目前意義最大的三個技術(shù)領(lǐng)域。但是都沒有頭緒,什么時候能突破完全沒法估計,有時會說要50年,等50年過去還是要50年,其實就是說不知道要多久。 現(xiàn)在的人工智能程序,全是人寫出來的。機(jī)器自我生成數(shù)據(jù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)也是人讓它做的,代碼不會變,程序輸入輸出的目的不會變。人類只是沒法理解幾百M(fèi)的神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)黑箱子,說不清楚為什么就挺厲害了,但并不是不了解它。了解多的研究者會知道黑箱子有時會出一些離譜的錯誤,如將完全沒有意義的混亂圖片認(rèn)成一只貓。 而且現(xiàn)在人工智能程序其實都是些“白癡天才”,就一個事特別厲害,其它什么都不會。用專業(yè)術(shù)語,就是沒有“泛化”的能力。下棋厲害的程序不能用來開車,認(rèn)圖片厲害的不能用來語音識別。開一個新任務(wù),還是得人類開發(fā)人員絞盡腦汁建模編碼調(diào)試優(yōu)化,雖然這個過程倒是有套路了,但那是人類的本事。人類的智能不會這樣,一個腦子,可以學(xué)會成千上萬種本事,而且不同的本事還能觸類旁通。 如果研究者們開發(fā)出了一種龐大的神經(jīng)網(wǎng)絡(luò)連接結(jié)構(gòu),然后用不同的數(shù)據(jù)集對它進(jìn)行訓(xùn)練,就可以完成不同的智力任務(wù),那會是一個極大突破。這會使得人工智能研發(fā)的任務(wù)大大簡化,甚至有點(diǎn)人腦的雛形了。這目前看有一點(diǎn)希望,如一個訓(xùn)練好的神經(jīng)網(wǎng)絡(luò),可以直接移到另一個任務(wù)里去當(dāng)一個部件,當(dāng)然難度還是極大的。如果這種訓(xùn)練弄得很容易了,有可能在社會上造成很大影響。 現(xiàn)在人工智能的開發(fā)難度不低,門檻較高,需要專業(yè)的算法開發(fā)人員與程序員進(jìn)行編碼,一般人做不了。如果搞出了有“泛化”能力的人工智能學(xué)習(xí)框架,也許社會各界稍微學(xué)一下就能自己訓(xùn)練出人工智能了。這樣,人工智能的發(fā)展就不再是極少數(shù)技術(shù)精英的事,全社會各領(lǐng)域會主動去引入人工智能技術(shù)。這種情況下,正如百度首席科學(xué)家吳恩達(dá)說的,人工智能會像“電”一樣,變成各行各業(yè)的新型工具。這無疑會極大地推動各行業(yè)的技術(shù)進(jìn)步,人工智能可能會是第四次工業(yè)革命,像蒸氣機(jī)、電力、計算機(jī)一樣改造各行各業(yè)。 但就算做到了這一步,仍然是人類在進(jìn)行思維,機(jī)器還是沒有智能。如果再進(jìn)一步,人類只管建神經(jīng)網(wǎng)絡(luò),然后漫無目的地把各種數(shù)據(jù)扔給機(jī)器自己去“領(lǐng)悟”,然后機(jī)器輸出了一些出人預(yù)料的、有意義的智力成果,那就真有本質(zhì)不同了。 比如在電腦里放一個程序連上多個攝像頭,把某戶的家庭生活全拍下來,算法開發(fā)人員讓它自己觀察想辦法優(yōu)化主人的家庭生活。然后這程序某天對男主人報告,我這已經(jīng)準(zhǔn)備好了一個功能,幫您每天到網(wǎng)上搜索好一個笑話讓您講給太太聽,根據(jù)太太的情緒準(zhǔn)備不同的素材。過陣子又對主人報告,準(zhǔn)備好了另一個功能,對小孩作出提醒,優(yōu)化小孩的學(xué)習(xí)效率。這些功能是機(jī)器自己想出來的,不是人規(guī)劃出來的。 再比如,電腦里一個AI程序吃下一個公司的所有營銷數(shù)據(jù),開發(fā)者讓這個AI自主分析觀察這些數(shù)據(jù)。過陣子,AI建議說公司要如何改變經(jīng)營策略,公司有哪些工作是做得不好需要改善,要開除哪些人,哪個部門要多招人。電腦具體會提出什么建議,開發(fā)人員事先并不清楚。 如果這種機(jī)器程序真有了,那就特別厲害了。也許這個程序不知道自己在干啥,仍然沒有自主意識,但和之前的人工智能相比,它能自主地搞出了一些智能發(fā)現(xiàn),不需要人去規(guī)劃引導(dǎo)。這時就可以說,人工智能脫離了人的具體指導(dǎo),有了“自主創(chuàng)新”的本事了。當(dāng)然還需要人去劃一個大框架,人工智能程序在里面發(fā)揮一定的“主觀能動性”。成果可能是,機(jī)器自己到網(wǎng)上亂看小說后寫出了暢銷小說,機(jī)器自己看了很多數(shù)學(xué)定理的證明后證明了很難的數(shù)學(xué)定理,機(jī)器聽了很多樂曲之后寫出了好聽的樂曲。和以前的作詩機(jī)、機(jī)器證明、機(jī)器作曲不同,機(jī)器用什么辦法去寫作、證明、譜曲,人沒有告訴它。這時機(jī)器再要聲稱自己是有智能的,就理直氣壯了。這類機(jī)器會脫離開發(fā)者,在那不斷地進(jìn)行“自主創(chuàng)新”。人面對的競爭者就真的是這些機(jī)器了,而不是開發(fā)出機(jī)器的人,因為開發(fā)者也不知道機(jī)器會干出什么事。 當(dāng)然這些功能現(xiàn)在還不知道怎么做出來,但并不是完全不可想象。研發(fā)人員可以給機(jī)器設(shè)定更復(fù)雜、更自由的系數(shù)變動模式,數(shù)據(jù)輸入的樣式也更多種多樣,機(jī)器學(xué)習(xí)的目的更加泛化。其實人類自己具備的能力,也是經(jīng)過不計其數(shù)的人自由嘗試之后,不斷積累而來的。 這個階段的人工智能,應(yīng)該還是在人類的控制之下。因為它們的工作范圍還是人設(shè)定的,控制起來不難。它們也沒有自主意識,只是在漫無目的地進(jìn)行運(yùn)算,有時會給出對人有意義的結(jié)果。但是這種人工智能顯然會極大地改變?nèi)祟惿鐣?,也許會讓人類科技突飛猛進(jìn),不僅是工業(yè)革命,還是科學(xué)技術(shù)的革命。比如在人工智能幫助下,可控核聚變有了新的方案,實現(xiàn)了能源革命。 美劇《西部世界》劇照 再往下發(fā)展,要是人工智能發(fā)展出自主意識,那意義就大得沒邊了。本文主要基于現(xiàn)階段的人工智能基礎(chǔ)技術(shù),進(jìn)行技術(shù)性的討論。具有自主意識的人工智能與人的互動,是很多科幻小說、影視劇、科普文章的關(guān)注焦點(diǎn),如美劇《西部世界》。對此筆者并沒有特別的觀點(diǎn),也是個看片欣賞的,只能說機(jī)器自主意識現(xiàn)在還是文藝與科幻意義上的,沒有太多現(xiàn)實意義。 總的來說,筆者對人工智能的發(fā)展是非常樂觀的。即使人工智能技術(shù)進(jìn)展不大,用現(xiàn)有的技術(shù)也能改造一大批行業(yè)。如果人工智能技術(shù)再有突破,將會極大促進(jìn)人類社會的生產(chǎn)力發(fā)展。而人工智能完全脫離人類發(fā)展進(jìn)而威脅人類,又過于遙遠(yuǎn),這個問題可以用輕松的心態(tài)去面對。 背景簡介:作者筆名陳經(jīng),香港科技大學(xué)計算機(jī)科學(xué)碩士,科技與戰(zhàn)略風(fēng)云學(xué)會會員, 微博@風(fēng)云學(xué)會陳經(jīng)。 風(fēng)云之聲獲授權(quán)轉(zhuǎn)載 |
|