5.16 知識(shí)分子 The Intellectual 圖源:pixabay ● ● ● 撰文|張?zhí)烊?/strong> 他曾花了小半個(gè)世紀(jì)的時(shí)間開發(fā)神經(jīng)網(wǎng)絡(luò),讓機(jī)器擁有了深度學(xué)習(xí)的能力,如今,他的愿望實(shí)現(xiàn)了:人工智能之浪潮洶涌澎湃滾滾而來。然而,這位AI大神卻退縮了,他對他教會(huì)它學(xué)習(xí)的機(jī)器產(chǎn)生了懷疑,甚至憤怒。他擔(dān)心他畢生的工作可能導(dǎo)致人類的終結(jié),他認(rèn)為他的最終使命是警告世界! 他,就是如今被譽(yù)為“AI教父”的杰佛瑞·埃佛勒斯·辛頓(Geoffrey Everest Hinton,1947-)[1]。 家族傳奇 辛頓可以算是學(xué)界少有的傳奇人物,其傳奇之一,是他顯赫的家庭背景。我們從他的一位“玄祖父”布爾說起…… 英國數(shù)學(xué)家喬治·布爾(George Boole,1815年—1864),無疑是計(jì)算機(jī)科學(xué)的前輩之一,一位大師級(jí)人物。大家都知道的布爾代數(shù)、布爾邏輯,便是以他命名的。布爾出生貧困,但他的整個(gè)后代,以及連帶的3個(gè)家族可了不得,每一個(gè)都值得驚嘆一聲:好一個(gè)“科學(xué)世家”! 布爾的夫人瑪麗是一位女權(quán)主義哲學(xué)家,也是自學(xué)成才的數(shù)學(xué)愛好者,特別喜歡代數(shù)?,旣惙蛉说哪锛倚帐?span>(Everest)中,也出了好幾位科學(xué)名人,實(shí)際上,Everest是西方對珠穆朗瑪峰的稱呼,這來源于瑪麗的叔叔喬治·埃佛勒斯(George Everest),他勘察印度時(shí)發(fā)現(xiàn)了這座山,珠穆朗瑪峰便以他的名字命名。而且,杰佛瑞·辛頓的中間名便取為Everest,即珠穆朗瑪峰的英文名。 布爾和瑪麗,這對珠聯(lián)璧合的伉儷育有五個(gè)女兒,她們本人、配偶及后代,都有不凡的成就。非常有趣的是,布爾女兒中的老大和老小,都與中國有淵源。所以,首先簡要介紹中間3個(gè)女兒:老二嫁給了藝術(shù)家愛德華·泰勒,他們的兒子杰弗里·泰勒,是著名物理學(xué)家和數(shù)學(xué)家,二戰(zhàn)時(shí)曼哈頓計(jì)劃的核心成員之一;三女兒繼承了父親的數(shù)學(xué)天賦,對四維幾何深感興趣獨(dú)立鉆研,頗有成果;四女兒是英國史上第一位研究藥學(xué)的女性和女化學(xué)教授。 布爾第五個(gè)女兒,艾捷爾·麗蓮·伏尼契,為中國人所熟悉是因?yàn)樗恰杜r怠芬粫淖髡摺?/p> 布爾的大女兒瑪麗,嫁給了數(shù)學(xué)家和作家查理斯·辛頓,生了四個(gè)兒子。其中小兒子的孫輩中,韓丁是“中國人民的好朋友”,寫了一本有關(guān)中國土地改革的長篇作品《翻身》。韓丁的妹妹寒春,是參與了曼哈頓計(jì)劃的女核物理學(xué)家,她的丈夫陽早,是美國養(yǎng)牛專家,夫妻倆長年定居中國。 圖1:杰弗里·辛頓(8歲時(shí)抱著動(dòng)物園的蟒蛇、中學(xué)、近年) 就是布爾的這位大女兒,聯(lián)姻了“辛頓”的家族,這個(gè)辛頓家族中科學(xué)界名人和教授也是難以數(shù)清,我們就不一一列舉了??傊?,這對“布爾+辛頓”生下了一個(gè)曾孫,便正是我們本文的主角:杰弗里·辛頓。 所以,辛頓是邏輯大師布爾的玄孫,短短的計(jì)算科學(xué)史中,玄祖玄孫皆大師,不是傳奇是什么? 辛頓出生于英國,父親是劍橋大學(xué)教授,是著名的昆蟲學(xué)家,研究甲蟲的權(quán)威。辛頓和他的三個(gè)兄弟姐妹在一所充滿動(dòng)物的大房子里長大,父親還曾經(jīng)將毒蛇關(guān)在車庫的坑里。 嚴(yán)厲的父親自視甚高,似乎認(rèn)為兒子永遠(yuǎn)無法攀登自己的頂峰。但父親早已于70年代過世,沒有來得及看到兒子的學(xué)術(shù)引用已經(jīng)遠(yuǎn)遠(yuǎn)超過了他。 求學(xué)傳奇 盡管杰弗里·辛頓的周圍環(huán)境中,不乏杰出的科學(xué)家、學(xué)者和教授,但與大多數(shù)成功人士一樣,他的求學(xué)生涯卻并不總是那么順利。也許是因?yàn)檫@類年輕人心里有太多自己的想法和主張的緣故。 辛頓高中時(shí),進(jìn)入了他口中的“二流公立學(xué)校”,克里夫頓學(xué)院,不過,辛頓在那兒碰到一位十分聰明的同學(xué),這位朋友對他說:“你知道嗎?大腦的記憶并不是儲(chǔ)存在某個(gè)特定的地方,而是分布在整個(gè)大腦,在整個(gè)神經(jīng)網(wǎng)絡(luò)里傳播?!?,朋友又解釋道:”大腦使用全息圖,在全息圖中,你可以砍掉一半,但你仍然可以獲得整個(gè)圖片,所以……” 朋友的話使辛頓興奮,也正是從這個(gè)時(shí)候起,辛頓開始對大腦的運(yùn)作深深著迷,這是他人生的關(guān)鍵起點(diǎn)。從此后,辛頓將一個(gè)目標(biāo)放在了他的潛意識(shí)里:想了解大腦是如何工作的? 一開始,18歲的辛頓進(jìn)入劍橋大學(xué)國王學(xué)院學(xué)習(xí)物理、化學(xué)和數(shù)學(xué),但于一個(gè)月后就退學(xué)了。辛頓去倫敦工作了一年,做了各種各樣的事情。第二年,他改修建筑學(xué),但這次堅(jiān)持的時(shí)間更短:一天!后來,辛頓也嘗試過轉(zhuǎn)向哲學(xué),不過也是半途而終。 再后來,辛頓轉(zhuǎn)而研究物理和生理學(xué),成為當(dāng)年劍橋大學(xué)唯一一個(gè)同時(shí)學(xué)習(xí)物理和生理學(xué)的學(xué)生。然而,因?yàn)樗麤]有任何生物學(xué)背景,所以學(xué)習(xí)生理學(xué)非常困難。但辛頓有所期待,因?yàn)閾?jù)說在第三學(xué)期,生理學(xué)教授將告訴學(xué)生大腦是如何工作的,這正是辛頓學(xué)習(xí)生理學(xué)的原因。終于到了第三學(xué)期,由像赫胥黎這樣非常杰出的學(xué)者教授這門課。不過,結(jié)果并不是辛頓所期待的。生理學(xué)教授認(rèn)為大腦是如何工作的呢?他們的想法是,有神經(jīng)元,有沿著軸突和神經(jīng)元傳播的動(dòng)作電位。但僅此而已,他們實(shí)際上并沒有說出大腦是如何運(yùn)作的,因?yàn)樗麄儾⒉恢腊?。并且,辛頓覺得心理學(xué)理論似乎太簡單了,不可能用以解釋大腦。 1970年獲得實(shí)驗(yàn)心理學(xué)學(xué)士學(xué)位后,對大學(xué)本科學(xué)習(xí)頗感失望的辛頓放棄了劍橋大學(xué),成了一名木匠。他一邊做書架、木門,一邊思考人類大腦的運(yùn)作原理,自認(rèn)為這是他喜歡的生活方式。作了一年多之后又有新想法了,因?yàn)榭磕窘持\生并不是件容易的事情,對了解大腦也無幫助,所以,辛頓又考慮回歸學(xué)術(shù)界,并決定嘗試一個(gè)新方向:人工智能。 對如此奇特多變的求學(xué)經(jīng)歷,辛頓謔稱自己患上了“學(xué)習(xí)上的過動(dòng)癥”,在一個(gè)專業(yè)上無法穩(wěn)定下來。但其實(shí)不然,辛頓始終都在尋求自己的方向。前一段,是多次綴學(xué)的“傳奇”,后面的經(jīng)歷,便說明了辛頓認(rèn)定方向后堅(jiān)持不懈的“傳奇”精神。 他1972 年去了愛丁堡,進(jìn)入蘇格蘭愛丁堡大學(xué)攻讀博士,這次可能算是走對路了,因?yàn)槟莾河幸晃环浅B斆鞯慕邢=鹚?span>(Christopher Higgins,1923 – 2004)的教授,正在研究神經(jīng)網(wǎng)絡(luò),這是辛頓長年累月思考認(rèn)為可以用機(jī)器實(shí)現(xiàn)大腦功能的方向。 但是,辛頓好像總是運(yùn)氣不佳,就在他開始追求這個(gè)目標(biāo)時(shí),希金斯教授改變了他的學(xué)術(shù)初衷,“叛變”到了AI的符號(hào)主義一邊,認(rèn)為聯(lián)結(jié)主義的神經(jīng)網(wǎng)絡(luò)是無稽之談。這顯然是受了MIT的AI大佬閔斯基的影響。閔斯基的《Perceptron》一書于69年出版,幾乎摧毀了神經(jīng)網(wǎng)絡(luò)領(lǐng)域,使得1972 年成為神經(jīng)網(wǎng)絡(luò)有史以來最低潮的時(shí)期。 因此,希金斯試圖說服辛頓停止做神經(jīng)網(wǎng)絡(luò),轉(zhuǎn)做符號(hào)人工智能。于是辛頓說,再給我六個(gè)月,我會(huì)證明這是有效的;然后每六個(gè)月之后,辛頓再跟希金斯說與上次一模一樣的話。兩人磨磨唧唧地爭論了五年,辛頓終于堅(jiān)持研究備受冷落的神經(jīng)網(wǎng)絡(luò)并熬到了博士畢業(yè)。 職場傳奇 辛頓的觀點(diǎn)總是與眾不同別出一格,閔斯基在《感知器》中,詳盡說明了單層神經(jīng)網(wǎng)絡(luò)的限制以及功能不足之處,使得幾乎所有的學(xué)者都相信這是個(gè)沒有未來、注定失敗的一條路,但辛頓卻始終堅(jiān)持神經(jīng)網(wǎng)絡(luò)研究,認(rèn)為閔斯基提出感知機(jī)的缺點(diǎn)是件大好事,發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)的問題,是解決其問題的開始,并不一定要放棄。 辛頓堅(jiān)信大腦絕對不是通過人類編寫的“智能程序”來工作的。例如,你可以嘗試給小孩子編個(gè)程序,讓他照此步驟一步一步地從語法開始學(xué)習(xí)語言,但這并不會(huì)真正起作用,孩子們會(huì)從經(jīng)驗(yàn)中學(xué)習(xí)而不會(huì)按照你給他編的程序來做。 作為一名年輕的研究生,辛頓對自己認(rèn)定的目標(biāo)如此自信,令人刮目相看。辛頓將此歸結(jié)為少年時(shí)經(jīng)歷的環(huán)境所致。他的父母是無神論者,卻將兒子送去了一所宗教學(xué)校。在那兒,辛頓周圍的每個(gè)人都相信上帝,除了他之外。因此,他已經(jīng)習(xí)以為??偸桥c別人的不一樣。辛頓在一次訪談中表示,這對科學(xué)家是非常好的訓(xùn)練,讓你對自己的觀點(diǎn)充滿信心,至少給你一個(gè)合理的理論,即每個(gè)人都可能是錯(cuò)的,你需要堅(jiān)持自己的主張,直到實(shí)現(xiàn)它或者否定它,做科學(xué)就需要這樣的精神。 博士畢業(yè)幾年之后,辛頓去了美國作博士后。他高興地在加利福尼亞找到了幾個(gè)神經(jīng)網(wǎng)絡(luò)的支持者。20 世紀(jì) 70 年代末,在加利福尼亞州,圣地亞哥有一個(gè)團(tuán)體,特別是 David Rumelhart等,他們認(rèn)為神經(jīng)網(wǎng)絡(luò)非常有趣。 圖2:辛頓1986年有關(guān)“反向傳播”的論文 1986年,辛頓與David Rumelhart和Ronald Williams共同發(fā)表了一篇題為“通過反向傳播誤差來學(xué)習(xí)”(Learning representations by back-propagating errors)的論文[2]。 三位科學(xué)家并不是第一個(gè)提出這種“反向傳播”方法的人。但他們將反向傳播算法應(yīng)用于多層神經(jīng)網(wǎng)絡(luò)并且證明了這種方法對機(jī)器學(xué)習(xí)行之有效。他們的論文也證明了,神經(jīng)網(wǎng)絡(luò)中的多個(gè)隱藏層可以學(xué)習(xí)任何函數(shù),從而解決了閔斯基等書中提出的單層感知機(jī)存在的問題。 同一時(shí)期,辛頓與 David Ackley 和 Terry Sejnowski 共同發(fā)明了玻爾茲曼機(jī)。 之后,辛頓在匹茲堡的卡內(nèi)基梅隆大學(xué)找到了一份工作,但他對里根領(lǐng)導(dǎo)下的美國外交政策,特別是對中美洲的干涉越來越感到不安。他和他的妻子羅斯收養(yǎng)了來自南美的一男一女,卻不太喜歡在美國撫養(yǎng)他們。另外,美國的大多數(shù)人工智能研究都是由國防部資助的,這也讓辛頓不滿意,因此他接受了加拿大高級(jí)研究所的邀請,以及多倫多大學(xué)計(jì)算機(jī)科學(xué)領(lǐng)域的職位,并在加拿大啟動(dòng)了“機(jī)器和大腦學(xué)習(xí)”項(xiàng)目。 圖3:辛頓著名的“徒子徒孫”們 辛頓1986年有關(guān)反向傳播算法和波爾茲曼機(jī)的兩篇重要文章,抵不過當(dāng)年“人工智能的寒冬”,似乎反響不大,但辛頓在加拿大多倫多大學(xué),畢竟有了穩(wěn)定的位置以及還算充裕的支持神經(jīng)網(wǎng)絡(luò)的研究經(jīng)費(fèi),使他能在這個(gè)冷門領(lǐng)域里堅(jiān)持耕耘三十余年無怨無悔。更為重要的是,隨著時(shí)間的推移,一些深度學(xué)習(xí)的信徒們被辛頓所吸引。他培養(yǎng)了不少學(xué)生,學(xué)生又有學(xué)生,加上博士后及合作者,研究神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)的人才濟(jì)濟(jì)群星閃爍,盡管寒冬期間工作機(jī)會(huì)少,資金仍然稀缺,但研究者們興趣盎然,他們憑借自身的信念,排除嘈雜的干擾而自得其樂,江湖貌似平靜但暗流涌動(dòng),為人工智能春天之到來做好了準(zhǔn)備。正是應(yīng)了一句名言:“大隱隱于市”。 他長久的在這個(gè)冷門的領(lǐng)域耕耘,讓他最終迎來了春天,不但為他贏得了2018年的圖靈獎(jiǎng),也為人工智能領(lǐng)域帶來了革命性的突破。 參考資料: [1]Home Page of Geoffrey Hinton,https://www.cs./~hinton/ [2]David E. Rumelhart, Geoffrey E. Hinton und Ronald J. Williams. Learning representations by back-propagating errors., Nature (London) 323, S. 533-536,http://www.cs./~hinton/absps/naturebp.pdf |
|