胡璇 騰訊研究院高級研究員 黃詩宜 騰訊游戲商業(yè)分析經(jīng)理 宋巧玲 騰訊游戲社會價值探索中心項目經(jīng)理 2024年的諾貝爾化學獎被授予三名科學家,美國華盛頓大學教授大衛(wèi)·貝克(David Baker)及谷歌Deepmind公司的德米斯·哈薩比斯(Demis Hassabis)與約翰 ·江珀(John Jumper),以表彰他們對破解蛋白質(zhì)結構之謎的卓越貢獻。 蛋白質(zhì)結構問題一直是諾貝爾化學獎的熱門領域,1958年來共有十余次獎項與之相關,既包括重要結構的發(fā)現(xiàn),也包括工具和方法的改進,如晶體電子顯微鏡和冷凍電鏡的發(fā)展。計算機和人工智能方法的成功引入,不僅預測了幾乎全部人類已知的蛋白質(zhì)結構,更能創(chuàng)造全新的蛋白質(zhì)分子,為生物醫(yī)藥打開更多可能。 三名獲獎者中,貝克教授是以計算預測蛋白質(zhì)結構這一工作的領軍者,而吸引Deepmind兩名AI專家加入的“接力棒”,則是一款叫做Foldit的游戲。 聚合“人工的智能” 蛋白質(zhì)是生命的基石,其結構決定了功能。雖然組成蛋白質(zhì)的氨基酸只有20種,但它們在三維空間中的組合方式卻近乎無限。因此,對蛋白質(zhì)結構的精準描繪困擾了科學家們數(shù)十年。傳統(tǒng)方法是觀測已有的蛋白質(zhì),準確但需要借助大型精密儀器,因此又慢又貴。從1971到2006的40年間,全球蛋白質(zhì)數(shù)據(jù)銀行(Protein Data Bank)也僅收集了4萬個結構數(shù)據(jù),相比上億的總數(shù)可謂九牛一毛。 于是科學家們逆轉(zhuǎn)思路,從觀測變?yōu)轭A測,并希望借助性能不斷進化的計算機,準確找到更多的蛋白質(zhì)結構。蛋白質(zhì)通常會折疊到能量最低的狀態(tài),而科學家也知道如何去計算它的能量?;诖?,貝克教授團隊在1998年發(fā)布了重要的計算平臺羅塞塔(RoseTTA),它能進行蛋白質(zhì)的預測乃至設計。計算機雖然擅長運算,但缺乏人類的空間想象能力,加上單臺設備算力有限,因此進展不算迅速。 貝克團隊發(fā)現(xiàn),蛋白質(zhì)折疊這項工作具有有明確的目標、規(guī)則和打分,恰好構成了一項游戲的全部要素。那為什么不用這一點吸引更多人參與進來呢?他們進行了一項大膽嘗試——游戲化科學眾包。2008年,基于羅塞塔構建的功能游戲Foldit應運而生,允許用戶以闖關形式,將氨基酸的“鏈”折疊成適當?shù)娜S形狀,再由科學家檢驗結果。它富有趣味,簡潔易懂,很快吸引了全球幾十萬沒有科學背景的普通用戶加入。 Foldit通過在線平臺將科學問題和普通人連接起來并聚合智慧 很快,人類在模式識別上的優(yōu)勢就顯現(xiàn)出來,不僅準確度超過了計算機,也在多個科研難點中發(fā)力。比如玩家曾在10天內(nèi)破解了艾滋病逆轉(zhuǎn)錄酶的晶體結構,一個存在了15年的科學難題。2010年,57000名“Foldit players”作為論文作者登上《Nature》,這是“人工的智能”在蛋白質(zhì)結構預測中的里程碑。新冠疫情爆發(fā)后,20萬人共同尋找阻止新冠病毒傳播的蛋白質(zhì)結構。這些公民科學家們還為包括癌癥、阿爾茨海默病和埃博拉病毒在內(nèi)的廣泛醫(yī)療挑戰(zhàn)的研究做出了貢獻。 AI通關蛋白質(zhì)折疊游戲 Foldit這顆子彈,將在多年后擊中Deepmind創(chuàng)始人、游戲人工智能專家哈薩比斯的眉心。 他是一名不折不扣的“超級玩家”,棋類和Foldit點亮了他對游戲和智能的關系的思考:12歲成為國際象棋世界亞軍,編寫了自己的第一個人工智能下棋程序;15歲和畢業(yè)后設計的《主題公園》《黑與白》等作品“都以AI為核心”。在MIT做博后時,他接觸到了Foldit,驚訝于人類直覺在游戲中發(fā)現(xiàn)新模式的巨大潛力。 成立Deepmind,是他從游戲智能出發(fā)、追尋通用智能的重要一步。他在接受采訪時說到:“從一開始,我們就將游戲作為證明和開放 AI 算法的試驗場。因為游戲非常高效,也很容易有指標來查看 AI 系統(tǒng)如何思考和改進。”同時,“最終目標是使用游戲中訓練的智能來引導通用學習系統(tǒng),并應對現(xiàn)實世界的挑戰(zhàn)”。圍棋智能AlphaGo和AlphaZero獲得巨大成功,后者甚至僅靠自學就在數(shù)天內(nèi)獲得人類數(shù)千年的知識,開發(fā)出全新的策略,擊敗人類冠軍。這證實了深度學習算法在處理復雜問題上的強大能力。 AlphaGo和AlphaZero尋找最優(yōu)策略并獲得勝利 繼續(xù)挑戰(zhàn)更復雜、更綜合的游戲,比如《星際爭霸》《我的世界》,自然是一種路徑。那有沒有一個規(guī)模和條件都合適的現(xiàn)實問題,能夠快速遷移團隊在圍棋上的成果呢? 游玩Foldit的經(jīng)歷在哈薩比斯腦海中閃現(xiàn)。他在目睹AlphaGo戰(zhàn)勝圍棋世界冠軍李世石的那一刻想到:如果人工智能可以從0知識開始訓練,并擊敗人類頂尖選手;那同樣可以像Foldit的玩家那樣,不具備生物化學知識卻完成科學家的工作。游戲固定的規(guī)則和無窮的可能性之間,形成了極大的張力;找到通向勝利的路徑和解法,就是智能的體現(xiàn)。 于是,蛋白質(zhì)折疊問題,成為Deepmind團隊從游戲智能邁向解決現(xiàn)實問題的關鍵一步。他們著手設計AI蛋白質(zhì)折疊算法AlphaFold,基于蛋白質(zhì)銀行中已有的14萬條結構數(shù)據(jù),像游戲中找最優(yōu)解一樣分析數(shù)據(jù)、尋找規(guī)律,反復訓練提高預測準確性。AlphaFold于2018年在蛋白質(zhì)結構預測領域的“奧運會”CASP上首次亮相,取得了2.5倍于第二名的好成績。但這距離準確預測還遠遠不夠。 第三位主角約翰 ·江珀在此時加入Deepmind,牽頭設計了新的transformer架構和許多革新。2022年發(fā)布的AlphaFold2真正改變了這一領域,大部分預測超過了百分制的90分。隨后,Deepmind一舉公布了2.18億個人類已知的蛋白質(zhì)結構,宣告50年來蛋白質(zhì)三維結構預測問題的解決。 AlphaFold基于數(shù)據(jù)庫訓練和改進預測結果 自此,不僅蛋白質(zhì)折疊問題得到突破,用AI解決科學問題的方法更逐步深入人心。新版本AlphaFold3在2024年5月上線,引領生物學預測技術進入下一階段:構建蛋白質(zhì)與其他分子(如DNA或者RNA)結合的復合體結構。AlphaFold已被來自190個國家的200多萬研究人員用于推進關鍵工作,包括了解抗生素耐藥性和開發(fā)可分解塑料的酶等重要應用。META也跟進發(fā)布了ESMFold的研究成果:由機器學習創(chuàng)建的6.17億個宏基因組蛋白質(zhì)結構的數(shù)據(jù)庫,包括土壤、海洋和人體中的微生物。 科學眾包和游戲人工智能加速前進 Foldit仍在不斷迭代,逐步成為了科研人員和普通公眾互動的社區(qū)。游戲不僅持續(xù)將前沿問題轉(zhuǎn)化為游戲關卡,收集玩家的高分解答并吸收到成果中,也鼓勵用戶間對解題策略的討論。游戲功能同樣與時俱進,2019年時加入了蛋白質(zhì)設計模塊,后續(xù)更引入了AlphaFold幫忙給玩家的作業(yè)打分。 更多科研項目采用了類似的眾包機制,科學家們甚至搭建了專門的公眾科學游戲發(fā)布平臺,如Kaggle和Zooniverse,以供科研人員和機構發(fā)布游戲并招募志愿玩家。從生物學、神經(jīng)科學、天文學、高能物理學到語言學、藝術史學,都已有成千上萬的普通玩家的參與。例如,在Eye Wire中,玩家通過簡單有趣的操作即可映射神經(jīng)視網(wǎng)膜通路;在《星系挑戰(zhàn)》(Galaxy Challenge)中,玩家能夠給星系形態(tài)分類;Metropolitana和 ARTigo則允許玩家為社會語言、藝術作品打標簽。 同時,游戲AI也在《星際爭霸》《王者榮耀》等復雜游戲中獲得更全面的能力后,助力解決機器人訓練,能源和交通調(diào)度等現(xiàn)實問題;更有望讓AI進一步理解我們所處的真實世界,獲得空間智能。微軟、Deepmind、Meta、騰訊等科技公司都是參與者。騰訊開悟游戲 AI 研究開放平臺依托騰訊在算法、算力、實驗場景方面的核心優(yōu)勢,為學術研究人員和算法開發(fā)者開放研究與應用探索的資源及工具。 國內(nèi)的游戲人工智能人才培養(yǎng),在產(chǎn)學研各界合力下加速前行。2024年,川渝政府聯(lián)合騰訊,共同發(fā)起川渝大學生人工智能大賽暨騰訊開悟人工智能全球公開賽,吸引國內(nèi)及17個海外國家超過5200名學生參賽,并協(xié)同燧原、Intel、Vivo、成都智慧交通集團,聯(lián)合開發(fā)芯片算子開發(fā)、交通應用場景、算法與工程等產(chǎn)業(yè)賽道。2023世界人工智能大會期間,廈門大學聯(lián)合中國傳媒大學、北京理工大學、上海交通大學等多所高校,籌備成立“游戲人工智能高校聯(lián)合研究中心”,持續(xù)深化游戲人工智能的研究。 未來的科研新星和下一個Deepmind,會不會從這些創(chuàng)新青年中誕生? 更多想象力 盡管今年的諾貝爾物理與化學獎被調(diào)侃為“理科綜合”“圖靈獎”,但這恰恰反映出學科間的交叉融合越來越廣泛深刻。一方面,物理、化學等基礎學科受到人工智能等新的研究方法影響,發(fā)展出全新的、數(shù)據(jù)驅(qū)動的研究范式。另一方面,人工智能本身也是計算機和數(shù)學、神經(jīng)科學等領域交叉的產(chǎn)物,神經(jīng)網(wǎng)絡、貝葉斯都極大推動了人工智能的演進。 袁越等學者指出,科學研究和創(chuàng)新正從因果關系走向“復雜系統(tǒng)”。例如,獲得醫(yī)學或生理學獎的microRNA背后所代表的基因調(diào)控就是一個龐雜到無以復加的復雜系統(tǒng),難以用簡單的因果鏈條加以解釋。神經(jīng)網(wǎng)絡也是復雜系統(tǒng)的計算機模擬,呈現(xiàn)出“黑箱”狀態(tài)。 在大融合、大系統(tǒng)的背景下,AI for Science已帶來科學界的新潮流,此次諾貝爾獎的“風向”指引性也很明顯。2024年5月,英國皇家學會發(fā)布了《人工智能時代的科學:人工智能如何改變科學研究的性質(zhì)和方法》報告??茖W家們正扮演著導師、同伴或助手的角色,利用人工智能以史無前例的速度和規(guī)模執(zhí)行任務;AI則幫助識別大型數(shù)據(jù)集中的新模式和關系,預測新內(nèi)容。除了AlphaFold等標志性案例外,AI應用可見于所有STEM領域,包括醫(yī)學、材料科學、機器人技術、農(nóng)業(yè)、遺傳學和計算機科學等。過去十年,與科學相關的人工智能專利申請激增,中國、美國、日本和韓國提交的專利數(shù)量占據(jù)主導地位,其中中國貢獻了約62%的專利。 英國皇家學會2024年《人工智能時代的科學》報告插圖 正如哈薩比斯在獲獎后表示,“AlphaFold應該被視為人工智能加速科學發(fā)現(xiàn)和造福社會潛力的證據(jù)”?!吨R分子》總結,應用人工智能方法分析數(shù)據(jù)、構建復雜生物現(xiàn)象的強大模型用例包括:用AI識別新的抗生素、揭示希格斯玻色子,建模和分析星系形成,篩選粒子對撞機或機器人望遠鏡產(chǎn)生的大量數(shù)據(jù)、尋找其中的規(guī)律,識別具有電池或太陽能電池所需特性的材料等等。 Game for science 同樣值得期待。科學研究過程呈現(xiàn)出復雜性和不確定性。不同領域間的相互啟發(fā)有如“蝴蝶效應”,而游戲正扮演那只扇動翅膀的蝴蝶。游戲是科技的產(chǎn)物,同時推動科技發(fā)展。如果沒有3D游戲,或許先進GPU開啟的人工智能時代不會這么快到來。游戲更與智能有著非常緊密的連接,也是科技人才的搖籃,馬斯克、喬布斯、林納斯,許多領軍人物都受游戲啟發(fā)而走進編程世界,探索創(chuàng)新邊界。 AI、游戲與科學的故事,未完待續(xù)。 參考文獻來源: 2024化學諾獎接力青睞AI,蛋白質(zhì)結構預測新工具獲一半獎項, 郭貝一、郭曉強https://mp.weixin.qq.com/s/4ISr4rJRw_60O63ipvGWPQ AlphaFold開發(fā)者獲2024諾貝爾化學獎,AI搶奪科學家的最重要榮譽,知識分子 https://mp.weixin.qq.com/s/BqO1-UN3hQ4Bagcp206_uw 今年的諾貝爾化學獎,意味著我們從此不需要科學家了? https://mp.weixin.qq.com/s/ny4kbYctjBW7dzIKBAMu2g DeepMind 創(chuàng)始人 Demis Hassabis:AI 的強大,超乎我們的想象,經(jīng)緯創(chuàng)投 https://mp.weixin.qq.com/s/SaNX-zE7NG9jlHuPifv6Zw 騰訊游戲年度發(fā)布會上提到的這款游戲,你聽過嗎?, 騰訊互娛社會價值探索 https://mp.weixin.qq.com/s/OXiZTnVDxu23iezObLTWxw 玩游戲玩出來的Nature?,果殼-未來光錐 https://mp.weixin.qq.com/s/q8_oxouEUrTM2ijrqjTuzg The challenge of designing scientific discovery games https://grail.cs./projects/protein-game/foldit-fdg10.pdf Demis Hassabis:from video game designer to Nobel Prize winner https://www./science/2024/oct/09/demis-hassabis-from-video-game-designer-to-nobel-prize-winner-google-deepmind-ai- AlphaFold 2: Why It Works and Its Implications for Understanding the Relationships of Protein Sequence, Structure, and Function https://pubs./doi/10.1021/acs.jcim.1c01114?__cf_chl_tk=IzRdl._BLUB6TWJy7OjISGlkHoME4f_PgabMM3z2Ya0-1728619960-1.0.1.1-CRrp5_YPKHQtjlQo6ffFZwmGx8PpCyrFenJw2rM9go4 Science in the age of AI: How artificial intelligence is changing the nature and method of scientific research https:///-/media/policy/projects/science-in-the-age-of-ai/science-in-the-age-of-ai-report.pdf 李淼 曹穎 胡璇:《游戲的可能:文化遺產(chǎn)及其保護》 |
|
來自: 真友書屋 > 《互聯(lián) 科技》