新時代應該如何推動科技發展,新科研范式在決策層面遭遇到的基礎性選擇難題有哪些?在實踐層面的具體抓手又是什么?這些都是當下亟需深入思考與研究的問題。基于本團隊近五年來的研究,筆者認為在決策層面,管理部門遇到的最大決策選擇難題在于深刻解析推動新科技發展的底層力量到底是理論還是工具?如果研究證實是理論在持續地推動科技發展,那么加強基礎研究就是當下科技決策的首要任務(這也是20世紀科技發展的經典模式:理論優先,即萬?布什的線性發展模型);反之,如果工具是新時代推動科技發展的底層力量,那么決策部門就要有針對性的擴張大科學工程的規模,通過新科學基礎設施的進步帶動科技的進步(如近年來世界范圍內各種耗資巨大的大科學工程的紛紛上馬)。遺憾的是推動科技發展的力量到底是理論還是工具,目前仍有很多深層次問題并沒有得到徹底解決,科技共同體的分歧仍很大,在這種背景下,第三種策略就是折中策略,維持理論與工具兩者共同發展的局面,在資源的硬性約束下,只需調整好兩者的比例即可,雖然不是最優策略,但至少不是最差選擇。就筆者的觀察來看,中國在推動科技發展的決策選擇上顯然是采用第三種策略,即“雙軌推進”策略,所不同的只是在兩者的結構、比例與構成如何安排上尚沒有達成充分的共識,目前仍處在實驗摸索階段。
在實踐層面的具體抓手應該是什么?換言之,推動科技發展的主要載體應該選擇哪類載體?目前人們熟知的國家戰略科技力量主要包括如下四種:國家實驗室、國家科研機構、高水平研究型大學和科技領軍企業,這四類載體在整個知識生產鏈條上是有明確分工的,在科技日益一體化的今天,要能在短時間內快速實現“從0到1”的突破,需要知識生產條件高度密集化,這就需要支撐知識生產的要素實現高度集聚,如人財物的高密度集聚,并輔以最大化自由度與激勵機制,能夠滿足這個條件的載體只有高科技企業。這也是筆者近年來一直在嘗試論證的命題:推動科技發展的新載體是高科技企業,新的支撐性工具是人工智能。未來其他科技載體都無法與之抗衡。對此,我們不妨以高科技公司DeepMind為例,看看它是如何推動科技加速發展,并以此支撐本文的論點。
1、蛋白質折疊問題及其發展
蛋白質作為生命活動的主要執行者,參與了細胞生命活動的每一個進程。然而要想全面了解蛋白質在健康機體中的功能或在病理狀態下的異常表現,必須先解析其三維結構。1972年諾貝爾化學獎得主克里斯蒂安·安芬森(Christian Anfinsen,1916-1995)于1972年提出了安芬森假說(Anfinsen's dogma)確定了氨基酸序列決定蛋白質結構的理論基石,但由于學界尚不清楚這一物理過程的具體機制,從而引發了困擾學界半個世紀的“蛋白質折疊問題”:蛋白質的氨基酸序列如何決定其結構。解析蛋白質結構已經成為生命科學領域的重要問題,無數機構與科學家投入這個領域,緩慢推進其發展。
2020年11月,谷歌DeepMind公司推出AlphaFold2技術,展示了人工智能技術如何僅僅使用氨基酸序列就能精準模擬出對應的蛋白質結構,從此,標志著困擾學界50多年的蛋白質折疊問題得到幾乎徹底解決;2024年5月,谷歌DeepMind公司推出AlphaFold3,進一步拓寬了預測的邊界,實現了預測復合物的結構,從而開啟了解析生命相互作用機制的新的一頁。DeepMind到底是一家什么樣的公司,它與科技進步又有什么樣的關系?這種變化是否透露出未來科技發展的一種隱而不顯的內在密碼?
2、DeepMind的前世今生與AlphaFold的橫空出世
為了深入理解AlphaFold技術如何通過變革重塑科學界,我們需要回溯其研發機構DeepMind公司的發展歷程。DeepMind于2010年在倫敦成立,其早期創始人為戴密斯·哈薩比斯(Demis Hassabis,1976-)、謝恩·萊格(Shane Legg,1975-)和穆斯塔法·蘇萊曼(Mustafa Suleyman,1984-),三人有著神經科學、機器學習和系統工程的交叉學科背景。在公司成立之初,其核心愿景并非解決具體的科學問題,而是追求“通用人工智能”(AGI)。哈薩比斯曾表示,公司的使命是“解決智能,然后用它解決一切”。
DeepMind公司選擇了游戲作為人工智能實現通用人工智能的突破口。自20 世紀50年代計算機科學家開發出第一批國際象棋程序以來,游戲一直是人工智能的訓練場所。由米尼赫(Vlad Mnih)領導的DeepMind研究團隊開始構建首個利用強化學習直接從高維感官輸入中成功學習控制策略的深度學習模型,并將該模型用雅達利游戲進行訓練,挑戰了包括《太空侵略者》(Space Invaders)、《乒乓》(Pong)和《打磚塊》(Breakout)等在內的一系列經典游戲,實驗結果表明,該模型在多款游戲中均展現出了超越人類專家的水平。
凱德·梅茨(Cade Metz)在其著作《Genius Makers》中指出,使用游戲訓練AGI與其成功密不可分:游戲分數是一個客觀的量化標準,具有十分明確的結果。
但DeepMind早期的研發遇到了嚴峻的現實挑戰。根據 OpenAI 關于 AI 算力增長趨勢的分析,深度學習對硬件的需求呈指數級增長,這使得 DeepMind 要想進一步提升模型性能,將不得不面對巨大的算力缺口。2014年,谷歌公司以約4億美元的價格收購了DeepMind,這次收購解決了DeepMind公司遭遇到的算力不足的發展瓶頸,而且更重要的是,依靠谷歌公司的強大經濟實力,DeepMind的發展得到了全方位的支持,2021年,DeepMind分拆成立了Isomorphic Labs,專注于將人工智能和計算方法應用于藥物研發。2023年4月20日,谷歌母公司Alphabet合并旗下兩個主要的人工智能研究部門——Google Brain(谷歌大腦)和DeepMind。經過這番組織架構的調整,DeepMind公司已經成為當今全球人工智能領域里實力最強的前沿高科技公司,其所展現出的核心技術與未來潛力向市場發出邀約。眾所周知,資源支撐、技術迭代與組織效率是高科技公司能夠幸存下來的深層原因。Google的加入為DeepMind提供了強大的算力資源和基礎設施,使其成為推動科技持續發展的最佳載體,再加上作為工具/目標的人工智能本身的加持,為后續包括AlphaFold在內的一系列科學突破提供了不可或缺的載體與工具支持。
新載體與新工具對科技的推進作用可謂立竿見影,2016年3月,DeepMind開發的AlphaGo程序以4:1擊敗韓國圍棋冠軍李世石,成為近年來人工智能領域少有的里程碑事件。2017年,DeepMind發布了AlphaGo Zero,在自我訓練3天后以100-0擊敗了AlphaGo。2018年,DeepMind發表了AlphaZero,不僅能下圍棋,還能下將棋和國際象棋。這一系列成果印證了訓練充分的深度學習模型在處理復雜博弈問題時,能夠展現出超越人類專家的計算和決策能力。自此人工智能的能力獲得整個社會的充分認可。
在游戲領域取得巨大成功后,DeepMind轉向了利用深度學習模型來解決現實世界中的科學難題,在經過深思熟慮之后,研究團隊選擇了“蛋白質折疊”這一課題作為公司研究的突破口。據DeepMind創始人哈薩比斯回顧,這一選擇并非偶然,而是出于多種因素的考慮:首先,哈薩比斯早年意識到人工智能技術可以應用于解決蛋白質折疊問題;其次,他坦言受到了一款名為《Foldit》游戲的啟發,這款游戲可以模擬蛋白質折疊的真實過程,并且啟發了現實中幾種蛋白質結構的發現,讓他意識到解決游戲問題也可以解決真實的科學問題。最后,蛋白質折疊問題和游戲訓練具有高度的相似性,都具有客觀的評價標準和明確的結果,如輸出的蛋白質結構可以利用GDT_TS標準得到一個確定的分數。這一精準的選題策略是AlphaFold后續成功不可或缺的關鍵因素。
3、CASP的評價與科研范式轉移:新載體與新工具功能的確認
在新載體與新工具介入科技發展進程后,如何衡量科技發展的績效?這是衡量本文立論是否可以成立的核心問題,換言之,怎么證明新載體與新工具的接入的確促進了科技的發展呢?回到蛋白質結構難題,CASP(Critical Assessment of Structure Prediction,蛋白質結構預測技術關鍵評估)這一競賽可以很好地檢驗DeepMind公司的科研表現,可喜的是,后來的結果正式確認了AlphaFold2在攻克困擾生物學界半個世紀的“蛋白質折疊問題”上表現優異遠超人類的預期,甚至可以說,它終結了人類緩慢與笨拙的傳統研究范式,筆者甚至想問,那些曾被奉為神明的昂貴冷凍電鏡還有多少市場?
CASP由美國馬里蘭大學的科學家約翰·莫爾特(John Moult)與合作伙伴Krzysztof Fidelis教授于1994年創立,為了評估和鑒定蛋白質結構預測的最佳手段,CASP全稱為(Critical Assessment of Structure Prediction),“結構預測的關鍵評估”。CASP競賽兩年一次,現已成為國際上著名的蛋白質結構計算機預測比賽。該競賽旨在建立一套客觀、嚴格的“雙盲“評估機制,以評估蛋白質結構預測領域的發展水平。組委會收集通過實驗確定的蛋白質結構信息傳遞給注冊的預測者,參加預測的團隊,要在規定時間內構建出對應的結構模型,并由獨立的評估人員進行仔細審查,給出相應的打分。在AlphaFold技術面世前,CASP的比賽成績曾長期處于低位,傳統方法的預測精度始終難以突破瓶頸。
2018年,DeepMind研制的AlphaFold1首次參加第十三屆CASP競賽,在自由建模賽道中展現出顯著優于其他參賽方的預測性能,并打破了CASP競賽成績長期徘徊于低位的局面。盡管AlphaFold1取得了冠軍,并在預測蛋白質結構領域取得了突破,但距離精確預測蛋白質結構仍然有相當大的差距。究其原因,AlphaFold1本質上仍舊沿用了圖像識別的思路——它試圖通過學習大量數據,從中找規律以推測蛋白質的結構。這種方法雖然比傳統手段更為有效,但在面對極其復雜的空間折疊時,依然顯得捉襟見肘。一部分生物學家認為,這項技術僅僅是具有生物學意義,并不一定在現實中具有應用價值,長期來看,這項技術的出現并不能說明解決了生物學中的什么問題。面對瓶頸,DeepMind團隊放棄了在AlphaFold1的模型上繼續發展的想法,進行了一次徹底的底層重構:他們開發了一種人工智能網絡,該網絡整合了關于決定蛋白質折疊方式的物理和幾何約束的額外信息,并將這項技術引入到AlphaFold2中。
歷史的轉折點出現在第十四屆CASP競賽上,經過重構的AlphaFold2預測的結構在準確性上展現出了跳躍式的突破,其預測精度在統計學上已達到與實驗方法(如X射線晶體學)相當的水平,即預測誤差已落在實驗測量誤差的范圍內,這一突破標志著蛋白質折疊問題得到了根本性的解決:借由AlphaFold2,我們能從給定的氨基酸序列精準預測對應的蛋白質三維結構。AlphaFold2的成功平息了此前的眾多質疑,并確立了以深度學習為代表的人工智能技術在推進結構生物學發展方面的杰出表現。
AlphaFold技術帶來的改變遠不止于此。隨著AlphaFold3的問世,DeepMind研究團隊已經不滿足于能夠對單個蛋白質結構進行高精建模,他們引入了生成式AI核心的“擴散模型”(Diffusion Model),使得AlphaFold3成功將預測范圍拓展至包含蛋白質、核酸、小分子、離子以及修飾殘基在內的復合物的結構。這意味著我們的視野能從單一的蛋白質折疊問題,轉向更為復雜的解析生命的運行機制。這些新工具的發明就如同當年伽利略的望遠鏡與列文虎克的顯微鏡,一個新世界的大門已經徐徐拉開,剩下的就是我們的接納與展開了。
![]()
歷屆CASP競賽高難度目標得分顯示:傳統方法陷入停滯,自AlphaFold技術于第十三屆CASP競賽介入后引發變局
DeepMind公司在短短幾年內引發的這一系列技術變革引發了生物學領域的范式革命。過去,科學家只能依賴的觀察實驗得到蛋白質的結構,這一過程往往耗費幾個月。現在,AlphaFold技術能夠在幾分鐘內生成一個達到實驗精度的蛋白質結構。“這將會徹底改變游戲規則,”德國馬克斯·普朗克發育生物學研究所的進化生物學家安德烈·盧帕斯說道,他的實驗室多年來一直試圖破解一種細菌蛋白的結構,而AlphaFold只用了半個小時就給出了所需的結構。他預計這項技術將改變他的工作方式和研究方向。“這將改變醫學,改變科研,改變生物工程,它將改變一切,”盧帕斯補充道。
4、新載體與新工具將給未來的科學提供一幅怎樣的圖景
AlphaFold技術橫空出世已經6年了,它的成功重新燃起了學界對AI for science的樂觀預期。英國皇家學會發布了題為《人工智能時代的科學》(Science in the age of AI)的文件,深入探討了人工智能技術會如何改變科學探究的本質和方法。與此同時,由復旦大學、上海人工智能研究院與Nature Research Intelligence聯合發布的《AI for Science》報告中指出人工智能正在科學研究中的創新與AI驅動的科學發現中實現深度融合,建立了一種變革性的研究范式。
回望以DeepMind為代表的高科技公司發展歷程,DeepMind正通過一系列技術突破,持續拓展著這一新范式的邊界。繼AlphaFold大獲成功后,DeepMind又陸續推出了一系列深度學習與科學研究相結合的技術,其中最引人矚目的是2023年推出的GNoME,研究團隊在《nature》上發布了利用GNoMe新發現的220萬個新晶體,其中38萬種具有高度穩定性,在實驗合成中極具應用價值。這份科研業績是常規科學載體無法實現的,也是無法想象的,縱觀全球經濟,引領當代世界科技發展的主要力量幾乎都是由高科技公司引領的,由此,我們可以肯定地得出如下兩個結論:第一,新的科技發展需要新的載體,當今時代科技發展的最有效載體是高科技企業;第二,新載體與新工具的組合是實現科技范式轉型的主要力量,缺一不可,所以人工智能就是新時代科技發展的最有力工具。就如同互聯網與智能手機對于整個社會生活方式的改變一樣。至此,可以明確地說:新時代科技發展的主導力量就是新科技載體與新工具的組合,回到本文話題就是該科技企業與人工智能的結合。
從這個意義上說,營造良好的高科技企業生態環境建設與拓寬人工智能的應用渠道就是當下中國科技管理部門亟需解決的認知與決策問題,行文至此,剛剛得知,國內初創高科技公司Manus被美國高科技公司Meta高價收購,雖然很遺憾,但這是一個警鐘,如果不及時完善環境,未來會有更多的企業仿效。這一切都表明很多國家與企業都已經充分意識到新科技載體與新工具的組合恰恰是未來孕育科技革命的最基本配置,結論早已塵埃落定。
吳玲玉,上海交通大學科學史與科學文化研究院碩士研究生;李俠,上海交通大學科學史與科學文化研究院教授。文章觀點不代表主辦機構立場。
◆ ◆ ◆
編輯郵箱:sciencepie@126.com
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.