從天空到海洋,從生命科學到化學、物理學,AI是否能成為推動科技創新的核心動力?
生成式AI的崛起以人們想不到的形態出現,一如理科生的考卷由文科生批改。
席卷生活的方方面面之后,AI又以迅雷不及掩耳之勢,叩擊科學殿堂的大門。
一個時代、一個領域只有一個發展的“主范式”,與范式吻合才能踩在歷史發展進步的一邊,但范式本身有慣性,所以每一代新的范式轉換都需要付出努力和代價。
AI4S就是范式轉換的重要表征,它不以人的主觀意志為轉移,也不能人為的對抗范式轉換。但是,它也不會自然降臨,每個范式轉換期都要付出巨大的勞動甚至代價,而只有經歷這個過山車式的過程并始終不被甩出第一梯隊,才能最終駕馭范式轉換帶來的紅利,能駕馭范式轉換的才能笑到最后。
關于AI4S最前沿的理論、實踐和爭論,都在這篇文章里。
——導語
01
故宮里的計算機——計算科學研究的歷史敘事與現實突破
人類歷史上得到普遍認可的較早期的機械式計算機之一,是1642年法國哲學家兼數學家布累斯·帕斯卡發明的加法器(Pascaline)。
帕斯卡發明它的目的,是為幫助父親減少稅務計算上的勞作;而此后,二進制和微積分的發明者萊布尼茨在加法器的基礎上,發明了人類第一臺可進行四則運算的機械計算機。
帕斯卡自己親手制作了50臺加法器,而后,人們又生產了許多復制品。據說,在中國的故宮博物院,也保存著兩臺銅制的復制品,是當年外國人送給慈禧太后的禮品,但“老佛爺”哪里懂得它的奧妙,只把它當成了西方的洋玩具,藏在深宮里面。
此后的幾個世紀里,機械式計算機、機電式計算機和現代意義上的電子計算機相繼出現,但某種程度上,它們都有一個共同的前提——目的就是發明一個“代替人做數學計算”的機器。
某種意義上,人類在現代科學技術上真正的進步,是從上世紀50年代開始的。因為有了大型電子計算機,并且基于機器計算的原理發展出來了許許多多的算法,我們才可以普遍的實現了從基本原理出發來解決實際問題。
基本原理雖然此前就存在,但就效率而言,用它解決實際問題是非常困難、幾乎做不到的。
例如,我們經常聽說天才科學家破解密碼的故事,但這幾乎是不可復制的;而現在的黑客,哪怕數學知識粗淺,只要下載一個工具,在破解密碼的速度上就可以超過許多百年前的天才。
之所以能如此,這是因為程序里已經內置了一代又一代的計算機科學家開發和改善過的算法,而這些算法又基本有一個共同的出發點:可以用多項式來逼近一般的函數,從本質上來說,這是牛頓、萊布尼茨的時代就發明出來的,但只有依賴現代計算機,才能使之真正的被應用于現實。
最早的計算機出現是為了把數學家從繁冗、人力所不能及的數學計算中解脫出來,但在摩爾定律加持之下,人類計算能力得以快速增加,這是它被用于科研進而邁進公眾生活的一個前提。
其中一個重要的里程碑,是“四色問題”的解決。
它提出于1852年,是英國制圖師弗朗西斯·古特里的一個假說。他指出,無論地圖上有多少個國家,只需要四種顏色就可以對地圖進行著色,并且相鄰的國家顏色不會相同。
這個假說難以證明,主要是因為涉及龐大的計算量。因此,足足過了120多年,到了1976年才由美國的兩位數學家用計算機證明了這個假說,這背后是1200多個機器小時中進行的100億次判斷所支撐的。
![]()
如果說圖靈時代的炸彈機、巨人機只是輔助數學家運算一些步驟。那么,四色問題的解決則是在人類設定程序(算法)后,完全由計算機完成的證明。歷史在這里前進了一大步——計算機正式走到了解決科學問題的舞臺上, 計算數學、計算力學、計算化學、計算生物學等交替出現。
比四色問題的解決更具有標志性意義的,是現代計算機科學的最前沿——人工智能技術與科學的結合,而其代表事件則是2024年諾貝爾化學獎的頒發。
這次由三人分享的化學獎中,來自谷歌的英國科學家哈薩比斯和江珀的工作十分醒目,他們開發了一種名為AlphaFold2的人工智能模型,這種模型解決了一個已有50年歷史的難題,能夠預測大約兩億種已知蛋白質的復雜結構,并且已被全球200多萬人使用。
我們可以借助對這個迷人案例的解析,來看看AI特別是深度學習是如何幫助人類解決頂級科學難題。
蛋白質結構是指蛋白質分子的空間結構。作為和我們息息相關的一類重要的生物大分子,了解清楚它的結構,對生命科學研究至關重要。
通過分析蛋白質的結構,人們可以確認它們的生理功能,這樣在遺傳學的實踐上就有很大的現實意義;同時,它還可以為人們設計新的蛋白質或改造已有蛋白質提供可靠的依據,而這就是當今世界上基于精準蛋白質靶點的“救命神藥”的發明速度越來越快的背后推動力。
但是這其中涉及到海量的計算,因為蛋白質結構非常復雜。
解決蛋白質結構預測問題一直是結構生物學的圣杯。在深度學習介入之前,人類依賴電子顯微鏡對蛋白質進行實際觀測,已經做了大量艱苦的工作,并據此產生了蛋白質數據庫(PDB)。
簡單來說,蛋白質預測有兩條路徑——打個比方,TBM方法就是用采集到的指紋和已有的指紋庫相對比,一旦比中,就可以高度確信,但短板是數據庫中必須已經有可靠的指紋;而FM方法則類似于在白紙上憑借想象力畫畫,其本質是非常復雜的函數運算。
人類從1994年起就設立了蛋白質預測的獎項,但其中FM方向一直得分很低,大多數只有20到40分。
但AlphaFold的出現改變了這一切,其中的Fold指的就是“折疊”——2018年,AlphaFold采用深度學習基礎上的FM預測策略,通過三個系統支撐(建模、預測、優化),出道就拿下當年蛋白質預測大獎;2020改進后的模型AlphaFold2在第14屆CASP競賽上進一步大殺四方,在給定預測蛋白質中GDT平均得分92.4,遠超所有競爭對手。
至此,深度學習支撐下的蛋白質預測取得歷史性進展,也開始消融TFM和FM之間的間隔,人類對于蛋白質結構預測乃至設計的能力得到極大增強。
可以說,哈薩比斯等學者的成就,和當年四色問題的證明可以相提并論,同樣是計算服務于科研的里程碑事件。人們由此認為,AI在未來科學研究中成為中堅力量的可能性大幅度提升,一個新的時代即將開啟。
02
AI4S的中國故事開寫
在今天,用AI服務于科研被稱為“科學智能”,但人們往往使用一個更通俗的簡稱:AI4S(AI for Science的縮寫),值得自豪的是,這個名稱是兩位中國科學家提出的。
今天,在中國開展AI4S的研究,具有許多有利的條件。在筆者看來,有三個條件比較重要:
1.國家重視和中國科學家的AI4S意識早已覺醒;
2.中國的算力,特別是AI算力的基礎設施非常發達,在全球數一數二;
3.AI4S的實踐日益展開,已經在許多領域得到實證,理論基礎也正在探索和夯實;
關于第一點,中國科學院的湯超院士是這樣描述的:“好幾年前,鄂維南(北京大數據研究院院長、中國科學院院士)找到我,商量是否可能在北大設立一個交叉學科的項目,用來探索機器學習在不同的科學和工程領域的應用。我們給它取了一個名字,叫AI for Science。我們兩個當時都很為這個名字得意。現在來看,應該是很多人都想到了這個名字,AI for Science也成為了一個趨勢”。
而這件事更大的背景是,國家自然科學基金委在2020年底設立了交叉科學部,來統籌基金委在交叉科學領域的整體資助工作,其中任務之一就是探索建立交叉科學研究范式,而交叉科學部成立以來的第一個重大研究計劃就是在AI for Science方向的。
所以嚴格來講,AI4S的概念是中國科學家提出的,而這個方向得到了國家的大力支持。某種程度上,這也說明中國科學家的思路越來越具有超前性,對國際頂級前沿技術的感知和參與,已經在完成一個“從跟隨到開創”的新階段。
第二點,中國有世界上最好的智能算力基礎設施之一。
從整體規模上來說,截至2023年底,我國提供算力服務的在用機架數達到810萬標準機架,各類算力提供主體超5000家,算力總規模位居全球第二,成為AI4S的基礎條件之一。
但是,僅僅看算力的總規模是不夠的,還要看算力平臺的對AI的親和度。
以華為云為例,就以系統性創新,重新定義了云基礎設施。可以滿足隨著計算場景的多元化以及智能算力需求飛速增長而不斷產生的新需求。
最傳統的云計算中心,是以CPU為中心的主從架構,但這很難滿足以GPU為核心的智算需求。
同時,科學家們發現,在某種程度上,用通用算力(CPU、GPU)來滿足特定場景的需求,存在成本高、能耗高的問題。因此專用集成電路的概念開始盛行,針對不同的AI計算場景,又發展出了NPU(神經網絡處理器)、TPU(針對專門為加速深層神經網絡運算能力的芯片)、DPU(深度學習處理器)等等。
但是,不同架構和方向的處理器如何整合和調度又成了大問題,這就像好一輛車卻裝上了好幾個發動機,沒有協調好是開不走的。
各種基于不同需求、不同技術棧而研發的芯片如果不能協同,反而成為一盤散沙。在這個背景下,華為云研發了CloudMatrix架構,就像讓一只雄獅帶領著一群羚羊去戰斗,這種架構實現了“一切可池化”,讓CPU、NPU、GPU、高速內存等多樣資源統一抽象,被放進一個資源池里。基于精妙的調動,相比傳統單體算力,這種緊耦合矩陣算力規模提升了一個數量級以上。
此外,“一切皆對等”指通過超高帶寬的Scale Up網絡,打破單體算力性能和集群線性度瓶頸,以盤古大模型訓練為例,效率可提升68%;“一切可組合”則指通過瑤光智慧云腦提供NPU、GPU、CPU、內存等資源按需組合,通過匹配最優算力組合,實現百億到萬億級模型訓練所需的資源。
另外,基于自主創新的AI底層硬件,華為云昇騰AI云服務整合了大規模算力集群、計算引擎CANN、AI 開發框架MindSpore、ModelArts AI 開發生產線和ModelArts Studio大模型即服務平臺,為大模型的訓練,推理,AI 應用的開發、運行提供穩定可靠的全棧算力保障。
舉一個很容易理解的例子,以一個常見的萬卡大集群為例,由于涉及到數十萬計的處理器、內存、存儲陣列、跨網絡的高度并行和滿負荷運轉,經常會出現因為部分硬件損壞和軟件故障導致的訓練中斷。
一位AI專家告訴我,早期的大模型訓練經常運行幾分鐘、十幾分鐘就會中斷,而即使經過多次迭代,平均可持續水平也不超過3天。
但針對萬億模型訓練這個典型場景,昇騰AI云服務已經可實現40天無中斷,是業界標準的十幾倍乃至幾十倍。
由此可以說,目前我們已經擁有世界級的高AI親和度的智算基礎設施,這是實現AI4S的重要前提之一。
![]()
因此,第三點也呼之欲出。
如鄂維南院士就指出,科學研究總體上可分成基于數據驅動的開普勒范式和基于原理驅動的牛頓范式,這兩種范式在現代遇到了各自的挑戰,但這一挑戰又有一個共同的解決方向——“缺乏有效手段解決高維數學問題,是阻礙科學研究與技術發展取得進一步突破的主因之一。而深度學習,或者說人工智能,可以幫助解決這個問題“。
各個學科都有一些基本規律,其特點是都以微分方程呈現,而且都是非常困難的微分方程。
而AI大模型在這方面優勢明顯。
鄂維南指出,傳統的計算機算法基于用多項式逼近一般的函數,但在目前的科研領域遇到的問題是,依賴的變量太多了。隨著變量個數(也就是維數)的增加,計算的復雜度呈指數級增加,這就是維數災難,而多項式方法對此是無效的。
反之,AI對于多維問題反而是好手,以大模型“最拿手”的人臉識別為例,“每個像素都是1個自由度,這里一共有32x32=1024個維度;此外,顏色空間有三維,所以再乘以3,每一個圖像都可以看成是3072維空間的一個點,所以Cifar10的分類問題可以看成是尋找一個3072維空間上的函數。這樣的高維函數以前我們是根本沒辦法處理的”。
但這對深度學習大模型來說,恰是強項。
由此可見,從科學研究的角度來說,深度學習可以帶來新的計算方法、新的科學模型和新的實驗方法,這似乎已經是不爭的事實。
但在實踐中呢?
03
在實踐中成長
在主流科學界認知到位和軟硬件支撐條件均已十分完備的情況下,中國的AI4S擁有了一個非常良好的開局。
讓國人驕傲的C919大飛機現在已經在國航、東航和南航的航線上發揮作用,正在研發的C929和C939更是國人心心念念的“國之重器”。
也正是因為此,中國商用飛機公司聯合華為發布的業界首個工業級流體仿真大模型“東方御風”,就更加受到關注。
很多網民津津樂道的是,為什么中國最近飛行器的研發周期屢屢打破此前的世界紀錄?
很多人都知道,中國的風洞技術全球領先,這是近年來中國飛行器研究屢屢取得突破的重要原因。
此話不假。但是,這其中也有AI技術的功勞。AI4S的方式,在一定程度上顛覆了飛行器的研發周期率。
人們很少知道的是,一個超級風洞不僅造價高昂,而且使用成本極高。其驅動功率動則超過1萬兆瓦。
更重要的是,高級別風洞的穩定輸出時間極短,100毫秒往往已經是極限。
所以,在絕大多數真實研究中,吹風洞只能解決一部分問題,而持續的優化和模擬運行,則要依靠計算機模擬,這就是我們前面談到的計算科技的一個重要分支——計算流體力學(CFD)。
用計算機仿真模擬來解決流體力學問題,從上世紀50年代就開始發展,隨著計算機算力的增長和軟件的升級,其能力已經十分成熟。
甚至,有人一度鼓吹——數字風洞可以取代傳統風洞。
但魔鬼在細節里——一位航空專家告訴我——由于在計算時所提供的計算模型,并不能包含所有實際流動的細節,所以數值模擬結果可以預測實驗器件的氣動性能變化規律,但是不能反映實際的各種流動細節,因此真實風洞試驗仍不可或缺。
而之所以不足以反映各種細節,有軟件設計、數值設置的問題,但還有一個更重要的問題,就在于我們前面提到的高維問題——因為實際變量細節太多,導致計算維度太高,傳統仿真計算效果不夠好。
例如,在設計飛機翼型時,當攻角發生變化時,流場會發生劇烈的變化,甚至出現激波現象。而激波前后的流場變化劇烈、復雜,導致無論是傳統的CFD,還是一些傳統的AI算法都會預測困難。
而“東方御風”的強悍就在于,使用用更新后的AI模型替換傳統Navier-Stokes方程求解,提升了典型場景的仿真效率,而且通過將流動劇烈變化區域的特征劃分為更多、更精細的維度來進行精細捕捉,從而實現了前所未有的整體AI流體仿真的預測精度提升。
由于華為云底座提供了前所未有的并行AI算力,加之模型的優化,得以在降低仿真時間同時又沉淀出了新的模型和工具。其不但局部改變了CFD的發展范式,也會很容易被華為云作為一種流體力學方面的解決方案利器,復用于高鐵、汽車等研發場景中。
這是一次標準的AI4S工程,而它的成績赫然是——降低仿真時間1000倍。
另一個高度值得關注的是在氣象預報領域,目前,該領域已經成為國際AI巨頭展示AI4S能力的競技場。
天氣預報是一個非常適合AI4S來“炫技”的領域。一方面,各國都會有過去數十年甚至更長時間的天氣氣象數據,是天然的優質訓練數據集;另一方面,數值預報已經把基于計算的預報在數學上發展到了一個相當高的水平,給AI用來改進或突破確定了較好的“靶點”。
先是國際頂級學術期刊《自然》(Nature)雜志在正刊發表了華為云盤古大模型研發團隊的研究成果——《三維神經網絡用于精準中期全球天氣預報》,這是近年來中國科技公司首篇作為唯一署名單位發表的《自然》正刊論文,它們的成果的英文名稱是Pango-Weather,也就是盤古氣象大模型。
《自然》審稿人對該成果給予高度評價:“華為云盤古氣象大模型讓人們重新審視氣象預報模型的未來,模型的開放將推動該領域的發展。”
或許是華為云的大模型引發的連帶效應,谷歌和旗下的DeepMind連發三個天氣類模型NeuralGCM、GraphCast和Cencast,反映了這一領域的激烈競爭。
而華為云盤古氣象大模型主要的看點,則不但是史上首個精度超過傳統數值預報方法的AI模型,而且速度相比傳統預報提速10000倍以上。
從技術上說,盤古氣象大模型的核心是提出了3D Earth-Specific Transformer模塊,其主要思想是使用一個視覺transformer的3D變種來處理復雜的不均勻的氣象要素。
這讓人不由想到此前鄂維南院士的話:高維計算是傳統計算的難點,但對于基于多模態的大模型來說,只要把用于圖像或人臉識別的模型進行改進,就可以很好的解決這個問題,這也是大模型的先進之處。
同時,由于氣象要素數據對應的經緯度網格是不均勻的,而不同的要素在不同緯度、高度的分布也是不均勻的。盤古天氣大模型對這些不均勻性的建模,提升了預測精度,也有利于學習氣象數據背后潛藏著的復雜物理規律。
而無論是盤古-天氣大模型還是與之類似和競爭的多個大模型,共同點都是利用深度學習方法,在大規模的歷史天氣數據上進行訓練,并使用改良的模型模塊,從而在效率、效益和成本上,都具有顯著的優勢。
很簡單的一個對比是,雖然訓練需要的數據很大、過程也不短,但生成的模型只需要很少的算力、時間和能耗就能完成,這里的“很少”是對比傳統方式,其則至少需要在超級計算機集群上運行很長時間。
其實,數值天氣預報的“嫡系”升級版并不是氣象大模型,而是一種被稱為集合天氣預報的方法,它的代表機構——歐洲中期天氣預報中心(ECMWF)雄心勃勃的宣稱,2023年完全轉變為100個成員的集合預報系統。
而氣象大模型相當于半路上殺出的程咬金,是典型的跨越式技術對漸進式技術突發的“降維打擊”。
可以想見,未來5-10年,兩種不同的模式將激烈沖突或融合發展,而這一幕也會在多個科技領域上演。
04
第五范式的前奏
由于前文已經充分的描繪了AI4S的美好前景和積極實踐,那我們在這里就總結一些未來的機遇與挑戰。
首先,目前產生的一些AI4S的成果,用湯超院士的話說就是“大多是1到100,或者1到1000的成果,而較少是從0到1的”。
這句話深刻的揭示了AI4S的現狀。如果說的尖銳一點,就是這些問題的解決剛好進入了大模型的舒適區,比如把一個視覺模型改造成力學模型,而且所解決問題的癥結也比較顯性。
當然,進步就是進步,就像華為云的成就登上《自然》雜志一樣,讓中國的AI4S得到世界級的認可,甚至激發了科技巨頭的跟進,這都是值得嘉賞的。
但我們并不應該滿足,如哈薩比斯就提出——AGI(通用人工智能) 的一個重要測試標準,將是其是否能夠自主生成像廣義相對論那樣的全新假設和理論。
如果說“圖靈測試”基本已經在這一輪生成式大模型浪潮中得到驗證。那“哈薩比斯假說”,就應該是我們的AI產業,特別是華為這樣的AI領軍企業的長期目標。
其次,AI科學家應該加速發展為AI+科學家。
我們一般稱研究AI發展的高層次科研人才為AI科學家,但推動AI發展的,不應該只有AI科學家。
2023 年,《自然》雜志(Nature)進行了一項針對 1600 名科學家的調查研究,以了解科研工作者對生成式AI的使用狀況和想法。
結果顯示,有一半的參與者本身就是研究 AI 領域的研究者。而如果排除這部分人群,在非 AI 領域的研究者中,也有超過一半的人會在科研工作中使用 AI。
但不要高興太早,這些科學家使用AI的三個主要場景是——輔助非英語母語的作者撰寫論文(包括編輯和翻譯)、用 AI 編寫代碼、用 AI 提煉論文內容以節省閱讀時間。
除了用AI編寫代碼有一定的科技屬性以外,另外兩項都是文字性的工作,這也和目前的大模型主要是大語言模型的現狀相匹配,但也從一定程度上反映了目前AI距離科研的核心場景還較遠。
如果你希望AI解決核心的科研問題,首先得有熟悉這方面研究的科學家來描述需求、尋找靶點,而AI科學家則配合其完成工作——不得不說,這很會很難。
我不由想起我對楊振寧先生的一次采訪,楊先生告訴我,上世紀50年代的時候,IBM發明了大型計算機,因此聯系了一些他這樣的高級科學家來研究使用計算機是否對科研工作有幫助。
“我確實感到計算機有很強的計算能力,可以幫我解決一些科研上的問題。但當時的計算機使用非常困難,你得自己編寫程序并輸入,我很快學會了,因為它本質上是數學。我甚至研究出了一種編程的方法,如果發展下去可能是未來的Fortune語言”,他回憶說:“但太耗時了,所以我試了一段時間就放棄了。”
這段話至今讀來仍然令人警醒——當一種先進的科研工具的使用門檻,高到令當時的頂級科學家都有使用后就想放棄的念頭時,它一定是很難推廣的。
事實上,正是一代代編程語言的進化,從用代碼到可視化,從半自動到自動化,再到今天的可由AI自動生成,計算機的科研價值和社會價值的釋放才能充分、徹底。
華為云對此已經有深刻的認知,例如他們已經廣泛的和科學界合作。如在藥物研發方面,與華中科技大學、西交大一附院的教授通過華為云輔助制藥平臺發現新靶點活性物質;又如北京大學高毅勤教授基于華為云,研發的蛋白質結構預測功能,支持孤兒序列預測,功能上已經超出AlphaFold2……此外,在氣象、農業、海洋科學方面都有不錯的嘗試。
我為這些做法點贊,但我更激賞的做法,是華為云已經把平臺服務覆蓋到了10+AI4S領域(包括生物醫藥、計算化學、地球科學、電磁學、流體仿真、量子力學等)和80+模型,這才是真正的為科學家賦能的“大道”。
點對點、人對人形態的AI賦能,一定沒有1對多、工具性和生態型的賦能更有效率,我相信華為云會在這個方向上不斷拉低AI4S的使能方式,讓經過工程化和產品化,支持開箱即用和二次開發的更多的AI4S工具和套件,去提升敏捷創新的效率,提高用戶科學計算AI的開發效率。
最后,范式轉換期一定有更多的困難和挑戰。
科學哲學家托馬斯·庫恩的《科學革命的結構》是無數科創領域大佬的案頭書,他也被廣泛認為是20世紀最重要的科學哲學家。
庫恩的核心理論就是“范式說”,這是一種對時代進步的全新概念,簡單說,庫恩認為一個時代、一個領域只有一個發展的“主范式”,與范式吻合才能踩在歷史發展進步的一邊,但范式本身有慣性,所以每一代新的范式轉換都需要付出努力和代價。
AI4S就是范式轉換的重要表征,它不以人的主觀意志為轉移,也不能人為的對抗范式轉換。但是,它也不會自然降臨,每個范式轉換期都要付出巨大的勞動甚至代價,而只有經歷這個過山車式的過程并始終不被甩出第一梯隊,才能最終駕馭范式轉換帶來的紅利,能駕馭范式轉換的才能笑到最后。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.