![]()
![]()
搜狐科技《思想大爆炸——對話科學家》欄目第138期,對話西湖大學工學院終身教授張岳。
嘉賓簡介:
張岳,西湖大學工學院終身教授,曾在新加坡科技與設計大學擔任助理教授。主要研究領域為自然語言處理、文本挖掘、機器學習和人工智能。
![]()
DeepScientist最關鍵的因素,是貝葉斯優化問題以及學術經驗指導的試錯問題。
如果人和機器共同加速科研進展,而不去擔心發表范式的滯后,科研的可復現性會大大提升,也不存在弄虛造假的問題。
AI本身的研究和AI安全研究一定是齊頭并進的,并且AI是可控的。
未來想把計算機科學家變成全學科的科學家,真正幫助人類設計新材料,發明新物質,解決更多的挑戰。
出品|搜狐科技
作者|周錦童
編輯|楊 錦
人工智能迅猛發展,西湖大學再度成為聚光燈下的焦點。近日,張岳教授團隊研發了一款AI科學家系統——DeepScientist,引發了網友們的關注。
DeepScientist是首個具有完整科研能力,且在無人工干預下,展現出目標導向、持續迭代、漸進式超越人類研究者最先進研究成果的AI科學家系統,它在多個前沿人工智能科學任務中,首次實現自主產出超越人類最佳方法(State of the Art,簡稱SOTA)的研究成果。
DeepScientist工作流程是怎樣的?克服了哪些局限性?AI科學家的出現會不會改變科研范式?帶著這些問題,搜狐科技對話了西湖大學工學院終身教授張岳,聽他分享DeepScientist從研發到落地的故事。
![]()
中國首個AI科學家
“DeepScientist”的命名是文章一作翁詣軒的手筆,最開始本想叫Deep Researcher,但和Open AI開發的搜索智能體重名,所以就有了DeepScientist。
談及研究初衷,張岳表示:“我們開發DeepScientist的最終目的是想做一個具有自主科研能力的科研大模型智能體,因為人類在研究過程面臨很多挑戰,科學家的精力有限,如果大模型能幫助人類解決這些挑戰,就能推動科學發展。”
在這一到兩年的時間,張岳團隊有關DeepScientist的探索取得了里程碑式進展。
在AI文本檢測任務中,DeepScientist用兩周時間就實施和驗證了超過1000種不同的假設,取得了相當于人類三年的進展,其設計的方法實現了7.9%的性能提升,成功超越了人類現有SOTA方案。而且DeepScientist還在智能體失敗歸因、LLM推理加速等任務上也分別達成了新的SOTA,同樣僅需數周時間即可超越人類表現。
人類科研很大程度上是試錯的過程,成功和失敗的經驗再加上已有知識,是構成科學家發明創造的一個基礎,另一個基礎是可以試錯迭代,根據實驗結果調整方案,這也是張岳團隊設計DeepScientist的出發點。
AI科學家的概念是去年6月被正式提出的,日本Sakana AI公司率先推出了AI scientist的智能體系統,張岳實驗室也在同期進行相關研究。
“2023年4月Open AI推出ChatGPT-4后,我們都在想同一個問題:當 AI具備一定的智能(解決新問題的能力)后,能不能幫助人類加速科研進展?所以從去年6月開始,AI科學家的概念和系統原型不斷在國際上被推出來,我們也做了很多基礎貢獻。”張岳如是說。
世界上第一篇正式發表的AI科學家文章,就是張岳團隊今年4月推出的CycleResearcher,這也是DeepScientist的前身。當時他們還推出了世界上第一個人類專家水平的自動審稿大模型DeepReviewer,AI科學家寫完論文后根據審稿意見可以回過頭改進。
不過,CycleResearcher是單線的科研系統,并不能真正解決人類的挑戰,只是有寫學術論文的能力,這樣的科學家不能產出真正改變人類生活的科學成果。
等到了DeepScientist這個版本就實現了迭代式的進步,能夜以繼日地進行科研,真刀實槍地改變人類生活,達到人類探索中尚未達到的科研高度。這里面最關鍵的因素是貝葉斯優化問題以及學術經驗指導的試錯問題,這也是“里程碑”意義所在。
回到貝葉斯優化過程,張岳也進行了解釋:“首先要制定一個目標,比如我們的研究全是AI算法,那我想讓算法精確率達到多少,然后進行兩方面的驅動。”
一是根據科學知識、文獻去設想現有方法的不足,這是理論上的驅動。另一個驅動是實證上的,寫代碼后去運行,看看取得的實際效果如何。這需要一些測試基準,可以認為是實驗數據,然后算法根據實驗數據得到運行結果,結果也必須是可評估的,評估出它的準確率后就可以進一步指導試錯過程。這樣一來,DeepScientist就具備了從大量的想法和嘗試中歸納總結并漸進式探索的能力。
張岳稱,在整個過程中,還要分不同的層次。比如頂端有一些技術路線的指導,指引以后再往下細分,細分就是指這一條技術路線會有不同的設置,每個設置下面都有不同的結果,根據這些試錯反饋,還要回溯到頂層,評估技術路線要不要進行調整。
“類比來說就像發明燈泡,要嘗試不同的材料,并且根據試錯的結果,還需要再進行一些理論的分析,指導下一步的試錯。”張岳舉例道。
![]()
用AI寫論文、審稿、做實驗
在張岳看來,DeepScientist的出現一定會催生新的發表范式和科研范式。
“我上學發表第一篇頂會論文的時候,整個會上不過一百篇論文,現在同樣的會議超過了一萬篇,科研速度快,論文數量激增了100倍,我們在arXiv上看文章,但開會時間往往比科研結果晚9個月甚至更多,開會的時候就學不到什么新知識,傳統的發表范式跟不上了。”
此外,張岳還稱現在會議的審稿系統也接近崩潰狀態,因為投稿量太大,有經驗的審稿專家工作超負荷,每個作者都需要審稿,但作者的認真程度和專業知識參差不齊,導致論文質量大大下降。
AI科學家出現之后,會進一步增加學術迭代速度,人類所擁有的技術也就越多,所以未來發表范式會轉變,也許不再需要學術會議。
“我們實驗室推出了一個新的平臺AiraXiv,既可以接受arXiv的文章,也可以接受AI寫的文章,再用AI審稿人自動把關,標注文章質量,進行個性化算法推薦,每天根據用戶喜好從海量論文中篩選出最相關、最喜愛的文章進行推送,這樣大家的科研結果就可以用AI快速寫成文章,快速公之于眾,不需要等到學術會議發表。”張岳如是說。
至于科研范式也會有所轉變。如果每個實驗室都用AI助力做實驗、寫論文,科學家就可以把軟件工程和論文負擔交給AI,大大地解放雙手。而且科學家還可以幫助AI進一步提升科研效率,畢竟科學家的洞見是現在大模型不具備的,大模型可能試錯100次,才得到3個正向結果,而在科學家的指導下,可能只需要試錯10次。
在張岳看來,如果人和機器共同加速科研進展,而不去擔心發表范式的滯后,每一個實驗室就是所見即所得的文章,科研的可復現性會大大提升,因為所有的代碼都是AI寫的,所有的實驗過程都可以被公開追溯,不存在故意弄虛造假的問題。
第三是發表迭代,很快每個人都能第一時間得到最相關的文章,將來的學術會議會變成由AI自動聚集興趣最相關的科學家成一個小組,科學家可以隨時拉一個20-100人的會議,以最高效的線上、線下方式交流科研成果。
張岳認為這是將來必由的范式轉變。下個月,世界第一AI科學家大會將在北京召開,他們邀請了國內外最相關的科研人員參加進行小范圍討論。
“大會主席由人把關,但允許世界上愿意參與的學者通過我們的AI科學家系統進行研究,并自動生成論文投稿到會議,然后接受AI審稿,整個AI科學家大會對新的學術范式以及新興領域會帶來什么影響,我們也拭目以待。”張岳如是說。
![]()
全學科人工智能科學家
不過,也有許多網友擔心,一個無需人類干預的AI系統,是否存在研究方向失控或被誤導的風險呢?
對此,張岳表示:“AI安全問題一直是我們重視的問題,所以DeepScientist公之于眾,我們也采取了審慎的策略。”
第一批公開可以使用的接口只通過AI科學家會議公開,并且每位想使用的科學家需要提交書面申請,張岳團隊會從眾多申請者中遴選出少部分最有挑戰性、符合倫理標準的研究對象,再進行合作實驗,同時他們也會有倫理規范的檢驗工具。
“比如,我們實驗室有AI生成論文自動檢測系統,可以準確地檢測出論文是否由AI生成,我們也有世界上第一個AI審稿人大模型,之后我們又做了AI安全審稿人的工作,讓審稿人不被惡意的用戶欺騙,做到評價可靠。”張岳舉例道。
在他看來,AI本身的研究和AI安全研究一定是齊頭并進的,并且張岳深信AI是可控的。
“作為一位AI語言模型學者,我們對語言模型的工作機理相對比較了解,所以對于AI的可控程度我是持比較積極的態度,我也十分鼓勵學生們盡早、更多地使用AI工具,畢竟未來人一定要和AI協同工作。”
“AI取代了50%以上的程序員,但還是需要最優秀的程序員來控制AI才能生成好的系統,我們用多了之后才能真正讓AI理解你,才能得心應手地寫出想要的東西,如果完全依靠AI,那是做不出來的,而且我們也能檢測出來論文是不是AI代寫的。”張岳笑道。
國際上也有一些團隊在嘗試有關AI科學家的研究,在張岳看來,我們國家處在國際最前沿的水平。
目前,張岳團隊正在做兩方面的工作。一是讓它更聰明,擁有更深刻的洞見和更強的推理能力,能在試錯更少的情況下得到正面的結果,提升科研效率。二是想讓它從計算機科學家擴展為通用學科的科學家,解決生物、物理、化學等各個學科的問題。
“在這些問題上,我們團隊也有嘗試,像一般學科,數據并不是存在計算機里,往往是實驗得到的,經過一年的開發,我們打造了Airalogy平臺,可以讓每一個實驗室都以最方便的形式把實驗數據電子化上傳云端,最近也全球上線了。”
張岳團隊還加了一些巧思和設計,讓導師和AI對話,告訴AI正在做什么實驗,學生也可以通過拍照、對話的形式,快速地把正在做的實驗電子化。
“我們相信當收到足夠多的通用學科實驗數據后,就可以把現在的計算機科學家變成全學科的科學家,真正幫助人類設計新材料,發明新物質,解決更多的挑戰,促進社會進步。”張岳如是說。
![]()
![]()
運營編輯 |曹倩審核|孟莎莎
![]()
![]()
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.