<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      研究員首次全線落敗——AI架構、數(shù)據(jù)、算法三戰(zhàn)獲科學發(fā)現(xiàn)級突破

      0
      分享至



      「AI的發(fā)展,已經(jīng)進入決賽圈。決賽圈比拼的,是AI自進化的加速度」 —— 項目負責人

      DeepMind 德米斯·哈薩比斯曾用一句話定義他畢生的使命:「先解決智能問題,然后用它來解決其他一切問題。

      這句話背后藏著一個極其深刻的邏輯——智能,是打開人類一切重大命題的萬能鑰匙。物理、化學、生物……所有領域的突破,本質上都在等待同一件事的發(fā)生:AI 真正掌握自我進化的能力。一旦這道門被打開,它所釋放的能量,將同時涌入人類知識版圖的每一個角落。

      AI 的每一次進步,背后都是人類研究員在架構設計、數(shù)據(jù)清洗、算法調優(yōu)上投入的海量人力——這是一條以人力為燃料的線性賽道:效率低下,迭代緩慢,而我們所期望的是那條指數(shù)級躍升的曲線。

      AI 在加速,但駕駛它的,還是人類的雙手。這,正是決賽圈真正的瓶頸所在。直到今天,這個瓶頸,第一次被正面擊穿。



      圖:AI自主實現(xiàn)架構、數(shù)據(jù)、算法三大核心領域的科學發(fā)現(xiàn)級突破,其光芒向外輻射,驅動數(shù)學、生物醫(yī)學、物理學等整片知識星系,邁入全新軌道。

      來自創(chuàng)智學院、上海交通大學劉鵬飛研究團隊(GAIR)發(fā)布的「超智能-進化」框架:ASI-Evolve,已經(jīng)可以在不依賴人類研究員的前提下,獨立完成「發(fā)現(xiàn)問題 → 設計方案 → 迭代驗證 → 提煉規(guī)律」的完整科研閉環(huán)。

      更重要的是,這一次并非某個局部領域的小試牛刀——而是在 AI 研發(fā)最硬核的三大核心戰(zhàn)場上,同時交出了科學發(fā)現(xiàn)級別的答卷:

      • 神經(jīng)網(wǎng)絡架構設計——AI 獨立發(fā)現(xiàn)超越人類專家的全新架構。
      • 預訓練數(shù)據(jù)篩選——AI 自主優(yōu)化數(shù)據(jù)策略,MMLU 評測提升超 18 個百分點。
      • ??強化學習算法設計——AI 設計出全新訓練算法,數(shù)學競賽題上超越 GRPO 基線達 12.5 分。

      三場硬仗,三場勝利。人類研究員,在 AI 自我進化的加速度競賽中,首次全線落敗。如果說過去大家更多看到的是 AI 幫人類做研究,那么 ASI-Evolve 展示的是另一件事:AI 開始加速 AI。

      不僅如此,團隊還進一步證明,AI 優(yōu)化出的設計可以直接遷移到真實藥物發(fā)現(xiàn)任務,形成從 AI 研究到科學應用的完整鏈條。

      開源鏈接:https://github.com/GAIR-NLP/ASI-Evolve

      技術報告:https://github.com/GAIR-NLP/ASI-Evolve/blob/main/assets/paper.pdf

      為什么這件事難?

      AI 研究不是「給一個答案」

      真實世界里的 AI 研究,本質上要同時跨過三重門檻:

      • 執(zhí)行成本高:一次有效驗證往往要消耗數(shù)小時甚至更久的計算資源,還伴隨真實工程接入與運行成本。
      • 搜索空間大:目標開放、邊界不預設,系統(tǒng)必須在大規(guī)模候選方向中自主找到有價值的探索路徑。
      • 反饋維度多:結果不是簡單的「對 / 錯」,而是多維、間接、甚至彼此沖突的信號,必須經(jīng)過分析才能轉化為下一步行動。

      真正困難的,不是生成一個點子,而是在漫長、昂貴、弱反饋的實驗循環(huán)里,持續(xù)進化自己的研究能力。ASI-Evolve 正是為這個問題而設計的。

      三大核心成果:

      AI 首次打通 AI 研發(fā)閉環(huán)

      ASI-Evolve 的核心結果,不是幾個彼此并列的案例,而是一條完整主線:AI 首次在統(tǒng)一框架下,打通了 AI 研發(fā)的三大核心支柱。

      架構:AI 開始自主做模型架構研究

      在神經(jīng)網(wǎng)絡架構設計任務中,ASI-Evolve 以 DeltaNet 為起點,圍繞高效線性注意力展開長周期自主探索。系統(tǒng)累計進行了1773 輪演化實驗,在驗證階段發(fā)現(xiàn)了105 個超過 DeltaNet 的新架構,最終最優(yōu)模型相較 DeltaNet 獲得大幅提升,接近當前人類設計 SOTA 增益的3 倍



      更重要的是,這不是只在單一開發(fā)集上「刷出來」的結果。在擴展到1.3B 參數(shù)、100B token的大規(guī)模驗證后:

      • 開發(fā)集最高達到57.28%平均準確率,超過 DeltaNet 的 55.76%。
      • 6 個 held-out OOD 任務上也達到45.40%,超過 DeltaNet 的 44.74%。

      這說明 AI 發(fā)現(xiàn)的不是只對榜單有效的技巧,而是真正可以泛化的結構性改進。

      數(shù)據(jù):AI 開始自主塑造下一代模型要吃什么數(shù)據(jù)





      AI自主處理訓練數(shù)據(jù),大幅提升模型表現(xiàn)



      數(shù)據(jù)策略不再只是人工規(guī)則工程,也開始成為AI 可以持續(xù)研究、反復迭代、主動優(yōu)化的對象。

      算法:AI 不只是調超參,而是在發(fā)明新的 RL 訓練算法

      在強化學習算法設計任務中,ASI-Evolve 以 GRPO 為強基線,直接改寫 advantage 分配與梯度更新機制。系統(tǒng)在 300 輪演化中訓練并評估大量候選算法,其中 10 個在探索階段超過 GRPO,最終有 3 個算法進入 14B 規(guī)模驗證。最終算法在數(shù)學與代碼等多類任務上相對 GRPO 取得一致提升:AMC32 上最高 +12.5 分、AIME24 上 +11.67 分、OlympiadBench 上 +5.04 分,并在數(shù)學、抽象推理、STEM、金融與代碼等更廣泛評測上保持優(yōu)勢。



      AI自主設計算法

      最有代表性的兩個創(chuàng)新方向:

      • 一個方向通過成對比較的 advantage 估計和不對稱 clipping,顯式建?!负玫幕卮鹁烤贡绕渌卮鸷枚嗌佟埂?/li>
      • 另一個方向引入全局更新預算,為每個 token 動態(tài)分配可信更新半徑,從數(shù)學上約束 noisy training 中的策略更新穩(wěn)定性。

      它做的不是參數(shù)搜索,而是在真正進入算法層面的數(shù)學創(chuàng)新。這三項結果合在一起,說明AI 已經(jīng)開始在架構、數(shù)據(jù)、算法這三大核心研發(fā)環(huán)節(jié)中形成閉環(huán),直接參與 AI 自身的進化。

      ASI-Evolve:

      完整的 Learn-Design-Experiment-Analyze 閉環(huán)





      為了解決這些復雜的科研任務,框架設計了「學習-設計-實驗-分析」閉環(huán),由五個相互配合的角色構成:

      • 研究員:提出新假設、生成候選方案。
      • 工程師:把方案真正放進實驗環(huán)境執(zhí)行,拿到真實結果。
      • 分析者:閱讀復雜實驗輸出,把雜亂日志、指標和現(xiàn)象提煉成可復用的洞察。
      • 數(shù)據(jù)庫:積累自身研究經(jīng)驗,形成對于具體任務的專業(yè)見解。
      • 認知池:作為人類知識的圖書館,提供高質量的領域信息。

      相比于以往的自動化科研工作流,改進在于兩方面:一是讓 AI 在實驗中充分吸收人類科研積累,站在巨人的肩膀上,把盲目、冗余的探索壓到最低;二是真正讀懂并剖析實驗輸出,讓每一次實驗都被充分利用。



      橫向對比,效率明顯提升

      論文中的分析實驗也展示了這一設計的必要性:在數(shù)學領域的 circle packing 任務上,ASI-Evolve 最快只用17 步就達到 SOTA 級結果,明顯快于 OpenEvolve 和 GEPA;而當去除分析者,系統(tǒng)進化很快進入平臺期;離開了認知池,啟動明顯變慢。這更說明了自主科研不是以量取勝的盲目搜索,而應該是「知識先驗 + 實驗反思」雙重驅動下的高效演化。



      消融實驗,分析和認知缺一不可

      從 AI 研究到真實應用:藥物發(fā)現(xiàn)的遷移驗證

      然而,AI 優(yōu)化出的 AI,在真實應用場景下真的有用嗎?

      為回答這個問題,GAIR 團隊把 ASI-Evolve 演化出的架構遷移到了藥物-靶點相互作用預測任務中,用 AI 自動發(fā)現(xiàn)的新架構去解決生物醫(yī)藥問題。





      ASI-Evolve自主優(yōu)化模型架構,實現(xiàn)跨領域應用提升

      相較 DrugBAN 基線,ASI-Evolve 發(fā)現(xiàn)的架構在多個 benchmark 上都實現(xiàn)了穩(wěn)定提升:

      • BindingDB 開發(fā)集:AUROC 提升 +1.91,F(xiàn)1 提升 +2.95。
      • 隨機測試集:AUROC 提升 +1.05。

      更重要的是,在更困難、也更接近真實應用價值的cold-start場景里,面對從未見過的新藥或新蛋白時,提升更大:

      • unseen drug 場景:AUROC 最高提升 +6.94。
      • unseen protein 場景:AUROC 提升 +3.56。
      • 雙重泛化(藥物 + 蛋白均未見):AUROC 提升 +4.36。

      這說明 AI 自主研究得到的并不是「只對 AI benchmark 有效」的技巧,而是具有跨領域遷移價值的真實設計能力。AI 優(yōu)化的 AI,開始在真實科學應用場景里顯示出實用價值。

      對開源社區(qū)與 AI 研究范式的意義

      ASI-Evolve 真正值得關注的,不只是拿到了幾個更高的分數(shù),而是第一次在統(tǒng)一系統(tǒng)中,把「AI Accelerates AI」這件事系統(tǒng)性地展開并驗證了出來。

      GAIR 團隊展示的是:AI 已經(jīng)可以在架構、數(shù)據(jù)、算法這些 AI 發(fā)展的基礎環(huán)節(jié)上,通過系統(tǒng)的自我進化閉環(huán)持續(xù)推進研究。這意味著,當 AI 智能快速發(fā)展時,這種增長不只體現(xiàn)在解題、寫代碼或執(zhí)行任務上,也開始能夠反哺 AI 自身科研,加速下一輪發(fā)明,形成 AI research level 的迭代進化,并輻射賦能 Math、Drug 等其他學科。

      未來展望

      隨著 AI 持續(xù)變強,這種自我科研加速不會停留在架構、數(shù)據(jù)、算法三層,而可能進一步擴展到框架優(yōu)化、推理加速等更完整的 AI 工作流。

      在更宏觀的層面上,隨著進化系統(tǒng)承擔越來越多實現(xiàn)、試驗和迭代工作,人類可以把更多精力從「執(zhí)行方案」轉向「定義問題」,把最重要的問題設定、研究方向判斷和價值選擇留給人,把更大規(guī)模的假設空間探索交給 AI。

      ASI-Evolve 展示的,是 AI 自我科研加速從設想走向系統(tǒng)性驗證的一步。當 AI 開始真正參與 AI 的發(fā)明過程,我們看到的或許不只是效率提升,而是AI 研發(fā)范式本身開始發(fā)生變化

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      一夜暴跌25%!小馬哥最怕的事還是發(fā)生了:年輕人正在從騰訊溜走

      一夜暴跌25%!小馬哥最怕的事還是發(fā)生了:年輕人正在從騰訊溜走

      潮鹿逐夢
      2026-03-21 11:54:42
      借7000元買手機,背上1.6萬債:誰在拿iPhone做局?

      借7000元買手機,背上1.6萬債:誰在拿iPhone做局?

      雷科技
      2026-03-29 14:20:13
      焦泊喬離隊并非家人被罵,杜鋒遭受無妄之災,三人成虎謠言太可怕

      焦泊喬離隊并非家人被罵,杜鋒遭受無妄之災,三人成虎謠言太可怕

      硯底沉香
      2026-03-30 13:51:04
      48小時摧毀以裝甲營,人命代價給特朗普上課

      48小時摧毀以裝甲營,人命代價給特朗普上課

      你是我心中最美星空
      2026-03-30 12:37:54
      內塔尼亞胡:以色列已改變中東面貌,伊朗已不再是過去的伊朗!此前萬斯認為其對沖突預判“太樂觀”,以軍參謀長:常規(guī)部隊已“完全崩潰”

      內塔尼亞胡:以色列已改變中東面貌,伊朗已不再是過去的伊朗!此前萬斯認為其對沖突預判“太樂觀”,以軍參謀長:常規(guī)部隊已“完全崩潰”

      每日經(jīng)濟新聞
      2026-03-30 07:26:10
      騎士消息:字母哥有望加盟,名宿力挺哈登,戰(zhàn)爵士出場更新

      騎士消息:字母哥有望加盟,名宿力挺哈登,戰(zhàn)爵士出場更新

      冷月小風風
      2026-03-30 12:09:56
      78歲汪明荃回上海老家探親,帶羅家英給祖父母掃墓,順便踏青賞花

      78歲汪明荃回上海老家探親,帶羅家英給祖父母掃墓,順便踏青賞花

      阿傖說事
      2026-03-30 09:58:45
      滬深兩市成交額超1萬億元,較上一交易日此時放量1617億元

      滬深兩市成交額超1萬億元,較上一交易日此時放量1617億元

      每日經(jīng)濟新聞
      2026-03-30 10:37:12
      馬筱梅為玥兒箖箖推遲行程,過完臺灣兒童節(jié)再回京,看起來很疲憊

      馬筱梅為玥兒箖箖推遲行程,過完臺灣兒童節(jié)再回京,看起來很疲憊

      嫹筆牂牂
      2026-03-30 07:11:50
      辟謠辟謠!廣州供電局“瘋狂”辟謠!

      辟謠辟謠!廣州供電局“瘋狂”辟謠!

      新快報新聞
      2026-03-29 16:34:02
      西紅柿立大功!醫(yī)生研究發(fā)現(xiàn):老人吃西紅柿,或能緩解4種癥狀

      西紅柿立大功!醫(yī)生研究發(fā)現(xiàn):老人吃西紅柿,或能緩解4種癥狀

      醫(yī)學原創(chuàng)故事會
      2026-01-21 21:50:30
      蔡磊透露身體近況:四個人同時攙扶也無法邁步,感覺最對不起的就是妻子

      蔡磊透露身體近況:四個人同時攙扶也無法邁步,感覺最對不起的就是妻子

      極目新聞
      2026-03-29 22:40:10
      臺中市長盧秀燕發(fā)布聲明

      臺中市長盧秀燕發(fā)布聲明

      果媽聊娛樂
      2026-03-29 10:00:45
      同學聚會,班長讓我給遲到的鎮(zhèn)長讓座,下一秒,縣長向我道歉

      同學聚會,班長讓我給遲到的鎮(zhèn)長讓座,下一秒,縣長向我道歉

      農(nóng)村情感故事
      2026-03-23 07:31:39
      李榮浩手撕單依純!代言品牌天塌了!

      李榮浩手撕單依純!代言品牌天塌了!

      李東陽朋友圈
      2026-03-30 14:46:26
      對肝特別好的四大食物,輪流著吃,第三種你可能想不到

      對肝特別好的四大食物,輪流著吃,第三種你可能想不到

      距離距離
      2026-03-28 17:23:37
      李榮浩預判封神,單依純道歉果然甩鍋團隊!李榮浩再發(fā)四連問聲討

      李榮浩預判封神,單依純道歉果然甩鍋團隊!李榮浩再發(fā)四連問聲討

      露珠聊影視
      2026-03-29 17:57:06
      人不會無故得陰道癌!醫(yī)生直言:有陰道癌的女性,多半有3個習慣

      人不會無故得陰道癌!醫(yī)生直言:有陰道癌的女性,多半有3個習慣

      健康之光
      2026-02-11 14:14:41
      國家出手逮捕的3名華人首富,瘋狂斂財坑害百姓,每個都罪有應得

      國家出手逮捕的3名華人首富,瘋狂斂財坑害百姓,每個都罪有應得

      林輕吟
      2026-03-25 07:15:32
      特朗普私下問:2028,萬斯還是魯比奧?

      特朗普私下問:2028,萬斯還是魯比奧?

      觀察者網(wǎng)
      2026-03-30 11:25:25
      2026-03-30 15:15:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業(yè)的人工智能媒體
      12638文章數(shù) 142599關注度
      往期回顧 全部

      科技要聞

      DeepSeek性能異常問題已解決,服務恢復

      頭條要聞

      美國如果發(fā)動地面戰(zhàn) 本次戰(zhàn)事軍費或突破10萬億美元

      頭條要聞

      美國如果發(fā)動地面戰(zhàn) 本次戰(zhàn)事軍費或突破10萬億美元

      體育要聞

      想進世界杯,意大利還要過他這一關

      娛樂要聞

      單依純凌晨發(fā)長文道歉!李榮浩再回應

      財經(jīng)要聞

      油價沖擊,有些亞洲貨幣先扛不住了!

      汽車要聞

      理想i9要來了!外形似小號MEGA 能沖擊高端純電市場?

      態(tài)度原創(chuàng)

      教育
      健康
      家居
      數(shù)碼
      公開課

      教育要聞

      關注!西城市重點中學招聘教師啦

      干細胞抗衰4大誤區(qū),90%的人都中招

      家居要聞

      東方法式美學 現(xiàn)代簡約

      數(shù)碼要聞

      榮耀MagicBook 14/16 2026筆記本開啟新品預約

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版