<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      港大團隊開源7x24小時AI科學家,把人類時間還給創造力!

      0
      分享至

      假如你是一名科研工作者,面對浩瀚的文獻和復雜的實驗,你是否渴望擁有一個不知疲倦、知識淵博并且能夠全程協作的超級助手?這個愿景正由香港大學教授黃超團隊開發的 AI-Researcher 變為現實。

      實驗中,該團隊揭示了以下實驗效果:在技術實現上,以 Claude 為后端的 AI-Researcher 在 93.8%的情況下能夠成功產出可運行的代碼;在科學質量上,盡管 AI 論文平均分數略低,但是相當一部分已經可以和人類工作比肩。例如,根據 GPT-4o 評審,超過 78%的 AI 生成論文達到了可比水平。

      它既是一個工具,也是一個能夠自主完成從文獻調研、假設生成、算法實現到論文撰寫全流程的 AI 科學家。實驗表明,其所完成的學術成果在多個領域已經慢慢接近人類高質量研究水平。

      黃超告訴 DeepTech:“我們的愿景就是希望通過 AI-Researcher 大幅提升科研效率。比如以前我們一個月可能只能驗證一種算法思路,但有了 AI-Researcher 的輔助,我們一個月可以探索上百種不同的算法路徑,這種指數級的試錯速度將帶來科研突破的質的飛躍。”


      (來源:https://arxiv.org/abs/2505.18705)

      多智能體系統的科研助手

      AI-Researcher 的強大源于其多智能體協作框架。這套系統模擬了人類科研團隊的完整分工,將復雜任務進行了分解執行。

      系統首先會由知識獲取智能體啟動,它僅需用戶提供少量種子論文,便能自主檢索并篩選出最相關的高質量學術論文和代碼庫。

      隨后,資源分析智能體將扮演關鍵角色:其論文分析模塊通過 RAG 技術從論文中提取核心數學公式,代碼分析模塊則在倉庫中定位具體實現,借此建立理論與實踐的雙向映射,將抽象概念原子化。最終,規劃智能體整合分析結果,形成涵蓋數據、訓練、測試的詳細開發計劃。

      在扎實的知識地基上,創意生成器開始工作。它采用發散-收斂的模式,首先生成多個方向迥異的研究設想,然后基于科學性、新穎性和可行性篩選,形成結構完整的研究提案。

      核心突破體現在算法實現環節。AI-Researcher 摒棄了傳統AI變成一次性生成的脆弱模式,引入了類人迭代精煉范式。

      代碼智能體負責根據計劃進行初始實現,顧問智能體則像導師一樣審核代碼的正確性,并通過分析初步實驗結果提供修改建議。兩者形成多輪的實現-反饋-優化循環,顯著提高了復雜算法的實現成功率。

      接著,自動化文檔智能體采用三階段分層生成框架應對長文本一致性的挑戰:先根據模板生成論文大綱,再逐步填充內容并維護邏輯一致性,最后依據專業清單核查修訂報告中的內容及參考文獻,確保學術上的嚴謹性。


      (來源:https://arxiv.org/abs/2505.18705)

      科學評估與嚴格評測,能力邊界與意外發現

      為了客觀評價AI的科研能力,該團隊創建了 Scientist-Bench 基準,精選了涵蓋計算機視覺、圖機器學習等領域的22篇頂會論文作為評估標準。

      評估設置了兩層難度:Level-1 提供明確指令,測試 AI-Researcher 實現并執行既定科研想法的能力;Level-2 只給參考文獻,要求 AI-Researcher 自主發現新穎研究方向,挑戰性更高。

      評估框架極為嚴格:先由代碼評審智能體驗證技術實現,再進行科學貢獻評估,使用校準后的論文評審智能體,以雙盲方式比較AI論文與人類原稿。

      評審標準對標 ICLR 等頂會,從創新性、方法嚴謹性、實驗驗證三個維度打分。為了消除偏差,他們針對論文順序進行隨機交換,并匯集了多個頂尖大模型的獨立評審意見,形成了類似于評審委員會的集體決策。

      期間還有一個反直覺的發現是:在開放探索任務中,AI-Researcher 的表現普遍優于有明確指令的任務,其平均評分和可比比例均有著顯著提升。

      這表明,當前AI科研智能體在整合內部知識、自主發現方向等方面展現出獨特的優勢,過細的指令反而會限制它的創造性。這挑戰了 AI 僅擅長執行而非創造的舊有認知。

      實驗也指出了一定局限:在需要深厚專業背景的理論分析和前沿優化技術實,AI 依然顯得稚嫩;在需要多步驟的嚴密數學推導時,現有架構依然容易出錯;跨越多天的科研長流程也對記憶系統提出了挑戰。


      (來源:https://arxiv.org/abs/2505.18705)

      盡管如此,AI-Researcher 展示了一條通往增強科學發現的切實路徑。目前,該框架已在物理、化學、生物等領域得到廣泛應用。黃超表示,用戶普遍反饋 AI-Researcher 具備助力領域專家實現AI賦能的潛力。這一過程顯著降低了 AI 應用門檻,讓研究者無需具備深厚的計算機或編程背景,也能利用 AI 技術推動本學科的研究,實現跨領域的智能增強。

      參考資料:

      相關論文https://arxiv.org/abs/2505.18705

      開源系統https://github.com/HKUDS/AI-Researcher

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      史上最重私募罰單落地,瑞豐達被證監會連根拔起,還原爆雷始末

      史上最重私募罰單落地,瑞豐達被證監會連根拔起,還原爆雷始末

      財聯社
      2026-01-24 08:22:42
      周受資黃仁勛富豪聚會,穿衣竟全是“海淀老錢風”?越有錢越低調

      周受資黃仁勛富豪聚會,穿衣竟全是“海淀老錢風”?越有錢越低調

      商務范
      2026-01-23 15:32:40
      半場0板+全場1板!申京再被火蜜瘋狂炮轟:軟弱無能 空有2.11米

      半場0板+全場1板!申京再被火蜜瘋狂炮轟:軟弱無能 空有2.11米

      顏小白的籃球夢
      2026-01-24 10:59:14
      “高校保衛崗2800元月薪要求碩士學歷”,湖北大學回應:已招到人,系管理崗位實際工資不止2800元

      “高校保衛崗2800元月薪要求碩士學歷”,湖北大學回應:已招到人,系管理崗位實際工資不止2800元

      大風新聞
      2026-01-23 23:25:07
      戰日本隊,轉播計劃出爐!

      戰日本隊,轉播計劃出爐!

      新京報政事兒
      2026-01-23 20:51:25
      官方公示:谷愛凌將代表中國參加米蘭冬奧會!她去年收入1.6億元,99%來自賽場外,剛拿下世界杯個人第20冠

      官方公示:谷愛凌將代表中國參加米蘭冬奧會!她去年收入1.6億元,99%來自賽場外,剛拿下世界杯個人第20冠

      每日經濟新聞
      2026-01-23 18:30:08
      被遺棄女大學生患白血病全網尋親:請爸爸媽媽給我一次活下去的機會

      被遺棄女大學生患白血病全網尋親:請爸爸媽媽給我一次活下去的機會

      揚子晚報
      2026-01-23 22:30:38
      女單冠軍出爐!日本張本美和3:1奪冠,實現4連冠,與父親合影留念

      女單冠軍出爐!日本張本美和3:1奪冠,實現4連冠,與父親合影留念

      國乒二三事
      2026-01-24 08:36:35
      楊瀚森剛猛一節又垮!首節完美輔助,次節1分鐘被轟8-0,太被動了

      楊瀚森剛猛一節又垮!首節完美輔助,次節1分鐘被轟8-0,太被動了

      籃球資訊達人
      2026-01-24 12:19:13
      李嘉誠再開金口:未來十年,中國近一半家庭,將面臨6大難題?

      李嘉誠再開金口:未來十年,中國近一半家庭,將面臨6大難題?

      巢客HOME
      2026-01-24 08:15:03
      俄羅斯首次承認“莫斯科”號巡洋艦被烏軍擊沉,導致52名俄軍傷亡

      俄羅斯首次承認“莫斯科”號巡洋艦被烏軍擊沉,導致52名俄軍傷亡

      山河路口
      2026-01-23 18:55:47
      如此忽悠群眾有意思嗎?

      如此忽悠群眾有意思嗎?

      筆桿論道
      2026-01-23 06:33:00
      “糖霜蘋果”你信嗎?“斬殺線”牢A越來越離譜了

      “糖霜蘋果”你信嗎?“斬殺線”牢A越來越離譜了

      名人茍或
      2026-01-23 06:06:37
      殺豬宴變殺豬盤后續:惡人全員曝光,警方介入,地圖名字圖片全改

      殺豬宴變殺豬盤后續:惡人全員曝光,警方介入,地圖名字圖片全改

      甜檸聊史
      2026-01-23 16:54:07
      李亞鵬澄清做生意虧4000萬!并非如此,是被20年老兄弟害了

      李亞鵬澄清做生意虧4000萬!并非如此,是被20年老兄弟害了

      以茶帶書
      2026-01-23 14:58:15
      卡尼:加拿大不靠美國生存

      卡尼:加拿大不靠美國生存

      環球時報國際
      2026-01-24 10:01:27
      馬斯克瘋了?一夜炸出十萬億太空光伏新賽道

      馬斯克瘋了?一夜炸出十萬億太空光伏新賽道

      君臨財富
      2026-01-23 18:00:09
      【解局】國會例會開幕日解散眾議院,高市早苗的反常操作藏著何種算計?

      【解局】國會例會開幕日解散眾議院,高市早苗的反常操作藏著何種算計?

      環球網資訊
      2026-01-23 21:55:45
      中國公民盡快撤離!外交部、中使館再發提醒

      中國公民盡快撤離!外交部、中使館再發提醒

      上觀新聞
      2026-01-24 06:46:11
      高市早苗選擇“政治豪賭”,在野政黨痛批“沒有大義”,日本迎來“最匆忙”大選

      高市早苗選擇“政治豪賭”,在野政黨痛批“沒有大義”,日本迎來“最匆忙”大選

      環球網資訊
      2026-01-24 06:51:18
      2026-01-24 12:48:49
      DeepTech深科技 incentive-icons
      DeepTech深科技
      麻省理工科技評論獨家合作
      16169文章數 514531關注度
      往期回顧 全部

      科技要聞

      特斯拉Cybercrab即將落地 每公里不到1塊錢

      頭條要聞

      美國公布最新國防戰略 對"臺灣"只字未提

      頭條要聞

      美國公布最新國防戰略 對"臺灣"只字未提

      體育要聞

      當家球星打替補,他們在故意擺爛?

      娛樂要聞

      李微漪更新:狼王格林去世,3字淚目

      財經要聞

      “百年老字號”張小泉遭60億債務壓頂

      汽車要聞

      有增程和純電版可選 日產NX8或于3-4月間上市

      態度原創

      教育
      手機
      游戲
      公開課
      軍事航空

      教育要聞

      教育部:嚴控這類招生規模

      手機要聞

      vivo V70 Elite手機曝光:驍龍8s Gen 3芯片,6500mAh電池

      Mojang高管:玩《Hytale》還不如直接玩《我的世界》

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      俄美烏首次三方會談在阿聯酋舉行

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 欧美色图综合| 精品a片| 69精品在线观看| 国产思思99re99在线观看| 色综合久久网| 性久久久久久| 精品人妻伦九区久久AAA片| 性饥渴熟妇乱子伦HD| 日本三级香港三级人妇99| 97中文字幕在线观看| 久久婷婷久久一区二区三区| 桂平市| 亚洲免费网站观看视频 | 久久久久无码国产精品不卡| 中国A片乱子伦| 四虎国产精品永久在线国在线| 97久久精品人人澡人人爽| jjzzxxxx| 中文国产日韩欧美二视频| 丁香六月久久婷婷开心| 99视频精品全部免费 在线| 性做久久久久久久| 无码孕妇孕交在线观看| 国产精品啪| 未满十八18禁止免费无码网站| 贵定县| 特黄aaaaaaaaa毛片免费视频| 中文字幕一二三产区区别| 色欲久久久天天天综合网精品| 中文字幕A片无码免费看| 亚洲无码中文字| 亚洲天堂男人| 亚洲人人爱| 国产二区三区不卡免费| 免费视频成人片在线观看| 国产欧美精品一区aⅴ影院| 天堂αv亚洲αv日韩在线| 久久精品国产99久久6| 亚洲综合精品在线观看中文字幕| 日产精品久久久久久久蜜臀| 亚洲欧美偷国产日韩|