<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      Nature認定的論文綜述神器來了

      0
      分享至

      聞樂 發自 凹非寺
      量子位 | 公眾號 QbitAI

      AI寫論文這事兒確實不新鮮了,但天下苦假引用久矣。

      以往咱用大模型寫個綜述,看著像模像樣的,結果一查參考文獻——

      好家伙,論文不存在、期刊不存在、作者也不存在(扶額)。

      現在不用愁了,Nature新發表了一篇研究,艾倫人工智能研究所(Ai2)和華盛頓大學開源了一個叫OpenScholar的AI系統,寫文獻綜述絕不瞎編。



      背靠整整4500萬篇科學論文庫,直接把GPT-4o那種78%-90%的虛假引用率給干翻了。

      那么問題來了,大家都在編,OpenScholar為啥不編?

      自我反饋推理

      其實主要還是因為LLM的底層邏輯就是預測下一個詞出現的概率。

      當你問它一個非常生僻的學術問題時,它為了維持語言的連貫性以及“我無所不知”的人設——

      會強行根據語料庫里的作者名、期刊名、標題關鍵詞,拼湊出一個看起來最像真論文的…幻覺產物。

      還有,通用AI缺乏事實錨點,讀過萬卷書結果全記串了。

      張教授寫過超導,李教授寫過材料,當你問它超導材料時,它能面不改色地給你編出一篇《張教授與李教授關于超導材料的巔峰對話》……

      這種由于訓練數據截斷以及缺乏真實文獻驗證機制導致的假引用,真的太太太離譜了!



      OpenScholar就不一樣了,不再拍腦門預測下一個詞,直接接入了一個名為ScholarStore的龐大數據庫。

      這是目前公開的最大科學領域段落索引,全開源可下載,任何人都能本地部署或者擴展。

      里面實打實地存了4500萬篇論文的全文和摘要,再通過RAG技術,讓每個知識點都背靠一篇真實存在的論文。

      當你拋出一個科研難題,它會先在那個擁有2.37億個向量嵌入的超大數據庫里瘋狂檢索,把相關的論文片段全翻出來。

      給出初稿之后,帶著生成的“這里缺少討論”“這里引文不準”“需要補搜最新進展”等反饋再檢索、再改稿,通過搜索、生成、自我審查、再搜索、再修正這套閉環,反復確認輸出的內容是不是真有論文支撐。

      這樣一來顯著降低了幻覺,提高了輸出內容的覆蓋度和引文精度,整個管道還會被用來生成高質量合成數據,反哺訓練。



      有多強?

      但是!如果只是搜得準,那它充其量是個高級搜索引擎,OpenScholar不止如此。

      它在知識合成的深度上,已經開始正面硬剛人類專家了。

      研發團隊整了個叫Scholar QABench的測試集,涵蓋了計算機科學、物理、生物醫藥等最吃邏輯的領域,由3000個問題和250個長篇專家答案構成。

      在自動測評上,OpenScholar-8B這個體量不算大的模型,在正確性上GPT-4o高出5%,比專業的PaperQA2也高出7%,引文準確度和人類專家持平。



      團隊還搞了個“人機大戰”雙盲實驗,把AI寫的答案和實打實的博士、研究員寫的答案放一起,然后讓另一群頂級科學家來盲評打分。

      16位專家兩兩對比了108份學術答案。結果顯示,OpenScholar-8B的回答有51%比人類研究者親手寫的更好,升級組合版的OpenScholar-GPT4o勝率更是沖到70%,而普通GPT-4o只有32%。

      評審專家們普遍反饋,OpenScholar的優勢集中在信息覆蓋更全面、結構更清晰、邏輯連貫性更強,實用價值也更高。

      作者團隊

      這篇研究的一作Akari Asai是艾倫人工智能研究所研究科學家,2026年秋起將任卡內基梅隆大學助理教授。

      在此之前她獲得了東京大學電氣工程與計算機科學專業的學士學位,后在華盛頓大學完成博士學業,研究聚焦于自然語言處理和機器學習,尤其側重于大型語言模型。



      Jacqueline He目前在華盛頓大學讀自然語言處理專業博士,本科畢業于普林斯頓大學,曾是普林斯頓自然語言處理小組成員,主要導師是陳丹琦。

      讀研之前,她還擔任過Meta的軟件工程師。

      Rulin Shao本科畢業于西安交通大學,取得了數學的學士學位,后在卡內基梅隆大學完成了機器學習碩士學位,現為華盛頓大學博士生,同時也是Meta的訪問研究員。



      團隊的其他作者均來自伊利諾伊大學厄巴納 - 香檳分校、卡內基梅隆大學、Meta、北卡羅來納大學教堂山分校、斯坦福大學等高校和機構。

      論文地址:https://arxiv.org/abs/2411.14199

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      國家賬戶只剩217美元,從非洲糧倉到窮得吃老鼠,這波操作簡直絕了,這事怎么鬧的?

      國家賬戶只剩217美元,從非洲糧倉到窮得吃老鼠,這波操作簡直絕了,這事怎么鬧的?

      老杉說歷史
      2026-02-04 18:58:14
      百萬粉絲大V稱生活被助理“復制”:她在我家穿我的衣服拍照 打造“白富美”人設

      百萬粉絲大V稱生活被助理“復制”:她在我家穿我的衣服拍照 打造“白富美”人設

      紅星新聞
      2026-02-06 23:15:20
      首款舌下含服偉哥上市!15分鐘起效不傷血管,百億市場競爭升維

      首款舌下含服偉哥上市!15分鐘起效不傷血管,百億市場競爭升維

      思思夜話
      2026-02-07 11:37:44
      萬萬沒想到!原以為馬杜羅會在美國的監獄里把牢底坐穿,劇情突變

      萬萬沒想到!原以為馬杜羅會在美國的監獄里把牢底坐穿,劇情突變

      我心縱橫天地間
      2026-02-06 20:05:36
      004航母全力沖刺,4艘航母擺開,西太收入囊中,癱瘓美軍最后優勢

      004航母全力沖刺,4艘航母擺開,西太收入囊中,癱瘓美軍最后優勢

      東方點兵
      2026-02-06 18:45:02
      韓媒:SK海力士給每位員工發約30倍月薪的“年終獎”

      韓媒:SK海力士給每位員工發約30倍月薪的“年終獎”

      隨波蕩漾的漂流瓶
      2026-02-06 15:55:12
      一顆螺絲釘都不留給巴拿馬!港澳辦發出通牒,給其最后改錯的機會

      一顆螺絲釘都不留給巴拿馬!港澳辦發出通牒,給其最后改錯的機會

      來科點譜
      2026-02-07 09:43:11
      為救家人來中國踢球,8年賺走1.8億,如今返回巴西老家享受生活

      為救家人來中國踢球,8年賺走1.8億,如今返回巴西老家享受生活

      秋姐居
      2026-02-07 09:26:20
      扶弟魔又來了!河南一女子打6年工攢下14萬,被家人給弟弟買了A4

      扶弟魔又來了!河南一女子打6年工攢下14萬,被家人給弟弟買了A4

      火山詩話
      2026-02-06 11:43:31
      海南省委:堅決擁護黨中央決定

      海南省委:堅決擁護黨中央決定

      觀察者網
      2026-02-07 10:35:07
      特朗普起訴美兩部門索賠至少100億美元,美財長承認:若他勝訴,費用將由美民眾承擔

      特朗普起訴美兩部門索賠至少100億美元,美財長承認:若他勝訴,費用將由美民眾承擔

      環球網資訊
      2026-02-06 18:41:17
      最新民調結果出爐,老人與低學歷更支持賴清德,黃國昌向大陸攤牌

      最新民調結果出爐,老人與低學歷更支持賴清德,黃國昌向大陸攤牌

      野史日記
      2026-02-06 13:20:08
      肇事司機裝救人英雄后續:真容曝光,直播撈錢,還想申請見義勇為

      肇事司機裝救人英雄后續:真容曝光,直播撈錢,還想申請見義勇為

      奇思妙想草葉君
      2026-02-07 00:49:59
      太離譜!年會抽中手機變瓷磚后續,老板很憤怒,公司補發同款手機

      太離譜!年會抽中手機變瓷磚后續,老板很憤怒,公司補發同款手機

      火山詩話
      2026-02-07 10:13:39
      “書記,你一件沖鋒衣頂農民一年收成!”女選調生下鄉,卻被威脅

      “書記,你一件沖鋒衣頂農民一年收成!”女選調生下鄉,卻被威脅

      妍妍教育日記
      2026-02-04 18:29:23
      全場高呼王楚欽你最棒!世界第1輕松橫掃晉級 女球迷為他瘋狂吶喊

      全場高呼王楚欽你最棒!世界第1輕松橫掃晉級 女球迷為他瘋狂吶喊

      顏小白的籃球夢
      2026-02-07 13:00:16
      這是真的嗎?日本共同社:中國大陸多項對日出口稀土已批準

      這是真的嗎?日本共同社:中國大陸多項對日出口稀土已批準

      止戈軍是我
      2026-02-06 23:30:40
      離開了中國好幾天,斯塔默是越想越不對勁,在國會議會上罕見發飆

      離開了中國好幾天,斯塔默是越想越不對勁,在國會議會上罕見發飆

      墨蘭史書
      2026-02-06 20:25:03
      快船取得哈登被交易后首勝!小卡談連續30場20+分:只想贏比賽

      快船取得哈登被交易后首勝!小卡談連續30場20+分:只想贏比賽

      Emily說個球
      2026-02-07 14:44:24
      記者臥底揭秘黑茶營銷內幕:收身份證、屏蔽信號、話術圍攻,以賣茶為名拉人頭,領隊稱“每天來四五千人,30天排滿”

      記者臥底揭秘黑茶營銷內幕:收身份證、屏蔽信號、話術圍攻,以賣茶為名拉人頭,領隊稱“每天來四五千人,30天排滿”

      大風新聞
      2026-02-07 12:08:18
      2026-02-07 14:59:00
      量子位 incentive-icons
      量子位
      追蹤人工智能動態
      12128文章數 176373關注度
      往期回顧 全部

      科技要聞

      小米千匹馬力新車亮相!問界M6雙動力齊報

      頭條要聞

      發視頻影射奧巴馬夫婦 特朗普拒絕道歉還"甩鍋"

      頭條要聞

      發視頻影射奧巴馬夫婦 特朗普拒絕道歉還"甩鍋"

      體育要聞

      中國體育代表團亮相米蘭冬奧會開幕式

      娛樂要聞

      何超欣說和何猷君沒競爭,實力遭質疑

      財經要聞

      愛爾眼科董事長旗下7家精神病院騙保

      汽車要聞

      AITO問界與Abu Dhabi Motors達成戰略合作

      態度原創

      游戲
      本地
      時尚
      手機
      軍事航空

      羅云熙雙“五殺”!2026峽谷拜年秀圓滿收官

      本地新聞

      圍觀了北京第一屆黑色羽絨服大賽,我笑瘋了

      內娛長劇有救了!

      手機要聞

      華為Mate80 Pro Max更新鴻蒙OS 6.0.130 SP17:體驗后,真實感受

      軍事要聞

      重大轉變 特朗普簽令調整軍售排序

      無障礙瀏覽 進入關懷版