<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      別讓“反幻覺”殺死AI創造力,最新實證研究來了!

      0
      分享至

      大數據文摘受權轉載自學術頭條

      整理:瀟瀟

      大語言模型(LLM)普遍存在幻覺問題,即生成與客觀事實不符的內容。針對這一問題,已有多種抑制幻覺的技術被提出。

      在科研活動中,創造力是提出科學假設與構建科學構想的關鍵要素。隨著 LLM 日益深入科研輔助工作中,這種依賴非常規聯想的創造性思維在表現形式上往往與模型幻覺相似。

      然而,抑制幻覺的技術是否會削弱模型的創造力,業內仍缺乏系統性認知

      基于此,南洋理工大學研究團隊運用兩個創造力測評基準,對抑制幻覺方法與模型創造力之間的關系進行了研究,為科學應用場景中如何選擇合適的抑制幻覺技術提供了重要參考


      論文鏈接:https://arxiv.org/pdf/2512.11509

      他們選取了兩個創造力評測基準。

      • NeoCoder,通過逐步增加約束條件的編程任務來評估模型的創造力,其高度規則化的任務環境可類比于在固定自然規律約束下開展的科學實驗。

      • CS4,聚焦于開放式故事生成,更強調發散性聯想與想象能力,貼近科學假設生成所需的創造性思維過程。

      在兩個基準測試上,他們對三種抑制幻覺技術進行系統評估,包括:驗證鏈(CoVe)對比層解碼(DoLa)檢索增強生成(RAG)


      圖|實驗框架示意圖

      CoVe提升發散性創造力

      實驗結果顯示,CoVe 能顯著提升大模型的發散性創造力,也就是讓模型在思考問題時產生更多新穎、多樣的答案。

      在不同模型與基準上的實驗中,CoVe 整體表現穩定,尤其在某些小模型上提升更為明顯。

      這說明,CoVe 通過引入“驗證—質詢”式的解碼過程,引導模型探索更多潛在推理路徑,而不是沿著單一方向快速得出結論。

      CoVe 的效果不僅體現在性能指標上,也體現出類人的發散思維訓練的價值,通過持續發問與多方向思考,有助于打破思維定勢,刺激“頭腦風暴式”的創意思考


      圖|解碼方法對發散性創造力的影響(NeoCoder)

      RAG對發散性創造力影響有限

      另一邊,RAG 對模型的發散性創造力基本沒有實質影響。無論是在不同模型規模還是不同基準上,RAG 的結果都僅呈現出輕微且隨機的波動,整體圍繞基線上下浮動。

      但研究團隊也解釋了潛在可能,如果檢索系統能提供模型訓練之外的策略或新鮮知識,RAG 可能在創造性上發揮積極作用。例如,高質量檢索內容可幫助模型提升事實性判斷,這一能力與創造力趨同,同時還可能通過引入新視角來激發新思路,提高發散性創造力


      圖|解碼方法對發散創造力的影響(CS4)

      DoLa抑制發散性創造力

      與上述兩種技術相反,DoLa 會系統性降低模型的發散性創造力。在兩個基準上,基于 DoLa 的大多數模型的表現均略低于基線,這表明,創造力下降來自 DoLa 本身,而非模型結構差異。

      研究團隊推測,DoLa 削弱了負責創造力的層級結構。DoLa 的機制是通過將早期層預測從后期層預測中相減以提升事實性,如果早期層包含更多探索性與發散性特征,那么對其進行對比運算時,就可能抹除創造生成所需的信息。

      進一步實驗顯示,通過在解碼時增強與創造力相關的層級、抑制負相關層級,可以在不損害趨同創造力的前提下提升發散性創造力。這說明兩類創造力可能是可分離的,未來可針對性地提升發散性創造潛力。


      圖|通過增強與創造力正相關的層級并抑制與創造力負相關的層級來提升發散創造力

      限性

      當然,這項研究也存在一定的局限性。

      第一,創造力評估具有局限性。實驗只能間接衡量科學假設生成能力,并不等同真實科研中的創造力表現,所以結果的外推性有限。

      第二,CoVe 機制解釋不足。雖然 CoVe 能提升發散創造力,但沒做消融實驗,也沒有揭示具體機制,因此無法確定其發揮作用的因果路徑。

      第三,RAG 結論不夠穩固。關于 RAG 對創造力影響弱的解釋,缺乏對檢索質量和不同檢索策略的測量,因此結論需要更系統驗證。

      隨著 LLM 變得越來越聰明,釋放它們在科學發現方面的潛力變得越來越重要。展望未來,研究人員希望 LLM 不僅是被動的工具,更能成為科研工作中的積極協作者。

      GPU 訓練特惠!

      H100/H200 GPU算力按秒計費,平均節省開支30%以上!

      掃碼了解詳情?

      點「贊」的人都變好看了哦!

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      盧浮宮十年驚天騙局曝光!中國導游團伙內外勾結,損失超千萬歐元

      盧浮宮十年驚天騙局曝光!中國導游團伙內外勾結,損失超千萬歐元

      老馬拉車莫少裝
      2026-02-19 05:14:29
      27歲荷蘭女王破紀錄,拉鏈一拉全網爆,代言或超百萬美元?

      27歲荷蘭女王破紀錄,拉鏈一拉全網爆,代言或超百萬美元?

      老吳教育課堂
      2026-02-19 04:14:51
      前線嘴炮互不相讓,后方能源接連被炸,這場消耗戰早已沒有底線

      前線嘴炮互不相讓,后方能源接連被炸,這場消耗戰早已沒有底線

      軍聞新大門
      2026-02-19 16:47:15
      小球時代的王,盤點錯過庫里的3支球隊,尼克斯可惜,1隊錯過2次

      小球時代的王,盤點錯過庫里的3支球隊,尼克斯可惜,1隊錯過2次

      摸神drose
      2026-02-19 16:42:44
      大衣哥女兒回娘家,朱雪梅超200斤體重頂雞窩頭,帶10箱牛奶火腿

      大衣哥女兒回娘家,朱雪梅超200斤體重頂雞窩頭,帶10箱牛奶火腿

      瘋說時尚
      2026-02-19 09:32:15
      皇俄大佬直言:俄已無力全面升級,再打要動50萬動員與民眾存款

      皇俄大佬直言:俄已無力全面升級,再打要動50萬動員與民眾存款

      老馬拉車莫少裝
      2026-02-17 11:40:19
      三花智控,悶聲發財!

      三花智控,悶聲發財!

      投研邦V
      2026-02-17 20:13:49
      馬謖為何丟了街亭,輕視“當道扎營”,千年后塔山防守戰給出答案

      馬謖為何丟了街亭,輕視“當道扎營”,千年后塔山防守戰給出答案

      芊芊子吟
      2026-02-19 10:40:05
      越活越舒服的10個小習慣,請從今天開始養成!

      越活越舒服的10個小習慣,請從今天開始養成!

      明智家庭教育
      2026-02-14 11:07:51
      俄方向美方發出照會,未得到答復

      俄方向美方發出照會,未得到答復

      上觀新聞
      2026-02-19 17:59:07
      一級軍士長王忠心簡歷,他享受什么待遇?退休后婉拒百萬年薪

      一級軍士長王忠心簡歷,他享受什么待遇?退休后婉拒百萬年薪

      混沌錄
      2026-01-27 22:33:05
      美國男籃世界杯預選賽12人大名單:懷斯曼、布蘭登·奈特在列

      美國男籃世界杯預選賽12人大名單:懷斯曼、布蘭登·奈特在列

      林子說事
      2026-02-19 14:29:08
      乾隆對準噶爾的“滅族行動”,究竟給當時世界帶來多大沖擊波

      乾隆對準噶爾的“滅族行動”,究竟給當時世界帶來多大沖擊波

      會跳的加菲貓
      2026-02-07 13:35:17
      術后五年一切良好,醫生看著腫瘤標志物報告:馬上回來住院!

      術后五年一切良好,醫生看著腫瘤標志物報告:馬上回來住院!

      荷蘭豆愛健康
      2026-02-19 14:46:19
      2026年春晚語言類節目評分出爐,只有一個作品超過及格線

      2026年春晚語言類節目評分出爐,只有一個作品超過及格線

      那些故事有點遠
      2026-02-17 10:00:14
      山東一男子10歲時父親離世被親戚收留,長大后在除夕悄悄放禮品在親戚家門口“一事無成,沒臉見他們”

      山東一男子10歲時父親離世被親戚收留,長大后在除夕悄悄放禮品在親戚家門口“一事無成,沒臉見他們”

      大象新聞
      2026-02-19 11:48:13
      徐志勝回山東老家秒變社恐,家宴被圍觀啃饅頭挺尷尬,才開13萬車

      徐志勝回山東老家秒變社恐,家宴被圍觀啃饅頭挺尷尬,才開13萬車

      瘋說時尚
      2026-02-19 14:15:02
      寧波一男子除夕夜報警,稱開車時不小心撞到花壇和指示牌,結果因涉嫌危險駕駛罪被拘!

      寧波一男子除夕夜報警,稱開車時不小心撞到花壇和指示牌,結果因涉嫌危險駕駛罪被拘!

      環球網資訊
      2026-02-19 15:09:15
      放心吧,我們不是日本,也不會有“失去的三十年”

      放心吧,我們不是日本,也不會有“失去的三十年”

      六爺阿旦
      2026-01-19 17:10:26
      親戚很有錢是啥體驗?網友:果然窮人只想沾光,這就是人性!

      親戚很有錢是啥體驗?網友:果然窮人只想沾光,這就是人性!

      帶你感受人間冷暖
      2025-11-26 00:15:03
      2026-02-19 18:36:49
      大數據文摘 incentive-icons
      大數據文摘
      專注大數據,每日有分享!
      6825文章數 94529關注度
      往期回顧 全部

      科技要聞

      怒燒45億,騰訊字節阿里決戰春節

      頭條要聞

      2名初中生扶摔倒女子被交警定次責 摔倒女子索賠22萬

      頭條要聞

      2名初中生扶摔倒女子被交警定次責 摔倒女子索賠22萬

      體育要聞

      首金!蘇翊鳴唱國歌落淚 自信比1吶喊

      娛樂要聞

      明星過年百態!黃曉明等現身三亞

      財經要聞

      面條火腿香菇醬!上市公司這些年請你吃

      汽車要聞

      量產甲醇插混 吉利銀河星耀6甲醇插混版申報圖

      態度原創

      旅游
      數碼
      本地
      手機
      公開課

      旅游要聞

      《太平年》帶火臺州臨海 古城旅游按下加熱鍵|新春萬象錄

      數碼要聞

      內存價格崩了 國內最高降價20%:去華強北市場揭秘實情!

      本地新聞

      春花齊放2026:《駿馬奔騰迎新歲》

      手機要聞

      總臺春晚首次將華為Mate80 Pro Max接入廣播級系統 李小龍詳解

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版