<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      別讓“反幻覺”殺死AI創(chuàng)造力,最新實(shí)證研究來了!

      0
      分享至

      大數(shù)據(jù)文摘受權(quán)轉(zhuǎn)載自學(xué)術(shù)頭條

      整理:瀟瀟

      大語言模型(LLM)普遍存在幻覺問題,即生成與客觀事實(shí)不符的內(nèi)容。針對(duì)這一問題,已有多種抑制幻覺的技術(shù)被提出。

      在科研活動(dòng)中,創(chuàng)造力是提出科學(xué)假設(shè)與構(gòu)建科學(xué)構(gòu)想的關(guān)鍵要素。隨著 LLM 日益深入科研輔助工作中,這種依賴非常規(guī)聯(lián)想的創(chuàng)造性思維在表現(xiàn)形式上往往與模型幻覺相似。

      然而,抑制幻覺的技術(shù)是否會(huì)削弱模型的創(chuàng)造力,業(yè)內(nèi)仍缺乏系統(tǒng)性認(rèn)知

      基于此,南洋理工大學(xué)研究團(tuán)隊(duì)運(yùn)用兩個(gè)創(chuàng)造力測(cè)評(píng)基準(zhǔn),對(duì)抑制幻覺方法與模型創(chuàng)造力之間的關(guān)系進(jìn)行了研究,為科學(xué)應(yīng)用場景中如何選擇合適的抑制幻覺技術(shù)提供了重要參考


      論文鏈接:https://arxiv.org/pdf/2512.11509

      他們選取了兩個(gè)創(chuàng)造力評(píng)測(cè)基準(zhǔn)。

      • NeoCoder,通過逐步增加約束條件的編程任務(wù)來評(píng)估模型的創(chuàng)造力,其高度規(guī)則化的任務(wù)環(huán)境可類比于在固定自然規(guī)律約束下開展的科學(xué)實(shí)驗(yàn)。

      • CS4,聚焦于開放式故事生成,更強(qiáng)調(diào)發(fā)散性聯(lián)想與想象能力,貼近科學(xué)假設(shè)生成所需的創(chuàng)造性思維過程。

      在兩個(gè)基準(zhǔn)測(cè)試上,他們對(duì)三種抑制幻覺技術(shù)進(jìn)行系統(tǒng)評(píng)估,包括:驗(yàn)證鏈(CoVe)對(duì)比層解碼(DoLa)檢索增強(qiáng)生成(RAG)


      圖|實(shí)驗(yàn)框架示意圖

      CoVe提升發(fā)散性創(chuàng)造力

      實(shí)驗(yàn)結(jié)果顯示,CoVe 能顯著提升大模型的發(fā)散性創(chuàng)造力,也就是讓模型在思考問題時(shí)產(chǎn)生更多新穎、多樣的答案。

      在不同模型與基準(zhǔn)上的實(shí)驗(yàn)中,CoVe 整體表現(xiàn)穩(wěn)定,尤其在某些小模型上提升更為明顯。

      這說明,CoVe 通過引入“驗(yàn)證—質(zhì)詢”式的解碼過程,引導(dǎo)模型探索更多潛在推理路徑,而不是沿著單一方向快速得出結(jié)論。

      CoVe 的效果不僅體現(xiàn)在性能指標(biāo)上,也體現(xiàn)出類人的發(fā)散思維訓(xùn)練的價(jià)值,通過持續(xù)發(fā)問與多方向思考,有助于打破思維定勢(shì),刺激“頭腦風(fēng)暴式”的創(chuàng)意思考


      圖|解碼方法對(duì)發(fā)散性創(chuàng)造力的影響(NeoCoder)

      RAG對(duì)發(fā)散性創(chuàng)造力影響有限

      另一邊,RAG 對(duì)模型的發(fā)散性創(chuàng)造力基本沒有實(shí)質(zhì)影響。無論是在不同模型規(guī)模還是不同基準(zhǔn)上,RAG 的結(jié)果都僅呈現(xiàn)出輕微且隨機(jī)的波動(dòng),整體圍繞基線上下浮動(dòng)。

      但研究團(tuán)隊(duì)也解釋了潛在可能,如果檢索系統(tǒng)能提供模型訓(xùn)練之外的策略或新鮮知識(shí),RAG 可能在創(chuàng)造性上發(fā)揮積極作用。例如,高質(zhì)量檢索內(nèi)容可幫助模型提升事實(shí)性判斷,這一能力與創(chuàng)造力趨同,同時(shí)還可能通過引入新視角來激發(fā)新思路,提高發(fā)散性創(chuàng)造力


      圖|解碼方法對(duì)發(fā)散創(chuàng)造力的影響(CS4)

      DoLa抑制發(fā)散性創(chuàng)造力

      與上述兩種技術(shù)相反,DoLa 會(huì)系統(tǒng)性降低模型的發(fā)散性創(chuàng)造力。在兩個(gè)基準(zhǔn)上,基于 DoLa 的大多數(shù)模型的表現(xiàn)均略低于基線,這表明,創(chuàng)造力下降來自 DoLa 本身,而非模型結(jié)構(gòu)差異。

      研究團(tuán)隊(duì)推測(cè),DoLa 削弱了負(fù)責(zé)創(chuàng)造力的層級(jí)結(jié)構(gòu)。DoLa 的機(jī)制是通過將早期層預(yù)測(cè)從后期層預(yù)測(cè)中相減以提升事實(shí)性,如果早期層包含更多探索性與發(fā)散性特征,那么對(duì)其進(jìn)行對(duì)比運(yùn)算時(shí),就可能抹除創(chuàng)造生成所需的信息。

      進(jìn)一步實(shí)驗(yàn)顯示,通過在解碼時(shí)增強(qiáng)與創(chuàng)造力相關(guān)的層級(jí)、抑制負(fù)相關(guān)層級(jí),可以在不損害趨同創(chuàng)造力的前提下提升發(fā)散性創(chuàng)造力。這說明兩類創(chuàng)造力可能是可分離的,未來可針對(duì)性地提升發(fā)散性創(chuàng)造潛力。


      圖|通過增強(qiáng)與創(chuàng)造力正相關(guān)的層級(jí)并抑制與創(chuàng)造力負(fù)相關(guān)的層級(jí)來提升發(fā)散創(chuàng)造力

      限性

      當(dāng)然,這項(xiàng)研究也存在一定的局限性。

      第一,創(chuàng)造力評(píng)估具有局限性。實(shí)驗(yàn)只能間接衡量科學(xué)假設(shè)生成能力,并不等同真實(shí)科研中的創(chuàng)造力表現(xiàn),所以結(jié)果的外推性有限。

      第二,CoVe 機(jī)制解釋不足。雖然 CoVe 能提升發(fā)散創(chuàng)造力,但沒做消融實(shí)驗(yàn),也沒有揭示具體機(jī)制,因此無法確定其發(fā)揮作用的因果路徑。

      第三,RAG 結(jié)論不夠穩(wěn)固。關(guān)于 RAG 對(duì)創(chuàng)造力影響弱的解釋,缺乏對(duì)檢索質(zhì)量和不同檢索策略的測(cè)量,因此結(jié)論需要更系統(tǒng)驗(yàn)證。

      隨著 LLM 變得越來越聰明,釋放它們?cè)诳茖W(xué)發(fā)現(xiàn)方面的潛力變得越來越重要。展望未來,研究人員希望 LLM 不僅是被動(dòng)的工具,更能成為科研工作中的積極協(xié)作者。

      GPU 訓(xùn)練特惠!

      H100/H200 GPU算力按秒計(jì)費(fèi),平均節(jié)省開支30%以上!

      掃碼了解詳情?

      點(diǎn)「贊」的人都變好看了哦!

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      A股:信號(hào)很強(qiáng)烈,請(qǐng)做好準(zhǔn)備,明天周一,很可能將迎來更大的轉(zhuǎn)變

      A股:信號(hào)很強(qiáng)烈,請(qǐng)做好準(zhǔn)備,明天周一,很可能將迎來更大的轉(zhuǎn)變

      虎哥閑聊
      2026-04-26 09:25:03
      善惡終有報(bào),57歲央視女主持王小丫,原來早已經(jīng)走上另一條大路

      善惡終有報(bào),57歲央視女主持王小丫,原來早已經(jīng)走上另一條大路

      聽風(fēng)喃
      2026-03-24 05:39:34
      正式簽約!加盟雄鹿!字母哥被孤立

      正式簽約!加盟雄鹿!字母哥被孤立

      籃球教學(xué)論壇
      2026-04-25 16:29:48
      中國需做最壞打算:俄羅斯解體后617萬土地絕不能失守

      中國需做最壞打算:俄羅斯解體后617萬土地絕不能失守

      王藁侃世界
      2026-04-23 07:05:34
      迪文華子傷退多孫穆狂砍43分 森林狼3勝掘金拿到賽點(diǎn)

      迪文華子傷退多孫穆狂砍43分 森林狼3勝掘金拿到賽點(diǎn)

      仰臥撐FTUer
      2026-04-26 12:31:11
      李啟言父親病逝,日夜照顧癱瘓兒子病倒,曾拒絕李澤楷千萬救濟(jì)金

      李啟言父親病逝,日夜照顧癱瘓兒子病倒,曾拒絕李澤楷千萬救濟(jì)金

      開開森森
      2026-04-25 18:07:45
      談不攏就打!商務(wù)部下達(dá)第20號(hào)令, 對(duì)歐封鎖開始, 馮德萊恩故作鎮(zhèn)

      談不攏就打!商務(wù)部下達(dá)第20號(hào)令, 對(duì)歐封鎖開始, 馮德萊恩故作鎮(zhèn)

      小正說娛樂
      2026-04-26 11:18:22
      2026年,如果你的家庭存款突破100萬,會(huì)發(fā)現(xiàn)一個(gè)驚人的真相!

      2026年,如果你的家庭存款突破100萬,會(huì)發(fā)現(xiàn)一個(gè)驚人的真相!

      藍(lán)色海邊
      2026-04-24 17:11:02
      外媒:中東美軍基地遭襲損失遠(yuǎn)超五角大樓承認(rèn)

      外媒:中東美軍基地遭襲損失遠(yuǎn)超五角大樓承認(rèn)

      參考消息
      2026-04-26 13:18:23
      56歲健康母親赴瑞士安樂死:兒子已走4年,我只想體面離開

      56歲健康母親赴瑞士安樂死:兒子已走4年,我只想體面離開

      胡一舸南游y
      2026-04-25 16:22:22
      正式測(cè)定:蒙古發(fā)生6.0級(jí)地震 震源深度15千米

      正式測(cè)定:蒙古發(fā)生6.0級(jí)地震 震源深度15千米

      每日經(jīng)濟(jì)新聞
      2026-04-26 13:00:05
      外媒:中資工廠正將996加班文化傳入歐洲,擠壓當(dāng)?shù)卣>蜆I(yè)崗位

      外媒:中資工廠正將996加班文化傳入歐洲,擠壓當(dāng)?shù)卣>蜆I(yè)崗位

      凡人學(xué)電腦
      2026-04-25 23:23:58
      無視禁令,首艘中資油船出港,伊軍100萬人到位,特朗普踩下剎車

      無視禁令,首艘中資油船出港,伊軍100萬人到位,特朗普踩下剎車

      大熊歡樂坊
      2026-04-26 13:07:47
      TVB老戲骨忍無可忍含淚揭家丑,每月接濟(jì)兒子五萬,走了向太老路

      TVB老戲骨忍無可忍含淚揭家丑,每月接濟(jì)兒子五萬,走了向太老路

      翰飛觀事
      2026-04-22 19:35:28
      連續(xù)三天嫖娼一次嫖倆,花800元?dú)У粢皇峙窈门疲麍D什么?

      連續(xù)三天嫖娼一次嫖倆,花800元?dú)У粢皇峙窈门疲麍D什么?

      一窺究竟
      2026-04-26 00:52:15
      獨(dú)生子女家庭注意!5月集中辦理窗口開啟,3筆現(xiàn)金補(bǔ)助別忘申請(qǐng)

      獨(dú)生子女家庭注意!5月集中辦理窗口開啟,3筆現(xiàn)金補(bǔ)助別忘申請(qǐng)

      復(fù)轉(zhuǎn)這些年
      2026-04-25 18:51:48
      果然不出中國所料!特朗普慫了,伊朗宣布贏家,美要付出更高代價(jià)

      果然不出中國所料!特朗普慫了,伊朗宣布贏家,美要付出更高代價(jià)

      軒逸阿II
      2026-04-26 00:31:22
      1995年,在香港高檔餐廳里,34歲的洪晃與63歲的父親洪君彥的合影

      1995年,在香港高檔餐廳里,34歲的洪晃與63歲的父親洪君彥的合影

      娛樂洞察點(diǎn)點(diǎn)
      2026-04-25 21:55:38
      瘋爽的債主破產(chǎn)了!456和隊(duì)友搶富二代!

      瘋爽的債主破產(chǎn)了!456和隊(duì)友搶富二代!

      八卦瘋叔
      2026-04-26 11:12:01
      杜蘭特G4出戰(zhàn)成疑!烏度卡透露踝傷好轉(zhuǎn):我原以為他可以打G3

      杜蘭特G4出戰(zhàn)成疑!烏度卡透露踝傷好轉(zhuǎn):我原以為他可以打G3

      羅說NBA
      2026-04-26 04:19:21
      2026-04-26 13:52:49
      大數(shù)據(jù)文摘 incentive-icons
      大數(shù)據(jù)文摘
      專注大數(shù)據(jù),每日有分享!
      6853文章數(shù) 94542關(guān)注度
      往期回顧 全部

      科技要聞

      漲價(jià)浪潮下,DeepSeek推動(dòng)AI“價(jià)格戰(zhàn)”

      頭條要聞

      白宮槍手系教師兼游戲開發(fā)者 曾向哈里斯總統(tǒng)競選捐款

      頭條要聞

      白宮槍手系教師兼游戲開發(fā)者 曾向哈里斯總統(tǒng)競選捐款

      體育要聞

      那一刻開始,兩支球隊(duì)的命運(yùn)悄然改變了

      娛樂要聞

      《八千里路云和月》大結(jié)局意難平

      財(cái)經(jīng)要聞

      DeepSeek V4背后,梁文鋒的轉(zhuǎn)身

      汽車要聞

      預(yù)售19.38萬元起 哈弗猛龍PLUS七座版亮相

      態(tài)度原創(chuàng)

      時(shí)尚
      游戲
      家居
      親子
      本地

      IU的臉,真的有自己的時(shí)間線

      《光與影:33號(hào)遠(yuǎn)征隊(duì)》迎來發(fā)售一周年紀(jì)念

      家居要聞

      自然肌理 溫潤美學(xué)

      親子要聞

      媽媽記錄下寶寶的第一次擁抱,最幸福的瞬間

      本地新聞

      云游中國|逛世界風(fēng)箏都 留學(xué)生探秘中國傳統(tǒng)文化

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 久久久久久久久久8888| 特黄特色大片免费播放器999| 综合网激情五月| 通榆县| 亚洲欧美天堂| 精品国模无码| 日本亚洲色大成网站www久久| 伊人久久精品| 极品尤物一区二区三区| 麻豆国产成人AV在线播放| 亚洲 日韩 在线精品| 狠狠躁夜夜躁人人爽天天古典| 最新精品露脸国产在线| 最新国产在线拍揄自揄视频| 亚洲成av人片天堂网无码| 成人三级一区二区成人| 久久久久国产精品人妻| 91视频免费观看网站| 国产va在线观看免费| 色天使AV| 亚洲第一成人久久网站| 国产成人a在线观看视频| 三原县| 少妇爆乳无码专区| 四虎永久免费高清视频| 久久综合亚洲色hezyo社区| 少妇高潮喷水久久久久久久久久 | 久久人人97超碰人人澡爱香蕉| 国产亚洲精品自在久久vr| 国产精品久久久久孕妇| 亚洲中文字幕无码爆乳av| 丰满人妻熟妇乱又伦精品视| 历史| 92久久精品一区二区| 绥德县| 国产精品美女乱子伦高| 免费av网站| 久久成人影院精品777| 88XV日韩| 人妻?第一页| 91网站免费|