<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      句子級(jí)溯源+生成式歸因,C2-Cite重塑大模型可信度

      0
      分享至



      在人工智能快速發(fā)展的今天,大語(yǔ)言模型已經(jīng)深入到我們工作和生活的方方面面。然而,如何讓AI生成的內(nèi)容更加可信、可追溯,一直是學(xué)術(shù)界和工業(yè)界關(guān)注的焦點(diǎn)問(wèn)題。想象一下,當(dāng)你向ChatGPT提問(wèn)時(shí),它不僅給出答案,還能像學(xué)術(shù)論文一樣標(biāo)注每句話的信息來(lái)源——這就是"溯源大語(yǔ)言模型"要解決的核心問(wèn)題。

      北郵百家AI團(tuán)隊(duì)聯(lián)合小米大模型團(tuán)隊(duì)提出的溯源大模型C2-Cite,首創(chuàng)上下文感知的歸因生成技術(shù),不僅能讓大模型在生成內(nèi)容時(shí)自動(dòng)標(biāo)注精準(zhǔn)的信息來(lái)源,更能確保生成內(nèi)容與引用的外部知識(shí)高度語(yǔ)義對(duì)齊,實(shí)現(xiàn)每一處表述都有溯源依據(jù)、與參考來(lái)源深度協(xié)同,從根本上解決大模型生成內(nèi)容的可信度問(wèn)題。該工作已被國(guó)際頂級(jí)會(huì)議WSDM 2026收錄。C2-Cite針對(duì)現(xiàn)有歸因模型存在的關(guān)鍵缺陷,通過(guò)引入"上下文感知"機(jī)制,讓引用標(biāo)記從被動(dòng)的占位符轉(zhuǎn)變?yōu)閹в猩舷挛恼Z(yǔ)義的特殊令牌,顯著提升了引用質(zhì)量和模型回答準(zhǔn)確性。



      • 論文標(biāo)題:

      C2-Cite:Contextual-Aware Citation Generation for Attributed Large Language Models

      • 論文鏈接:

      https://github.com/BAI-LAB/c2cite/blob/main/paper_wsdm_c2cite.pdf

      • 代碼倉(cāng)庫(kù):

      https://github.com/BAI-LAB/c2cite

      引言

      在信息爆炸的時(shí)代,大語(yǔ)言模型雖然能夠生成流暢的文本,但"幻覺(jué)"問(wèn)題(即生成虛假或不準(zhǔn)確的內(nèi)容)始終困擾著研究者。為了增強(qiáng)模型輸出的可信度,研究人員提出了歸因技術(shù)——在生成內(nèi)容中添加明確的引用標(biāo)記(如[1]、[2]),將每句話鏈接到具體的信息源。然而現(xiàn)有歸因模型存在顯著缺陷:

      1.技術(shù)路徑存在固有局限:上下文學(xué)習(xí)歸因(P-ICL/I-ICL)依賴提示工程或迭代檢索,耗時(shí)且泛化性弱;指令微調(diào)歸因過(guò)度依賴高質(zhì)量訓(xùn)練數(shù)據(jù),缺乏對(duì)引用上下文的主動(dòng)關(guān)聯(lián),大大削弱大模型的溯源能力;事后歸因(Post-Hoc)采用兩階段處理,難以精確到句子級(jí)別,缺乏內(nèi)在歸因能力。

      2.引用標(biāo)記淪為“通用占位符”:現(xiàn)有模型未賦予引用標(biāo)記(如 [i])上下文語(yǔ)義,僅將其視為無(wú)意義符號(hào),導(dǎo)致引用與所指內(nèi)容脫節(jié)、知識(shí)整合效果差;

      3.引用質(zhì)量與回答準(zhǔn)確性失衡:部分模型雖能提升引用精準(zhǔn)度,但會(huì)破壞回答的語(yǔ)義連貫性和正確性;另一部分模型則因引用混亂,難以支撐回答可信度;

      這些問(wèn)題導(dǎo)致現(xiàn)有模型要么引用錯(cuò)誤/ 虛構(gòu)、溯源失效,要么回答邏輯斷裂、準(zhǔn)確性下滑,難以同時(shí)滿足 “引用可信” 與 “回答有效” 的核心需求。

      C2-Cite溯源機(jī)制

      為解決上述缺陷,北郵百家AI團(tuán)隊(duì)聯(lián)合小米提出上下文感知的溯源大模型框架(C2-Cite),核心思路是通過(guò)“上下文語(yǔ)義融入” 讓引用標(biāo)記從被動(dòng)占位符轉(zhuǎn)變?yōu)閹в忻鞔_語(yǔ)義指向的主動(dòng)知識(shí)指針,具體包含三大關(guān)鍵組件:

      1.上下文感知嵌入機(jī)制(Contextual-Aware Embedding):將多令牌引用標(biāo)記(如“[i]”)標(biāo)準(zhǔn)化為單一引用符號(hào)令牌(如“?>”),并通過(guò)均值池化計(jì)算對(duì)應(yīng)檢索文檔的語(yǔ)義嵌入,替換傳統(tǒng)無(wú)意義占位符嵌入,使引用標(biāo)記攜帶所指文檔的語(yǔ)義信息;

      2.上下文引用對(duì)齊機(jī)制Contextual Citation Alignment:引入引用路由器(二進(jìn)制分類器)區(qū)分默認(rèn)令牌與引用令牌,分別優(yōu)化兩類令牌的損失函數(shù)—— 默認(rèn)令牌采用交叉熵?fù)p失保證回答流暢性,引用令牌通過(guò)語(yǔ)義相似度匹配實(shí)現(xiàn)與檢索文檔的精準(zhǔn)對(duì)齊;

      3.上下文注意力增強(qiáng)機(jī)制:通過(guò)距離衰減系數(shù)和注意力約束,放大后續(xù)生成令牌對(duì)先前引用令牌的關(guān)注度,維持引用與內(nèi)容的語(yǔ)義連貫性,避免因引用插入導(dǎo)致回答邏輯斷裂。

      模型最終損失函數(shù)為默認(rèn)損失、引用對(duì)齊損失、路由器損失與注意力增強(qiáng)損失的加權(quán)和,確保引用質(zhì)量與回答準(zhǔn)確性的協(xié)同優(yōu)化。



      實(shí)驗(yàn)

      研究團(tuán)隊(duì)在ALCE基準(zhǔn)測(cè)試的三個(gè)數(shù)據(jù)集(ASQA、ELI5、QAMPARI)上進(jìn)行了全面評(píng)估,對(duì)比了多種主流歸因方法

      3.1 主實(shí)驗(yàn)結(jié)果



      實(shí)驗(yàn)結(jié)果令人振奮:

      • 引用質(zhì)量大幅提升:C2-Cite++在引用F1分?jǐn)?shù)上平均提升5.8%
      • 回答準(zhǔn)確性顯著增強(qiáng):在回答正確性指標(biāo)上平均提升17.4%
      • 泛化能力強(qiáng):在不同質(zhì)量的訓(xùn)練數(shù)據(jù)(SynSciQA 系列)上均表現(xiàn)穩(wěn)定,即使使用普通訓(xùn)練數(shù)據(jù)也能超越依賴高質(zhì)量數(shù)據(jù)的傳統(tǒng)微調(diào)模型。

      3.2 效率分析

      在保證效果的同時(shí),C2-Cite++還展現(xiàn)出卓越的計(jì)算效率。吞吐量(每秒處理樣本數(shù))測(cè)試顯示,相比需要多輪迭代的方法(如Blueprint),C2-Cite++實(shí)現(xiàn)了最高的處理速度,在實(shí)際應(yīng)用中具有明顯優(yōu)勢(shì)。



      3.3溯源生成模型中注意力模式的轉(zhuǎn)變

      注意力熱力圖可視化,直觀展示了C2-Cite的工作機(jī)制。在原生LLM中,引用符號(hào)前后的句子幾乎沒(méi)有交互;而在C2-Cite中,后續(xù)句子對(duì)前文的注意力顯著增強(qiáng),形成了緊密的語(yǔ)義連接。這種"跨引用的語(yǔ)義橋梁"正是模型生成高質(zhì)量溯源內(nèi)容的關(guān)鍵。



      總結(jié)

      C2-Cite框架通過(guò)"上下文感知"這一核心理念,成功解決了現(xiàn)有歸因大語(yǔ)言模型的關(guān)鍵痛點(diǎn):

      • 從符號(hào)到語(yǔ)義:將引用標(biāo)記從被動(dòng)占位符轉(zhuǎn)化為主動(dòng)知識(shí)指針
      • 精準(zhǔn)對(duì)齊:通過(guò)路由機(jī)制確保引用編號(hào)與文檔內(nèi)容的準(zhǔn)確匹配
      • 語(yǔ)義連貫:利用注意力增強(qiáng)保持引用前后內(nèi)容的流暢性
      • 雙重優(yōu)化:同時(shí)提升引用質(zhì)量和回答準(zhǔn)確性,而非顧此失彼

      最后,僅僅優(yōu)化訓(xùn)練數(shù)據(jù)是不夠的,大模型的溯源能力需設(shè)計(jì)有效的學(xué)習(xí)機(jī)制。相比于復(fù)雜的數(shù)據(jù)合成流程,C2-Cite通過(guò)其"上下文感知"的設(shè)計(jì)思想,在內(nèi)容生成的過(guò)程依賴可靠的引用知識(shí)庫(kù),為構(gòu)建更加可靠、透明的AI溯源系統(tǒng)提供了重要的技術(shù)路徑。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      加盟騎士后表現(xiàn)依然沒(méi)有起色,后場(chǎng)大將今夏估計(jì)又要被送走了?

      加盟騎士后表現(xiàn)依然沒(méi)有起色,后場(chǎng)大將今夏估計(jì)又要被送走了?

      稻谷與小麥
      2026-03-12 23:15:04
      美國(guó)弗吉尼亞州發(fā)生校園槍擊事件 兩人受傷槍手被擊斃

      美國(guó)弗吉尼亞州發(fā)生校園槍擊事件 兩人受傷槍手被擊斃

      新華社
      2026-03-13 01:54:09
      癌的“源頭”已發(fā)現(xiàn)?咸菜沒(méi)上榜,第一名大家或許天天都在吃!

      癌的“源頭”已發(fā)現(xiàn)?咸菜沒(méi)上榜,第一名大家或許天天都在吃!

      健康之光
      2026-02-11 14:15:20
      昨晚跟閨蜜去洗澡,一脫衣服我才明白,女人和女人,真的不一樣

      昨晚跟閨蜜去洗澡,一脫衣服我才明白,女人和女人,真的不一樣

      i書與房
      2026-03-04 16:26:24
      神級(jí)交易!5連勝+三分46%,2億先生,真香啊,快船不虧

      神級(jí)交易!5連勝+三分46%,2億先生,真香啊,快船不虧

      球童無(wú)忌
      2026-03-12 22:08:06
      33歲周深藏得太深了!央媒突然發(fā)文宣布,原來(lái)他早已是“國(guó)字號(hào)”

      33歲周深藏得太深了!央媒突然發(fā)文宣布,原來(lái)他早已是“國(guó)字號(hào)”

      東方不敗然多多
      2026-03-10 07:35:06
      逃跑計(jì)劃泄漏,釋永信奢靡生活曝光,情婦私生子,你想都不敢想?

      逃跑計(jì)劃泄漏,釋永信奢靡生活曝光,情婦私生子,你想都不敢想?

      余們搞笑段子
      2026-03-13 01:57:13
      曼聯(lián)700萬(wàn)新援被遺忘,欲取代馬拉西亞!不住別墅只為遙望夢(mèng)劇場(chǎng)

      曼聯(lián)700萬(wàn)新援被遺忘,欲取代馬拉西亞!不住別墅只為遙望夢(mèng)劇場(chǎng)

      羅米的曼聯(lián)博客
      2026-03-12 11:56:05
      奇怪現(xiàn)象:越是狠心刪好友、斷聯(lián)系、不吃回頭草的人,意志越堅(jiān)定

      奇怪現(xiàn)象:越是狠心刪好友、斷聯(lián)系、不吃回頭草的人,意志越堅(jiān)定

      木言觀
      2026-03-12 21:09:08
      美媒:美國(guó)將永久關(guān)閉美國(guó)駐巴基斯坦白沙瓦總領(lǐng)館

      美媒:美國(guó)將永久關(guān)閉美國(guó)駐巴基斯坦白沙瓦總領(lǐng)館

      環(huán)球網(wǎng)資訊
      2026-03-12 14:58:19
      伊朗用血淚換來(lái)的教訓(xùn):一旦中美開(kāi)戰(zhàn),中國(guó)必須首先鎖定這一點(diǎn)

      伊朗用血淚換來(lái)的教訓(xùn):一旦中美開(kāi)戰(zhàn),中國(guó)必須首先鎖定這一點(diǎn)

      冷峻視角下的世界
      2026-02-20 07:45:35
      伊朗最高領(lǐng)袖說(shuō)只針對(duì)敵人基地進(jìn)行打擊

      伊朗最高領(lǐng)袖說(shuō)只針對(duì)敵人基地進(jìn)行打擊

      財(cái)聯(lián)社
      2026-03-12 21:29:18
      11年前,不顧一切娶了泰國(guó)"最美人妖"的北京男子,如今過(guò)得怎樣了

      11年前,不顧一切娶了泰國(guó)"最美人妖"的北京男子,如今過(guò)得怎樣了

      談史論天地
      2026-03-02 06:39:01
      中方回應(yīng)“特朗普訪華”

      中方回應(yīng)“特朗普訪華”

      澎湃新聞
      2026-03-12 16:59:04
      特拉維夫全面停電!美以聯(lián)軍的損失到底有多大?

      特拉維夫全面停電!美以聯(lián)軍的損失到底有多大?

      牲產(chǎn)隊(duì)
      2026-03-10 18:59:48
      以色列掐斷中東電網(wǎng),卻帶火了中國(guó)神器!深圳這幫搞電池的太牛了

      以色列掐斷中東電網(wǎng),卻帶火了中國(guó)神器!深圳這幫搞電池的太牛了

      樂(lè)天閑聊
      2026-03-09 21:52:00
      18歲巴薩天才撕碎十字韌帶魔咒,青訓(xùn)新王不止是布斯克茨接班人

      18歲巴薩天才撕碎十字韌帶魔咒,青訓(xùn)新王不止是布斯克茨接班人

      阿嚼影視評(píng)論
      2026-03-12 21:04:04
      四川一初中全校自帶鍋碗瓢盆春游,校長(zhǎng):學(xué)生自己搭灶炒菜,燒烤火鍋都有,家長(zhǎng)可以來(lái)指導(dǎo)但不能動(dòng)手

      四川一初中全校自帶鍋碗瓢盆春游,校長(zhǎng):學(xué)生自己搭灶炒菜,燒烤火鍋都有,家長(zhǎng)可以來(lái)指導(dǎo)但不能動(dòng)手

      極目新聞
      2026-03-12 19:14:44
      1966年,張正芬和蔣經(jīng)國(guó),一張罕見(jiàn)的合影,她是庾澄慶的媽媽

      1966年,張正芬和蔣經(jīng)國(guó),一張罕見(jiàn)的合影,她是庾澄慶的媽媽

      曉楖科普
      2026-03-11 16:27:59
      歐聯(lián)1-0,30歲英格蘭悍將一劍定乾坤,維拉勝法甲勁旅,占先機(jī)

      歐聯(lián)1-0,30歲英格蘭悍將一劍定乾坤,維拉勝法甲勁旅,占先機(jī)

      側(cè)身凌空斬
      2026-03-13 03:42:15
      2026-03-13 05:36:50
      機(jī)器之心Pro incentive-icons
      機(jī)器之心Pro
      專業(yè)的人工智能媒體
      12488文章數(shù) 142584關(guān)注度
      往期回顧 全部

      科技要聞

      當(dāng)養(yǎng)蝦人開(kāi)始卸載,大廠的戰(zhàn)爭(zhēng)才真正開(kāi)始

      頭條要聞

      伊朗:特朗普幾條推文結(jié)束不了戰(zhàn)爭(zhēng)

      頭條要聞

      伊朗:特朗普幾條推文結(jié)束不了戰(zhàn)爭(zhēng)

      體育要聞

      建議將“出球型門將”納入反詐app

      娛樂(lè)要聞

      貝克漢姆全家給27歲大布送生日祝福

      財(cái)經(jīng)要聞

      盧鋒:從特朗普?qǐng)F(tuán)隊(duì)群演看時(shí)代變局

      汽車要聞

      大眾2025財(cái)報(bào):轉(zhuǎn)型雖有陣痛 "大象"已然起跑

      態(tài)度原創(chuàng)

      手機(jī)
      房產(chǎn)
      親子
      家居
      旅游

      手機(jī)要聞

      榮耀600系列通過(guò)GCF認(rèn)證:確認(rèn)支持eSIM,國(guó)內(nèi)有望Q2季度發(fā)布!

      房產(chǎn)要聞

      唏噓!三亞又一房企巨頭破產(chǎn),狂欠43億甩賣資產(chǎn)!

      親子要聞

      認(rèn)養(yǎng)一頭牛旗下“哞星人”聯(lián)名“超級(jí)飛俠”,發(fā)布兒童純牛奶新品

      家居要聞

      觸感本真 家的跡象

      旅游要聞

      春假去哪玩?南京文旅向長(zhǎng)三角家庭發(fā)出“串門”邀約

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版