<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      AdaMCoT:讓大模型學(xué)會「看題下菜碟」,動態(tài)選擇最佳思考語言

      0
      分享至



      多語言大模型(MLLM)在面對多語言任務(wù)時,往往面臨一個選擇難題:是用原來的語言直接回答,還是翻譯成高資源語言去推理?

      實際上,不同的語言在模型內(nèi)部承載著不同的「特長」。比如英語可能邏輯性強,適合科學(xué)推理;而中文或印尼語在處理特定文化背景或押韻任務(wù)時,可能比英語更具優(yōu)勢。

      如何讓模型在面對不同任務(wù)時,自動選擇一條「最順手」的推理路徑?來自新加坡科技研究局(A*STAR)Nancy F. Chen 和 Ai Ti Aw 帶領(lǐng)的研究團(tuán)隊,攜手新加坡科技設(shè)計大學(xué)(SUTD)Roy Ka-Wei Lee 教授團(tuán)隊共同推出了AdaMCoT(Adaptive Multilingual Chain-of-Thought)框架。AdaMCoT 的核心在于把 「用哪種語言思考」本身當(dāng)成一個可優(yōu)化的決策變量:通過自適應(yīng)地在多種語言間路由并組合鏈?zhǔn)剿伎?,再將推理結(jié)果映射回目標(biāo)語言,從而顯著提升跨語言的事實推理準(zhǔn)確性與一致性。該工作已被 AAAI 2026 主軌道接收為 Oral 論文。



      • 論文標(biāo)題: AdaMCoT: Rethinking Cross-Lingual Factual Reasoning through Adaptive Multilingual Chain-of-Thought
      • 論文鏈接: https://arxiv.org/abs/2501.16154
      • 作者單位: 新加坡 A*STAR Institute for Infocomm Research(I2R)、新加坡科技設(shè)計大學(xué)(SUTD)

      研究背景與痛點

      現(xiàn)有的跨語言推理方法通常存在「路徑依賴」:要么不做處理直接推理,容易導(dǎo)致低資源語言的幻覺;要么強制全部轉(zhuǎn)換成英語推理,這在處理需要保留原語言文化韻味或特定語義的任務(wù)(如寫詩、雙關(guān)語)時,往往會弄巧成拙。

      核心問題在于:沒有一種單一的語言適合所有的任務(wù)。

      為了解決這一問題,研究團(tuán)隊提出了AdaMCoT框架。與其強制模型「說英語」,不如賦予模型一種自適應(yīng)的元認(rèn)知能力。AdaMCoT 能夠根據(jù)輸入問題的特性(是邏輯題、文化題還是常識題),動態(tài)地從候選語言池(Thinking Languages)中「路由」出一條最佳的思維路徑。



      方法與創(chuàng)新:讓模型「換種語言思考」


      AdaMCoT 并不是「先翻譯再回答」,而是引入了一個自適應(yīng)路由機制(Adaptive Routing):模型會根據(jù)問題特性,選擇是直接用目標(biāo)語言推理,還是先在英語、中文等「思考語言」中展開鏈?zhǔn)剿伎?,再回到目?biāo)語言給出答案。



      1. 雙路徑推理機制

      AdaMCoT 設(shè)計了兩條主要的推理路徑:

      • 跨語言思維鏈(Cross-Lingual CoT):對于與提示語言不適配的任務(wù),模型將綜合考慮主題一致性、語言知識豐富程度等因素,選取一個合適的 “思考語言”。例如面對使用馬來文提問的數(shù)學(xué)題,模型可以選擇英文或者中文作為思考語言,利用這些語言豐富的邏輯和知識儲備完成推理步驟,最后將結(jié)果整合回目標(biāo)語言。
      • 直接生成(Direct Generation):對于模型本身擅長的語言或特定任務(wù)(如寫詩、押韻),直接在源語言上進(jìn)行分析且生成答案,避免跨語言帶來的語義損耗。

      2. 基于獎勵的自適應(yīng)路由

      為了讓模型「知道」何時該用哪種語言思考,研究團(tuán)隊引入了一個基于獎勵的微調(diào)機制。利用 GPT-4o 作為獎勵模型(Reward Model),從事實正確性、連貫性和指令遵循度等維度對不同推理路徑生成的答案進(jìn)行打分。

      在訓(xùn)練階段,模型只學(xué)習(xí)那些得高分(分?jǐn)?shù) ≥ 9)的推理路徑。這種「優(yōu)勝劣汰」的機制使得 AdaMCoT 能夠根據(jù)問題類型自動切換策略。例如,處理科學(xué)問題時可能傾向于用英語思考,而處理具有文化特色的問題時則可能保留原語言。

      實驗結(jié)果:全面超越傳統(tǒng)方法


      研究團(tuán)隊在mTruthfulQA、CrossAlpaca-Eval 2.0、Cross-MMLU 和 Cross-LogiQA等多個多語言基準(zhǔn)上評估了 AdaMCoT,涵蓋了 LLaMA 3.1 和 Qwen 2.5 等主流開源模型。



      1. 事實推理能力顯著提升

      在 mTruthfulQA 數(shù)據(jù)集上,LLaMA3.1-8B-AdaMCoT 在 32 種語言中的 31 種上都取得了性能提升。

      • 對于中文,準(zhǔn)確率相對原模型提升9.0%;
      • 對于低資源語言如印度尼西亞語,相對提升高達(dá)12.7%;
      • 在匈牙利語、葡萄牙語和孟加拉語等語言上,更是實現(xiàn)了超過10%的絕對提升。

      相比之下,傳統(tǒng)的 Prompt 工程方法(如 AutoCAP)和翻譯對齊方法在低資源語言上往往表現(xiàn)不佳,甚至出現(xiàn)倒退。

      2. 跨語言一致性增強

      實驗表明,AdaMCoT 不僅提高了回答的準(zhǔn)確率,還顯著增強了跨語言的一致性。這意味著無論用戶用哪種語言提問,模型都能調(diào)用其內(nèi)部最一致的知識庫來回答,減少了「見人說人話,見鬼說鬼話」的幻覺現(xiàn)象 。



      在 mTruthfulQA 數(shù)據(jù)集上的推理路徑選擇分布。大部分情況下,模型優(yōu)先選擇高資源語言(尤其是英語和中文)作為中間推理語種,從而顯著降低錯誤率;其他語種約占 10%,主要用于提升特殊類別問題的回答準(zhǔn)確性。

      深度解讀:為什么「換語言思考」有效?


      為了揭示 AdaMCoT 的生效機理,研究團(tuán)隊利用Logit Lens和UMAP技術(shù)對模型的內(nèi)部狀態(tài)進(jìn)行了可視化分析。



      1. Logit Lens:透視模型的思考過程

      通過 Logit Lens 分析發(fā)現(xiàn),當(dāng)模型直接用低資源語言回答復(fù)雜問題時,中間層的預(yù)測往往充滿噪聲和幻覺。而當(dāng) AdaMCoT 引導(dǎo)模型先用英語「思考」時,模型在早期層級就能鎖定正確的事實路徑,最終生成的答案更加自信且準(zhǔn)確。



      2. UMAP:語義空間的對齊

      UMAP 可視化顯示,AdaMCoT 成功拉近了不同語言在語義空間中的距離。經(jīng)過微調(diào)后,非英語語言的嵌入向量(Embeddings)顯著向英語中心靠攏。同時并沒有破壞原有的語義結(jié)構(gòu),而是在保持整體分布的前提下,讓多語言在同一空間中更加對齊。 這表明 AdaMCoT 促進(jìn)了多語言知識在語義層面的深層融合,而非簡單的表面翻譯。

      總結(jié)


      AdaMCoT 提出了一種全新的多語言推理范式:不改變模型參數(shù)規(guī)模,不依賴海量多語言預(yù)訓(xùn)練數(shù)據(jù),僅通過「學(xué)會如何選擇思考語言」,就能顯著釋放大模型的跨語言潛能。

      這項工作不僅為提升低資源語言的 AI 性能提供了低成本的高效方案,也為理解大模型的跨語言對齊機制提供了新的視角。隨著 AI 全球化的推進(jìn),AdaMCoT 有望成為打破語言隔閡、實現(xiàn)「AI 普惠」的關(guān)鍵技術(shù)之一。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      被央視怒批、洋相百出、腹中空空,這幾位“絕望的文盲”憑啥能火

      被央視怒批、洋相百出、腹中空空,這幾位“絕望的文盲”憑啥能火

      娛說瑜悅
      2025-12-13 12:24:22
      就在剛剛,莫迪做出一個前所未有重大決定,事關(guān)中國

      就在剛剛,莫迪做出一個前所未有重大決定,事關(guān)中國

      忠于法紀(jì)
      2025-12-14 17:23:21
      浙江省稅務(wù)局原黨委書記、副局長龍岳輝,主動投案

      浙江省稅務(wù)局原黨委書記、副局長龍岳輝,主動投案

      觀察者網(wǎng)
      2025-12-15 13:59:13
      賺大陸錢捐給“臺獨”的集團(tuán):民進(jìn)黨的頭號金主,終于被殺雞儆猴

      賺大陸錢捐給“臺獨”的集團(tuán):民進(jìn)黨的頭號金主,終于被殺雞儆猴

      知鑒明史
      2025-12-15 19:08:28
      60歲以后打斷筋都不要做的14件事,做三件就糊涂到家了,馬上收藏

      60歲以后打斷筋都不要做的14件事,做三件就糊涂到家了,馬上收藏

      情感大使館
      2025-12-01 10:40:53
      48小時已過,中國戰(zhàn)區(qū)亮刀,對日稱呼有變化,高市被日本民眾唾棄

      48小時已過,中國戰(zhàn)區(qū)亮刀,對日稱呼有變化,高市被日本民眾唾棄

      比利
      2025-12-15 06:48:52
      2003年,陳賡之子升官之際接到威脅電話:想升官先拿200萬疏通費

      2003年,陳賡之子升官之際接到威脅電話:想升官先拿200萬疏通費

      紀(jì)實文錄
      2025-05-08 16:55:52
      女兒失蹤3年,竟托夢說在鄰居家魚缸里,警察趕到后當(dāng)場愣了

      女兒失蹤3年,竟托夢說在鄰居家魚缸里,警察趕到后當(dāng)場愣了

      罪案洞察者
      2025-09-16 14:31:27
      平頂山28歲女老師婚禮前墜亡!絕筆信戳穿死因,遺體晾曬無人管!

      平頂山28歲女老師婚禮前墜亡!絕筆信戳穿死因,遺體晾曬無人管!

      天天熱點見聞
      2025-12-14 08:19:11
      1951年,戴笠獨子被處決,蔣介石兩年后下令:他的子孫全接回臺灣

      1951年,戴笠獨子被處決,蔣介石兩年后下令:他的子孫全接回臺灣

      古書記史
      2025-12-11 17:37:45
      最后的瘋狂:許家印被抓捕的全部過程

      最后的瘋狂:許家印被抓捕的全部過程

      月光作箋a
      2025-12-09 08:38:58
      狂降8℃,大反轉(zhuǎn)要來了:雨夾雪、8級大風(fēng)

      狂降8℃,大反轉(zhuǎn)要來了:雨夾雪、8級大風(fēng)

      極目新聞
      2025-12-15 16:49:39
      深度揭秘?|?職務(wù)犯罪中,你的手機真的被監(jiān)聽了嗎?揭秘監(jiān)委技術(shù)調(diào)查真相!

      深度揭秘?|?職務(wù)犯罪中,你的手機真的被監(jiān)聽了嗎?揭秘監(jiān)委技術(shù)調(diào)查真相!

      一分為三看人生
      2025-12-15 00:07:43
      61歲演員何晴離世!同學(xué)曝死因是膠質(zhì)瘤,父親也因腦部疾病離世

      61歲演員何晴離世!同學(xué)曝死因是膠質(zhì)瘤,父親也因腦部疾病離世

      娛樂圈圈圓
      2025-12-14 12:44:25
      詹姆斯·卡梅隆的十大巔峰作品,你要全看過,真的太幸運

      詹姆斯·卡梅隆的十大巔峰作品,你要全看過,真的太幸運

      影嘮安利社
      2025-12-13 14:17:02
      同事發(fā)文不滿張水華:你周末跑馬拉松賺錢,我就活該不能陪孩子?

      同事發(fā)文不滿張水華:你周末跑馬拉松賺錢,我就活該不能陪孩子?

      念洲
      2025-12-14 10:21:58
      真正的純陽之物,每周吃幾次,脾胃好了,氣血足了,渾身有勁!

      真正的純陽之物,每周吃幾次,脾胃好了,氣血足了,渾身有勁!

      江江食研社
      2025-12-08 20:30:09
      你辦綱絲節(jié),我收徒弟!著名相聲演員楊議喜收愛徒 女人身份曝光

      你辦綱絲節(jié),我收徒弟!著名相聲演員楊議喜收愛徒 女人身份曝光

      社會日日鮮
      2025-12-13 06:36:53
      低調(diào)的廣東制造:全國最大摩托車企年銷187萬輛,是重慶銀翔3倍多

      低調(diào)的廣東制造:全國最大摩托車企年銷187萬輛,是重慶銀翔3倍多

      老范談史
      2025-12-14 19:38:39
      2025式人民警察制式服裝正式列裝

      2025式人民警察制式服裝正式列裝

      界面新聞
      2025-12-15 16:08:04
      2025-12-15 20:03:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業(yè)的人工智能媒體
      11925文章數(shù) 142510關(guān)注度
      往期回顧 全部

      教育要聞

      保護(hù)孩子寶媽必學(xué),第一次被侵犯可以拒絕,就沒有后面的無數(shù)次!

      頭條要聞

      霸王茶姬創(chuàng)始人與"光伏二代"舉辦婚禮 兩人穿中式婚服

      頭條要聞

      霸王茶姬創(chuàng)始人與"光伏二代"舉辦婚禮 兩人穿中式婚服

      體育要聞

      戰(zhàn)勝完全體雷霆,馬刺“瘋狂動物城”只是半成品

      娛樂要聞

      何晴告別式現(xiàn)場,前夫許亞軍雙眼泛紅?

      財經(jīng)要聞

      新農(nóng)合漲到400元 農(nóng)民斷繳背后的扎心真相

      科技要聞

      大佬冷酷預(yù)言:未來15年 人形機器人成廢鐵

      汽車要聞

      主駕配按摩還可選6座 新款捷途X90PRO售13.59萬起

      態(tài)度原創(chuàng)

      房產(chǎn)
      家居
      教育
      藝術(shù)
      公開課

      房產(chǎn)要聞

      6.66億摘地,海南封關(guān)大動作,千畝海澄新城震撼登場

      家居要聞

      溫暖色調(diào) 大空間不冷清

      教育要聞

      如何實現(xiàn)小初高貫通培養(yǎng)?北京七所學(xué)校亮出“新打法” | 現(xiàn)教沙龍

      藝術(shù)要聞

      Gustav Klimt 高清風(fēng)景油畫作品集

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 奉节县| 香蕉久久av一区二区三区| 亚洲日韩欧洲乱码av夜夜摸| 亚洲一区av无码少妇电影| 亚洲 日韩 欧美 成人 在线| 丰腴浓毛粗壮熟女X66AV| 蜜桃视频在线播放| 伊人福利导航| 日屄自拍| 酉阳| 中文字幕人妻中出| 亚洲a成人片在线观看| 久久久www免费人成精品| 免费中文熟妇在线影片| 国产SM重味一区二区三区| 在线熟女| 人人干干| 亚洲成人大香蕉| 久久国产成人午夜av影院| 精品人妻少妇一区二区| 婷婷久久香蕉五月综合加勒比| av色蜜桃一区二区三区| 国产性爱网| 环江| 日韩人妻无码精品久久久不卡| 曰本丰满熟妇xxxx性| jlzz大jlzz大全免费| 小泽玛利亚av无码专区| 丁香花在线影院观看在线播放 | 成人一区二区三区在线午夜| 人妻?制服?丝袜| 亚洲中文无码人| 国模冰莲大胆自慰难受| 亚洲av网站| 天堂a?中文在线| 亚洲无码| 蜜臀久久99精品久久久久久| 久久久午夜精品福利内容| 国内精品久久久久影视| 国产精品自在自线免费观看| 精品玖玖|