<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      老外傻眼!明用英文提問,DeepSeek依然堅(jiān)持中文思考

      DeepSeek為何堅(jiān)持中文思考

      0
      分享至



      機(jī)器之心報(bào)道

      編輯:冷貓

      就在前天,DeepSeek 一口氣上新了兩個(gè)新模型,DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale。

      這兩大版本在推理能力上有了顯著的提升,DeepSeek-V3.2 版本能和 GPT-5 硬碰硬,而 Speciale 結(jié)合長(zhǎng)思考和定理證明能力,表現(xiàn)媲美 Gemini-3.0-Pro。有讀者評(píng)論說:「這個(gè)模型不應(yīng)該叫 V3.2,應(yīng)該叫 V4。」

      海外研究者也迫不及待的用上了 DeepSeek 的新版本,在感慨 DeepSeek 推理速度顯著提升之余,卻又碰上了他們難以理解的事情:

      哪怕在用英文詢問 DeepSeek 的時(shí)候,它在思考過程中還是會(huì)切回「神秘的東方文字」。



      這就把海外友人整蒙了:明明沒有用中文提問,為什么模型還是會(huì)使用中文思考,難道用中文推理更好更快?

      評(píng)論區(qū)有兩種不同的觀點(diǎn),但大部分評(píng)論都認(rèn)為:「漢字的信息密度更高」

      來自亞馬遜的研究者也這么認(rèn)為:



      這個(gè)結(jié)論很符合我們?nèi)粘5恼J(rèn)知,表達(dá)相同的文本含義,中文所需的字符量是明顯更少的。如果大模型理解與語義壓縮相關(guān)的話,那么中文相比于廣泛使用的英文在壓縮方面更有效率。或許這也是「中文更省 token」說法的來源。

      具有多語言能力的大模型如果只采用英語思考的模式往往會(huì)導(dǎo)致一些效率問題。不光是中文,采用其他非英語的語言進(jìn)行推理確實(shí)能夠有更好的表現(xiàn)。

      一篇來自微軟的論文《EfficientXLang: Towards Improving Token Efficiency Through Cross-Lingual Reasoning》發(fā)現(xiàn),使用非英語語言進(jìn)行推理不僅減少了 Token 消耗,還能保持準(zhǔn)確性。即使將推理軌跡翻譯回英語,這種優(yōu)勢(shì)依然存在,這表明這種變化源于推理行為的實(shí)質(zhì)性轉(zhuǎn)變,而非僅僅是表層的語言效應(yīng)。



      • 論文標(biāo)題:EfficientXLang: Towards Improving Token Efficiency Through Cross-Lingual Reasoning
      • 論文鏈接:https://www.arxiv.org/abs/2507.00246

      在該論文中,作者,評(píng)估了三個(gè)最先進(jìn)的開源推理模型:DeepSeek R1、Qwen 2.5 (32B) 和 Qwen 3 (235B-A22B),問題以英語呈現(xiàn),但模型被明確指示以七種目標(biāo)語言中的一種執(zhí)行其推理步驟:中文 (zh)、俄語 (ru)、西班牙語 (es)、印地語 (hi)、阿拉伯語 (ar)、韓語 (ko) 和土耳其語 (tr)。最終答案必須以英語提供,以確保評(píng)估的一致性。



      Token 數(shù)量比率與在英語和目標(biāo)語言中均至少有一個(gè)正確答案的問題數(shù)量(最少 5 個(gè)共同案例)的關(guān)系,該比率是相對(duì)于 DeepSeek R1 每個(gè)問題的平均英語 Token 數(shù)量計(jì)算得出的。

      在所有評(píng)估的模型和數(shù)據(jù)集上,與英語相比,使用非英語語言進(jìn)行推理始終能實(shí)現(xiàn) 20-40% 的顯著令牌降低,而且通常不影響準(zhǔn)確性。DeepSeek R1 的 token 減少量從 14.1%(俄語)到 29.9%(西班牙語)不等,而 Qwen 3 則表現(xiàn)出更顯著的節(jié)省,韓語的減少量高達(dá) 73%。這些效率提升直接轉(zhuǎn)化為推理成本降低、延遲更低和計(jì)算資源需求降低。

      從實(shí)驗(yàn)結(jié)果來看,中文確實(shí)相比英文能夠節(jié)省推理 token 成本,但卻并不是最具有效率的語言。

      另一個(gè)研究論文同樣支撐著類似觀點(diǎn),來自馬里蘭大學(xué)和微軟的研究論文《One ruler to measure them all: Benchmarking multilingual long-context language models》,提出了包含 26 種語言的多語言基準(zhǔn) OneRuler,用于評(píng)估大型語言模型(LLM)在長(zhǎng)達(dá) 128K 令牌的長(zhǎng)上下文理解能力。



      • 論文標(biāo)題:One ruler to measure them all: Benchmarking multilingual long-context language models
      • 論文鏈接:https://www.arxiv.org/abs/2503.01996v3

      研究者們通過兩個(gè)步驟構(gòu)建了 OneRuler:首先為每個(gè)任務(wù)編寫英語指令,然后與母語使用者合作將其翻譯成另外 25 種語言。

      針對(duì)開放權(quán)重和閉源語言模型的實(shí)驗(yàn)表明,隨著上下文長(zhǎng)度從 8K 增加到 128K token,低資源語言與高資源語言之間的性能差距日益擴(kuò)大。令人驚訝的是,英語并不是長(zhǎng)上下文任務(wù)中表現(xiàn)最好的語言(在 26 種語言中排名第 6),而波蘭語位居榜首。在指令和上下文語言不一致的跨語言場(chǎng)景中,根據(jù)指令語言的不同,性能波動(dòng)幅度可達(dá) 20%。



      圖 4:在長(zhǎng)上下文任務(wù)(64K 和 128K)中,按語言資源組分類的各模型和語言的 NIAH 性能表現(xiàn)。Gemini 1.5 Flash 展現(xiàn)了最佳的長(zhǎng)上下文性能,而出人意料的是,英語和中文并未進(jìn)入排名前五的語言之列。

      既然中英文都不是具有最佳大模型性能的語言,那大模型選擇思考語言的方式并不是完全以效率為先。

      所以評(píng)論區(qū)的第二種觀點(diǎn):「訓(xùn)練數(shù)據(jù)中包含更多中文內(nèi)容」,似乎更加合理。



      國(guó)產(chǎn)大模型采用更多中文訓(xùn)練語料,其思考過程出現(xiàn)中文是正常現(xiàn)象。就像 AI 編程工具 Cursor 發(fā)布的新版本 2.0 核心模型「Composer-1」被質(zhì)疑是中國(guó)模型套殼,正是因?yàn)槠渌伎歼^程完全由中文構(gòu)成。



      但類似的事放在 GPT 上就說不通了,畢竟在它的訓(xùn)練過程中,英文數(shù)據(jù)的占比顯然是更高的。

      在今年 1 月份就有類似的事情發(fā)生,網(wǎng)友發(fā)現(xiàn)來自 OpenAI 的 o1-pro 模型也會(huì)隨機(jī)出現(xiàn)中文思考過程。





      或許這就是人類語言的魅力,不同的語言有不同的特性,在大模型中總會(huì)有各種奇怪的事情發(fā)生。



      大模型說中文的事情越來越多,中文訓(xùn)練語料也越來越豐富。

      說不定有一天,我們能夠像海外友人自嘲一樣笑話大模型:「我并不是要你變成中國(guó)人。我是說 —— 當(dāng)時(shí)機(jī)成熟時(shí),你照照鏡子,就會(huì)發(fā)現(xiàn)自己早已是中國(guó)人了。」

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      佘詩(shī)曼與“小奶狗”何廣沛分手引質(zhì)疑!網(wǎng)友困惑:更像炮友而非情侶

      佘詩(shī)曼與“小奶狗”何廣沛分手引質(zhì)疑!網(wǎng)友困惑:更像炮友而非情侶

      我愛追港劇
      2025-12-07 23:16:53
      驗(yàn)貨成功,雙喜臨門,看快船輸給森林狼,實(shí)則哈登贏了里子和面子

      驗(yàn)貨成功,雙喜臨門,看快船輸給森林狼,實(shí)則哈登贏了里子和面子

      煙潯渺渺
      2025-12-08 06:15:06
      99年朱總理訪美,被問中國(guó)給克林頓30萬獻(xiàn)金,總理:怎么才30萬?

      99年朱總理訪美,被問中國(guó)給克林頓30萬獻(xiàn)金,總理:怎么才30萬?

      WarOH協(xié)虎
      2024-12-01 22:10:02
      梅西的上限:60冠軍!1000進(jìn)球!500助攻!2世界杯冠軍!

      梅西的上限:60冠軍!1000進(jìn)球!500助攻!2世界杯冠軍!

      氧氣是個(gè)地鐵
      2025-12-07 17:03:27
      立法會(huì)選舉|政黨勢(shì)力分布一覽:民建聯(lián)增至20席,新民黨議席“斬半”成輸家,工聯(lián)會(huì)兩議員連任失敗

      立法會(huì)選舉|政黨勢(shì)力分布一覽:民建聯(lián)增至20席,新民黨議席“斬半”成輸家,工聯(lián)會(huì)兩議員連任失敗

      星島記事
      2025-12-08 09:39:11
      全新梅賽德斯-奔馳GLB全球首發(fā)

      全新梅賽德斯-奔馳GLB全球首發(fā)

      第一試駕
      2025-12-08 08:06:06
      上港重金挖人?王上源官宣,正式簽約,1年合同,薪水曝光

      上港重金挖人?王上源官宣,正式簽約,1年合同,薪水曝光

      樂聊球
      2025-12-07 11:28:32
      她是最會(huì)玩的港姐,水性楊花私交混亂,把13個(gè)男人玩弄于股掌之上

      她是最會(huì)玩的港姐,水性楊花私交混亂,把13個(gè)男人玩弄于股掌之上

      攬星河的筆記
      2025-11-30 12:11:21
      黑騎士特別版上市,僅15.49萬起,限量發(fā)售666輛,劍指小米YU7!

      黑騎士特別版上市,僅15.49萬起,限量發(fā)售666輛,劍指小米YU7!

      隔壁說車?yán)贤?/span>
      2025-12-06 05:52:42
      坐3.6億飛機(jī),戴1000萬名表,拿5000萬炒股的秦奮究竟什么背景

      坐3.6億飛機(jī),戴1000萬名表,拿5000萬炒股的秦奮究竟什么背景

      青史樓蘭
      2025-08-25 10:50:56
      雷達(dá)照射還不夠!日方軍機(jī)滋擾擅闖遼寧艦,或被視為訓(xùn)練靶標(biāo)!

      雷達(dá)照射還不夠!日方軍機(jī)滋擾擅闖遼寧艦,或被視為訓(xùn)練靶標(biāo)!

      軍武咖
      2025-12-07 19:23:40
      佐山愛18年職業(yè)生涯的特別謝幕:引退前的輝煌挑戰(zhàn)

      佐山愛18年職業(yè)生涯的特別謝幕:引退前的輝煌挑戰(zhàn)

      素然追光
      2025-12-08 00:23:52
      巴勒斯坦感謝中方1億美元無償援助,稱贊此舉體現(xiàn)支持正義立場(chǎng)

      巴勒斯坦感謝中方1億美元無償援助,稱贊此舉體現(xiàn)支持正義立場(chǎng)

      環(huán)球熱點(diǎn)快評(píng)
      2025-12-05 09:27:27
      1993年我國(guó)首次申奧,兩票之差輸給悉尼,多年后“黑幕”才被曝光

      1993年我國(guó)首次申奧,兩票之差輸給悉尼,多年后“黑幕”才被曝光

      忠于法紀(jì)
      2025-12-07 19:32:10
      馬克龍的訪華行,卻是讓德媒清醒了:我們怕才是“發(fā)展中國(guó)家”

      馬克龍的訪華行,卻是讓德媒清醒了:我們怕才是“發(fā)展中國(guó)家”

      通文知史
      2025-12-06 23:10:03
      六臺(tái):老佛爺是最后一個(gè)離開伯納烏的,這非常罕見

      六臺(tái):老佛爺是最后一個(gè)離開伯納烏的,這非常罕見

      懂球帝
      2025-12-08 10:45:10
      李乃文現(xiàn)身三亞!花1.5萬買的新手機(jī)被助理摔了 他秒黑臉心疼壞了

      李乃文現(xiàn)身三亞!花1.5萬買的新手機(jī)被助理摔了 他秒黑臉心疼壞了

      娛圈小愚
      2025-12-07 09:46:43
      江蘇兩地黨政“一把手”調(diào)整

      江蘇兩地黨政“一把手”調(diào)整

      艾米手工作品
      2025-12-07 16:30:27
      40歲后才懂:這些年瞎花的錢,全是交了智商稅!

      40歲后才懂:這些年瞎花的錢,全是交了智商稅!

      一桶漿糊要一統(tǒng)江湖
      2025-10-27 17:35:07
      重要賽事!12月8晚上21:30!中央5套CCTV5、CCTV5+直播節(jié)目表

      重要賽事!12月8晚上21:30!中央5套CCTV5、CCTV5+直播節(jié)目表

      皮皮觀天下
      2025-12-08 07:27:26
      2025-12-08 11:15:00
      機(jī)器之心Pro incentive-icons
      機(jī)器之心Pro
      專業(yè)的人工智能媒體
      11862文章數(shù) 142510關(guān)注度
      往期回顧 全部

      科技要聞

      蘋果核心人才"出逃"內(nèi)幕,庫(kù)克為何攔不住

      頭條要聞

      牛彈琴:對(duì)日斗爭(zhēng)突發(fā)新情況 中國(guó)軍方回應(yīng)火力全開

      頭條要聞

      牛彈琴:對(duì)日斗爭(zhēng)突發(fā)新情況 中國(guó)軍方回應(yīng)火力全開

      體育要聞

      厲害的后衛(wèi)何其多 想想還少了哪一個(gè)

      娛樂要聞

      郭麒麟也救不了的德云社了?

      財(cái)經(jīng)要聞

      養(yǎng)牛場(chǎng)未見一頭牛 每天開采礦石倒賣

      汽車要聞

      挑戰(zhàn)深圳地獄級(jí)路況 魏牌藍(lán)山VLA上車會(huì)思考聽得懂人話

      態(tài)度原創(chuàng)

      本地
      藝術(shù)
      手機(jī)
      房產(chǎn)
      軍事航空

      本地新聞

      云游安徽|七千年敘事,第一章寫在蚌埠

      藝術(shù)要聞

      從3萬人的“小香港”到十室九空!江西深山被廢棄的煤礦小鎮(zhèn)

      手機(jī)要聞

      史上首款機(jī)器人手機(jī)!榮耀ROBOT PHONE明年上半年量產(chǎn)

      房產(chǎn)要聞

      封關(guān)啟幕宜居新時(shí)代!觀嵐森嶼定義三亞旅居度假新范本

      軍事要聞

      日本稱中方雷達(dá)照射日戰(zhàn)機(jī) 國(guó)防部回應(yīng)

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 曰本无码人妻丰满熟妇啪啪| 亚洲熟女视讯2| 武乡县| 国产偷国产偷亚洲清高动态图| 国产精品av在线| 无遮高潮国产免费观看| A级毛片18以上观看视频免费| 苏尼特右旗| 亚洲免费网站观看视频| 成人国产精品免费视频| a4yy私人毛片| 国产AV中文字幕| 欧美va天堂在线电影| 伊人激情av一区二区三区| 国产日产免费高清欧美一区| 熟女中字在线| 人妻偷人精品| 日本公妇乱偷中文字幕| 亚洲av无码专区在线厂| 日韩欧美视频一区二区三区| 亚洲欧美精品午睡沙发| 亚洲自国产拍揄拍| 少妇一晚三次一区二区三区| 亚洲成人AV在线观看| 蜜臀99| 欧美3p视频在线观看| 亚洲精品中文字幕二区| 亚洲日韩av无码中文字幕美国| 政和县| 色欲av亚洲一区无码少妇| 国产精品99久久免费| 亚洲综合一区二区三区| 五月婷婷开心| 国产女人好紧好爽| 亚洲国产色播AV在线| 内射自拍| 精品国产91久久久久久亚瑟| 欧美日韩不卡视频合集| 亚洲天堂av 在线| 国产va精品| 亚洲成人视频|