<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>

色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3

<tfoot id="bzuaq"><form id="bzuaq"></form></tfoot><u id="bzuaq"><th id="bzuaq"><tbody id="bzuaq"></tbody></th></u>

<meter id="bzuaq"><mark id="bzuaq"></mark></meter>

<menuitem id="bzuaq"><mark id="bzuaq"></mark></menuitem>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

DeepSeekV3.2技術報告還是老外看得細

2025-12-04 08:53:34　來源: 量子位

北京舉報

0

分享至

henry 發自凹非寺
量子位 | 公眾號

ChatGPT三歲生日這一天，硅谷熱議的新模型來自DeepSeek

準確說是兩款開源模型——DeepSeek-V3.2DeepSeek-V3.2-Speciale

這倆模型火到什么程度呢？

有網友表示，在去圣地亞哥的（疑似趕場NeurIPS 2025）航班上，有30%的乘客都在對著DeepSeek的PDF兩眼冒光。

而上周嘲諷DeepSeek “曇花一現”的推特更是在發布的當晚被刷到了500萬瀏覽。

除了普通網友，奧特曼也是急急急急：不僅啟動紅色警報，還臨時推遲了在ChatGPT上投放廣告的計劃。

與此同時，那一頭的谷歌也沒被放過。

網友直接 “靈魂喊話” 谷歌Gemini團隊：別睡了，DeepSeek回來了。

這是怎么一回事？

閉源精銳？打的就是閉源精銳！

總的來說，DeepSeek-V3.2模型在智能體評測中達到了當前開源模型的最高水平，大幅縮小了開源模型與頂尖閉源模型的差距，并宣告了閉源落后開源的結束。

其中，標準版DeepSeek-V3.2在推理測試中，達到了GPT-5的水平，僅略低于Gemini-3.0-Pro。

而“特別版”DeepSeek-V3.2-Speciale不僅全方位超越了GPT-5，還能在主流推理任務中和Gemini-3.0-Pro掰掰手腕。

此外，V3.2-Special還拿下了IMO、CMO、ICPC及IOI的金牌，并在ICPC和IOI上達到了人類選手第二名與第十名的水平。

這不僅擊碎了開源模型落后閉源模型半年的質疑，又順便給硅谷的閉源AI公司好好上了一波壓力。

而且，這還不是V4/R2。

換句話說，大菜還沒上呢，光涼菜就已經讓硅谷吃飽了。

對于DeepSeek-V3.2這次的成績，DeepSeek研究院茍志斌（Zhibin Gou）在推特上給出了相當直覺性的解答：

強化學習在長上下文長度下也能持續擴展。

為了理解這句話，我們簡要地回顧一下論文。

簡單來說，DeepSeek-V3.2其實干了這么幾件事：

首先，利用DSA稀疏注意力解決了長上下文的效率問題，為后續的長序列強化學習打下了計算基礎。

接下來，通過引入可擴展的RL，并投入超過預訓練成本10%的算力進行后訓練，大幅提升模型的通用推理和智能體能力。

最后，DeepSeek-V3.2-Speciale版本為了探索推理能力的極限，特意放寬了RL的長度限制，允許模型生成極長的“思維鏈”，迫使模型通過大量的Token生成來進行深度的自我修正和探索。

這也就是說，通過長思維鏈讓模型思考更多，通過自我修正探索讓模型思考更久，進而解鎖更強的推理能力。

由此，模型就能在不增加預訓練規模的情況下，通過極長的思考（消耗更多token）過程實現性能的飛躍。

而上面的實驗結果，恰恰證明了這套“在超長上下文下持續擴展強化學習”路線的正確性。

正如茍志斌所說：

如果說Gemini-3證明了：預訓練可以持續擴展，那么DeepSeek-V3.2-Speciale 則證明了：強化學習在長上下文長度下也能持續擴展。
我們花了一年時間把 DeepSeek-V3 逼到極限。得到的教訓是：
后訓練階段的瓶頸，不是等“更好的底座模型”來解決，而是靠方法和數據本身的精煉（refine）來解決。

換句話說，如果說Gemini-3 靠“堆知識（預訓練）”贏得了上半場，那么DeepSeek-V3.2-Speciale則通過“堆思考（長上下文RL）”贏回了下半場。

此外，對于大模型已經撞到天花板了的論調，他表示：

預訓練能scaling，RL也能scaling，context也能scaling，所有維度都還在上漲。

這表明RL不僅有效，還能通過scaling（更大 batch、更長context、更豐富任務）獲得巨額收益

同時，在論文中，也有網友發現了為什么DeepSeek-V3.2在HLE和GPQA 等知識基準測試中表現稍遜：

因為計算資源有限！而單靠強化學習是無法達到這樣的水平的。

換句話說，DeepSeek與頂尖模型的差距已經不是技術問題，而是經濟問題

只要卡夠，好的開源不比閉源差！

想到會便宜，沒想到會便宜這么多

除了性能上持平頂尖閉源模型外，DeepSeek-V3.2系列這次也著實讓大家見識到了“智能便宜到不用計費”。

如果從百萬token輸出成本來看，DeepSeek-V3.2比GPT-5便宜近24倍，比Gemini 3 Pro，便宜近29倍。

而隨著輸出token個數的增加，這個差距最高可拉大到43倍

這是什么概念呢？就好比你讓大模型一次性“寫”出一套《三體》三部曲，用GPT-5你大概需要八百塊，Gemini 3 Pro需要一千塊。

用DeepSeekV3.2只需要差不多35塊錢！

所以，性能差不多，價格卻能差出幾十倍。該選哪邊，答案不用多說了吧？

對此，有網友表示，DeepSeek-V3.2這一經濟實惠的開源模型正在挑戰Gemini3.0 Pro。

而另一頭OpenAI昂貴的訂閱費，瞬間就不順眼了。

當然，這并不是說DeepSeekV3.2毫無缺點。

正如一位網友指出的，同樣解決一個問題，Gemini只需要2萬個token，而Speciale則需要花費7.7萬個。

（這實際上也是上面長下文RL的trade off）

不過，低廉的價格也在一定程度上彌補了現階段Speciale版本的弱點。

總的來說，DeepSeek仍舊是更實惠的那個。

除此之外，也許更讓硅谷感到頭疼的就是DeepSeek-V3.2還可能直接在國產算力（華為、寒武紀）中部署，而這將進一步拉低模型推理的成本。

此前，在發布DeepSeek-V3.2-Exp時，DeepSeek在發布首日就針對華為Ascend硬件和CANN軟件棧進行了優化。

這次的DeepSeek-V3.2系列雖然沒有明確表示，但大概率也會延續此前的戰略。

換句話說，難過可能的不止是谷歌和OpenAI，還有他們的好兄弟——英偉達。

然而，這里的價格還只是模型公司的定價，并非推理的實際成本。

盡管我們無法得知各家模型實際的推理成本，但從DeepSeek的技術報告中可以看到一個清晰趨勢：

相較于前一代模型DeepSeek-V3.1-Terminus，DeepSeek-V3.2在最長上下文（128K）場景下，成本降低了75%83%左右。

這意味著隨著注意力機制與后訓練的不斷優化，底層推理成本正在持續下探

正如一位網友所總結的那樣：

DeepSeek證明了：實現強大的AI，并不一定需要夸張的資本投入。

[1]https://x.com/airesearch12/status/1995465802040983960

[2]https://www.nbcnews.com/tech/innovation/silicon-valley-building-free-chinese-ai-rcna242430

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

「ChatGPT說我在浪費生命，但它錯了」，WhatsApp前產品掌門人的清醒反擊

36氪 2025-11-27 11:59:07
0 跟貼 0
LLaVA-OneVision-1.5開源，8B模型預訓練只需4天、1.6萬美元

機器之心Pro 2025-10-13 18:37:02
0 跟貼 0

十八般武藝樣樣精通，王楚欽多拍相持展示全面技術

咪咕體育 2025-12-04 11:57:02
7 跟貼 7

字節Seed團隊發布循環語言模型Ouro，在預訓練階段直接「思考」

機器之心Pro 2025-11-04 11:58:36
0 跟貼 0
大廠禁用Cursor，程序員回歸“手搓時代”？

鈦媒體APP 2025-12-08 09:19:13
4 跟貼 4

句子級溯源+生成式歸因，C2-Cite重塑大模型可信度

機器之心Pro 2025-12-03 10:33:12
0 跟貼 0

成本0.3美元，耗時26分鐘！CudaForge：顛覆性低成本CUDA優化框架

機器之心Pro 2025-11-17 18:45:03
0 跟貼 0
推理新范式：動態效能算法讓算力資源實現最大化

智東西 2025-11-12 19:58:10
0 跟貼 0

劉世錦：有條件有意愿的地方可以在消費、民生、需求等方面步子大一些

證券時報 2025-12-07 13:55:02
5834 跟貼 5834
架構解耦是統一多模態模型所必須的嗎？全新AIA損失：No

機器之心Pro 2025-12-02 14:25:38
0 跟貼 0
人民日報：對最忙五人組不能一笑了之更需一查到底

人民網-人民日報 2025-12-07 16:49:26
6019 跟貼 6019
PixelRefer ：讓AI從“看大圖”走向“看懂每個對象”

機器之心Pro 2025-11-11 12:49:23
0 跟貼 0
住上高質感的家被小米智能門鎖M40 Pro種草

機氪 2025-12-04 12:13:25
6 跟貼 6
華為新架構砍了Transformer大動脈！任意模型推理能力原地飆升

量子位 2025-12-06 21:41:29
0 跟貼 0
國產“智能水下殺手”亮相，能悄悄潛伏海底，火箭上躥干掉敵艦

隱龍天下 2025-12-06 01:48:46
0 跟貼 0
江蘇適齡男子都要登記

現代快報 2025-12-07 15:23:14
2079 跟貼 2079
靠一臺電腦和3D打印機，80后男子在杭州車庫手搓機器人

環球網資訊 2025-12-07 21:06:10
180 跟貼 180
燃油車的高階輔助駕駛也不錯體驗途昂PRO高速領航

車視界科技 2025-12-06 13:48:47
1 跟貼 1
笑鼠！拿著韋神的照片找大爺看面相，大爺：這人一看就沒啥知識！

老喬碎碎念 2025-12-07 17:05:25
0 跟貼 0
Ilya剛預言完，世界首個原生多模態架構就來了：視覺和語言被焊死

量子位 2025-12-06 21:40:40
16 跟貼 16
尋找產業新風向，與院士、企業家共話AI落地

36氪 2025-12-08 10:42:31
0 跟貼 0
Transformer作者：DeepSeek才有搞頭，OpenAI指望不上了

量子位 2025-09-12 11:07:58
0 跟貼 0
售價3499元豆包手機已售罄，購買者：能完成復雜指令，10分鐘投遞30份求職簡歷

極目新聞 2025-12-05 12:06:58
1215 跟貼 1215
定義下一代AI計算新標桿地平線發布第四代BPU架構黎曼

網易汽車 2025-12-08 10:37:17
0 跟貼 0
經營上海機場免稅店26年的“日上”或被剝奪投標資格

環球網資訊 2025-12-07 13:39:19
1177 跟貼 1177
AI機器人安全探索者，果下科技，正在做AI之父辛頓想做的事

財聯社 2025-12-08 11:58:07
0 跟貼 0
看完價格覺得還是燃油“大塊頭”香試駕上汽大眾途昂PRO

車視界科技 2025-12-06 12:22:10
4 跟貼 4
面對面丨今年流感為何來勢洶洶？打了疫苗為何仍會“中招”？專家詳解如何應對

央視新聞客戶端 2025-12-08 01:01:38
1015 跟貼 1015
小米SU7和YU7標準版現車被搶購一空，僅剩Pro和Max版

簡簡單單的說 2025-12-07 00:25:35
109 跟貼 109
從“戴高樂”到PANG：法國如何用8萬噸新航母彌補動力與技術

春露秋霜 2025-12-07 00:54:50
0 跟貼 0
AI安全上，開源仍勝閉源，Meta、UCB防御LLM提示詞注入攻擊

機器之心Pro 2025-07-30 14:59:51
0 跟貼 0
日本電磁炮妄圖擊沉中國航母？軍事專家：送“小火柴棍”下海底；日頻繁制造地區緊張局勢，軍事專家：日本搞小動作解放軍盡在掌握

每日經濟新聞 2025-12-08 01:02:16
479 跟貼 479
兩部門：加強醫保支付范圍管理

財聯社 2025-12-07 12:12:08
1558 跟貼 1558
"最幸運卡車司機"半年漲粉40萬曾在斷橋上死里逃生

紅星新聞 2025-12-08 08:39:20
72 跟貼 72
給女性打招呼，三個稱呼不能隨便用，看完瞬間漲知識！

海報搞笑社 2025-12-04 19:39:09
1 跟貼 1
大哥展示劈磚技術，這種功夫很難學，把磚頭都劈紅了！

開心搞笑一天 2025-12-08 09:42:28
1 跟貼 1
算力硬件股震蕩拉升天孚通信大漲10%

每日經濟新聞 2025-12-08 09:49:06
0 跟貼 0
AI進入“液冷時代”，市場低估了“轉變力度”，國產供應鏈正加速入局

華爾街見聞官方 2025-12-08 11:05:55
0 跟貼 0
模型拿捏顏色和角度，撫摸感覺太神奇，腦子和眼睛在打架！

月亮姐侃生活 2025-12-06 16:15:01
0 跟貼 0
漲幅最高20%！戴爾、聯想等PC廠計劃漲價

財聯社 2025-12-07 09:44:03
607 跟貼 607

中方嚴厲警告：如果日艦再闖臺海就擊沉，會被視為侵略可無限反擊

中方嚴厲警告：如果日艦再闖臺海就擊沉，會被視為侵略可無限反擊

愛吃醋的貓咪

2025-12-06 21:02:16

一覺醒來，不僅賣電車的傻眼了，就連生產廠家也驚呆了！

一覺醒來，不僅賣電車的傻眼了，就連生產廠家也驚呆了！

今朝牛馬

2025-12-06 12:21:16

六臺：老佛爺是最后一個離開伯納烏的，這非常罕見

六臺：老佛爺是最后一個離開伯納烏的，這非常罕見

懂球帝

2025-12-08 10:45:10

225單退款女后續：鄰居爆料炸裂，全家都是“慣犯”，都不是善茬

225單退款女后續：鄰居爆料炸裂，全家都是“慣犯”，都不是善茬

鋭娛之樂

2025-12-08 08:48:31

16歲讀博的神童張炘煬，如今無業躺平啃老，坦然承認：我不是神童

16歲讀博的神童張炘煬，如今無業躺平啃老，坦然承認：我不是神童

不寫散文詩

2025-12-07 19:20:12

雙胞胎認親反目后續：爸爸簽永不尋找保證書，哥哥棄房退親但原諒

雙胞胎認親反目后續：爸爸簽永不尋找保證書，哥哥棄房退親但原諒

鋭娛之樂

2025-12-08 08:19:16

曝阿隆索3天后再輸就下課！推卸責任：對球員感到失望主裁瞎出牌

曝阿隆索3天后再輸就下課！推卸責任：對球員感到失望主裁瞎出牌

風過鄉

2025-12-08 07:29:34

中國第一省會，到底“養活”了多少人？

中國第一省會，到底“養活”了多少人？

孫不熟讀城市

2025-12-07 23:33:17

“浙江投行一哥”被帶走

財通社

2025-12-07 11:55:49

1955年授銜主席看到名單中有個熟悉的名字，大筆一揮：他不是少將

1955年授銜主席看到名單中有個熟悉的名字，大筆一揮：他不是少將

宅家伍菇涼

2025-12-07 10:00:04

湖北一副局長被查

越喬

2025-12-08 07:10:30

李澤鉅近照變化巨大！滿頭白發，身材發福，帶兩位助理參加選舉！

李澤鉅近照變化巨大！滿頭白發，身材發福，帶兩位助理參加選舉！

阿纂看事

2025-12-07 22:14:52

人生趁早要做三件事：賺錢、戀愛、見世面

人生趁早要做三件事：賺錢、戀愛、見世面

蘇格拉高

2025-12-08 10:48:17

國家隊低調布局：這5只科技股或成明年主線，概念炒作請讓道

國家隊低調布局：這5只科技股或成明年主線，概念炒作請讓道

慧眼看世界哈哈

2025-12-08 07:05:03

曾風靡一時，又突然消失的7件家電：科技進步太快，難怪被淘汰

曾風靡一時，又突然消失的7件家電：科技進步太快，難怪被淘汰

小柱解說游戲

2025-12-07 10:04:13

“畸形”的輪胎市場：外國人愛用的中國輪胎，國人為啥就是不買賬

“畸形”的輪胎市場：外國人愛用的中國輪胎，國人為啥就是不買賬

毒sir財經

2025-12-06 22:07:18

闞清子孕晚期腫成饅頭臉，老公全程貼心攙扶，30斤幸福肥超有愛

闞清子孕晚期腫成饅頭臉，老公全程貼心攙扶，30斤幸福肥超有愛

鑫鑫愛吃糖

2025-12-07 18:19:19

南京雙胞胎反目后續：爸爸支持弟弟，讓弟弟不要低頭一家三口慶祝

南京雙胞胎反目后續：爸爸支持弟弟，讓弟弟不要低頭一家三口慶祝

漢史趣聞

2025-12-06 11:05:31

曼聯冬窗簽加拉格爾計劃獲確認！6000萬鐵腰恐遭清洗，土超感興趣

曼聯冬窗簽加拉格爾計劃獲確認！6000萬鐵腰恐遭清洗，土超感興趣

羅米的曼聯博客

2025-12-08 11:22:41

奚美娟兒子生父曝光：隱藏30年，圈內幕后大佬非前夫

奚美娟兒子生父曝光：隱藏30年，圈內幕后大佬非前夫

探索新高度

2025-12-07 19:05:37

追蹤人工智能動態

11820文章數 176340關注度

往期回顧全部

科技要聞

萬億蘋果，正在經歷一場嚴重的“大失血”

頭條要聞

媒體：美國重返西半球若從亞太撤離或挑撥中日干一架

頭條要聞

媒體：美國重返西半球若從亞太撤離或挑撥中日干一架

體育要聞

厲害的后衛何其多想想還少了哪一個

娛樂要聞

郭麒麟也救不了的德云社了？

財經要聞

養牛場未見一頭牛每天開采礦石倒賣

汽車要聞

挑戰深圳地獄級路況魏牌藍山VLA上車會思考聽得懂人話

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

游戲

時尚

教育

藝術

軍事航空

超真實的沉浸式中世紀鍛造模擬器

除了大衣，今年最火的外套一定就是它了！

教育要聞

當你的孩子主動給你買東西

藝術要聞

從3萬人的“小香港”到十室九空！江西深山被廢棄的煤礦小鎮

軍事要聞

日本稱中方雷達照射日戰機國防部回應

© 1997-2025 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版主站蜘蛛池模板：怡春院网站| 亚洲综合av在线在线播放| 中西区| 成人国产精品免费网站| 欧美日韩中文国产一区发布| 天天躁日日躁狠狠躁欧美老妇小说| 亚洲综合社区| 国产一区二区视频啪啪视频 | 艳妇臀荡乳欲伦69调教视频| 新安县| 亚洲1234区| 一亚洲一区二区中文字幕 | 91NAV成人黄色| 午夜爽爽爽男女免费观看影院| 2020精品国产自在现线看| 性欧美大战久久久久久久| 97色婷婷| jizz网站| 国产人妻精品午夜福利免费 | 夜夜躁天天躁很很躁| √天堂资源网最新版在线| 阳东县| 精品熟女999| 90后极品粉嫩小泬20p| 无码人妻精品一区二区三区温州| 亚洲一区二区三区无码| 伊人桃花网| 久久亚洲视频| 九九三级影视| 国产jizzjizz视频| 自拍偷拍欧美| 五十路熟女一区二区三区| 中文字幕av无码一区二区三区 | 疯狂做受xxxx高潮欧美日本| 国产精品无码一区二区三级| www熟女com| 欧美激情猛片xxxⅹ大3| 亚洲人成网站在线在线观看| 双鸭山市| 亚洲第一av网站| 中文字幕A片无码免费看|

<abbr id="wn59n"><listing id="wn59n"><label id="wn59n"></label></listing></abbr>

<big id="wn59n"><mark id="wn59n"><ins id="wn59n"></ins></mark></big>

<thead id="wn59n"><delect id="wn59n"></delect></thead>