<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      編程表現(xiàn)超越Claude和GPT?DeepSeek準備第二次震驚全世界

      0
      分享至



      去年7月,由于DeepSeek下載量從高峰期的8000多萬暴跌至2000多萬,下滑72.2%,“DeepSeek跌落神壇”就成為了當(dāng)時互聯(lián)網(wǎng)最熱門的話題。

      但據(jù)多位知情人士透露,DeepSeek即將重登王座。他們計劃在二月中旬發(fā)布新一代模型DeepSeek-V4。

      也就是農(nóng)歷2026年新年期間,距離上一代模型DeepSeek-R1的發(fā)布正好一年。

      這次發(fā)布的重點是代碼生成和處理能力。

      根據(jù)DeepSeek內(nèi)部的基準測試,V4在編程任務(wù)上的表現(xiàn)超過了目前市場上的主流競品,包括Anthropic的Claude和OpenAI的GPT系列。

      根據(jù)報道,在即將發(fā)布的新模型中,DeepSeek團隊解決了許多長期困擾AI發(fā)展的技術(shù)難題。很可能會徹底改變Vibe Coding產(chǎn)業(yè)。

      01

      報道中提到一件事,“DeepSeek-V4模型在整個訓(xùn)練過程中理解數(shù)據(jù)模式的能力也有所改進,且性能未出現(xiàn)衰減。”

      這句話有些難以理解,我們不妨拆開來解讀。

      首先是前半句,它指的是模型不再只是死記硬背數(shù)據(jù),而是能看透數(shù)據(jù)背后的規(guī)律和邏輯。

      DeepSeek-R1有個具代表性的例子,就是讓模型數(shù)strawberry里有幾個r。

      由于當(dāng)時的DeepSeek模型并不能理解“數(shù)”(count)這個概念,只能根據(jù)訓(xùn)練時的數(shù)據(jù)來輸出答案。可這個數(shù)據(jù)恰好又是錯的,所以無論DeepSeek怎么思考,它給出的答案大多數(shù)情況都是2,而不是正確的3。



      而DeepSeek-V4則會徹底杜絕這個情況,前提是在訓(xùn)練過程中,讓模型徹底理解某一件事情。

      后半句的性能退化,指的是在AI訓(xùn)練中,隨著模型不斷學(xué)習(xí)新東西或訓(xùn)練時間加長,往往會出現(xiàn)“學(xué)了新的忘了舊的”或者模型變得不穩(wěn)定的情況。

      這種現(xiàn)象在業(yè)內(nèi)被稱為“災(zāi)難性遺忘”(Catastrophic Forgetting)或“模型坍塌”(Model Collapse)。

      因此,V4在不斷變聰明、變復(fù)雜的過程中,依然保持了極高的穩(wěn)定性和原有能力的完整性,沒有出現(xiàn)任何“副作用”或能力倒退。

      這恰恰是構(gòu)建編程Agent的前置條件。

      在現(xiàn)代軟件工程中,一個微小的修改可能波及數(shù)個文件、數(shù)千行代碼的依賴關(guān)系。

      但是以往的模型往往受限于上下文窗口或注意力機制的衰減,從而沒辦法對于龐大的項目進行修改。

      V4極有可能是一個為“Agent時代”量身定制的模型。

      一年前,DeepSeek-R1 的發(fā)布確實在行業(yè)內(nèi)引起了不小的波動。那款主打推理能力的模型證明了低成本研發(fā)路徑的可行性。

      然而一年后的今天,人工智能行業(yè)的關(guān)注焦點已經(jīng)發(fā)生了顯著轉(zhuǎn)移。單純的文本生成或邏輯推理已不再是唯一的競爭高地,代碼生成正在演變?yōu)榇竽P湍芰Φ摹霸嚱鹗薄?/p>

      在當(dāng)前的開發(fā)環(huán)境中,“Vibe Coding”成為新趨勢,要求AI不僅能補全代碼,更能理解開發(fā)者的意圖流(Flow),實現(xiàn)從自然語言到復(fù)雜工程邏輯的無縫轉(zhuǎn)化。

      DeepSeek似乎已經(jīng)準備好在新賽道上狂飆了。

      02

      如果深入梳理DeepSeek團隊以及核心人物梁文鋒在R1發(fā)布之后這一年里的學(xué)術(shù)軌跡,我們會發(fā)現(xiàn)一條清晰且扎實的技術(shù)演進路線。

      這些公開發(fā)表的論文與技術(shù)報告,不僅是對過去成果的總結(jié),更是V4強大能力的注腳與預(yù)演。

      2025年9月,DeepSeek-R1的相關(guān)論文成功登上了頂級學(xué)術(shù)期刊《Nature》的封面,梁文鋒署名通訊作者。

      面對審稿人關(guān)于是否使用了OpenAI模型輸出進行蒸餾訓(xùn)練的尖銳質(zhì)疑,DeepSeek團隊在回應(yīng)中給出了明確的否認,并首次公開了令人咋舌的低成本數(shù)據(jù):從V3-Base訓(xùn)練到R1,僅花費了29.4萬美元。

      當(dāng)然,這個成本僅指R1的后訓(xùn)練階段成本,不包含V3-Base基礎(chǔ)模型本身約600萬美元的訓(xùn)練投入。

      數(shù)據(jù)公開后,以及《Nature》為此專門撰寫的社論,標志著DeepSeek在學(xué)術(shù)嚴謹性和技術(shù)原創(chuàng)性上獲得了國際最高認可,徹底洗刷了外界對于中國大模型“套殼”或“跟隨”的刻板印象。

      不過,真正能佐證DeepSeek-V4在代碼方面有大幅突破的證據(jù),是2025年最后一天,DeepSeek團隊發(fā)表的論文《mHC:流形約束超連接》。

      代碼生成任務(wù)對模型的邏輯深度和上下文跨度有著極高的要求,這通常需要更大規(guī)模的模型參數(shù)和更深的網(wǎng)絡(luò)結(jié)構(gòu)。

      然而,傳統(tǒng)的超連接(Hyper-Connections)架構(gòu)在模型規(guī)模擴大時,會面臨嚴重的信號增益問題,最終導(dǎo)致訓(xùn)練過程極不穩(wěn)定甚至崩潰。

      為了解決這一阻礙模型擴容的根本性物理難題,DeepSeek團隊在這篇論文中提出了一種全新的架構(gòu)mHC。

      簡單來說,它給狂奔的信號加了一道精密的閥門,將信號增益嚴格控制在1.6倍左右。

      論文數(shù)據(jù)顯示,在3B、9B乃至18B參數(shù)規(guī)模的模型測試中,應(yīng)用了mHC架構(gòu)的模型在BIG-BenchHard推理基準上提升了2.1%。

      這項由梁文鋒聯(lián)合署名的研究成果,實際上解決了大模型在“做大”和“做復(fù)雜”過程中的穩(wěn)定性難題。

      這意味著V4模型極有可能采用了這種全新的架構(gòu),從而在擁有更龐大參數(shù)量和更深層推理能力的同時,依然保持了高效的訓(xùn)練效率和極高的穩(wěn)定性。



      不僅如此,在2026年1月初,DeepSeek悄無聲息地將arXiV上的R1論文從原本的22頁大幅擴充至86頁。

      這多出來的60多頁內(nèi)容,詳盡地披露了R1的完整訓(xùn)練管線,包括冷啟動、推理導(dǎo)向的強化學(xué)習(xí)(RL)、拒絕采樣與再微調(diào)、以及對齊導(dǎo)向的強化學(xué)習(xí)這四個關(guān)鍵步驟。

      業(yè)界普遍推測,這種在春節(jié)前夕“清庫存”式的技術(shù)披露,往往預(yù)示著下一代更強大的技術(shù)已經(jīng)成熟。

      既然R1的技術(shù)細節(jié)已經(jīng)不再是核心壁壘,那么即將到來的V4必然擁有了更高維度的護城河。

      03

      就在2026年的元旦,另一股來自量化界的力量也加入了戰(zhàn)局。

      由九坤投資創(chuàng)始團隊發(fā)起成立的至知創(chuàng)新研究院(IQuestResearch),發(fā)布了名為IQuest-Coder-V1的開源代碼大模型。我們曾在文章《又是量化基金,第二個DeepSeek時刻到來了?》中對其進行了報道。

      這支同樣出身于量化背景的團隊,他們僅有40B參數(shù)的模型,在SWE-benchVerified測試中斬獲了81.4%的高分,一舉達到了Claude和ChatGPT的水平。

      而在Vibe Coding的戰(zhàn)場上,國內(nèi)互聯(lián)網(wǎng)大廠的動作同樣不容小覷。

      字節(jié)跳動的豆包在2025年初就推出了Trae編程工具,并在AI編程功能上實現(xiàn)了HTML預(yù)覽、Python運行和完整項目生成等能力,讓開發(fā)者可以在一個界面內(nèi)完成從構(gòu)思到部署的全流程。

      阿里的通義千問則在12月26日更新到了Qwen Code v0.5.0版本。

      此次更新的最大亮點就是支持在終端窗口中同時運行四個Qwen Code實例,可并行處理智能問答、實時翻譯、原型設(shè)計、創(chuàng)意繪圖等不同任務(wù),實現(xiàn)了AI編程“跳出命令行”的突破。

      不過,真正引發(fā)行業(yè)震動的,是豆包在硬件終端上的突破性嘗試。

      2025年12月1日,字節(jié)跳動與中興通訊合作推出了搭載豆包手機助手的努比亞M153工程樣機,售價3499元,首批約3萬臺在當(dāng)天迅速售罄,甚至在二手市場炒出了高價。

      這款手機助手的核心能力在于跨應(yīng)用操作。用戶只需用自然語言下達指令,AI就能自動跳轉(zhuǎn)多個應(yīng)用完成點外賣、訂機票、比價購物等復(fù)雜任務(wù)。

      這一系列動作背后,折射出的是AI大模型從云端走向終端、從工具走向入口的戰(zhàn)略轉(zhuǎn)型。

      說不定DeepSeek手機也不遠了。



      與此同時,資本市場也迎來了大模型行業(yè)的收獲季。

      曾經(jīng)歷過“百模大戰(zhàn)”喧囂的中國AI行業(yè),正在加速向頭部收斂。智譜AI和MiniMax這兩家公司均已成功上市。

      智譜是1月8日在港交所敲的鐘,發(fā)行價定在116.2港元/股,上市第一天就給了市場一個驚喜 —— 開盤120港元,收盤131.5港元,第一天就漲了13.17%,市值一下子沖到578.9億港元,成了 “全球大模型第一股”。

      第二天開盤直接137.2港元起,收盤158.6港元,較首日收盤價又漲了20.6%,市值也跟著漲到698.21億港元,兩天下來從發(fā)行價算已經(jīng)漲了快37%,完全沒給空頭機會。

      MiniMax比智譜晚一天,但風(fēng)頭更勁。發(fā)行價165港元/股,而且是頂格定價,上市前一天的暗盤就已經(jīng)漲了25%-29%,報205.60-212.60港元。

      上市當(dāng)天開盤235.4港元,漲了42.7%,之后一路飆升,盤中最高到351.8港元,最終收盤345港元,較發(fā)行價暴漲 109.09%,市值來到1054億港元,成了千億市值俱樂部新成員。

      雖然高額的研發(fā)投入使得兩家公司目前仍處于虧損狀態(tài),但強勁的增長曲線證明了市場對于高質(zhì)量AI模型的付費意愿正在形成。

      中國AI方興未艾,但當(dāng)全球目光已經(jīng)再次聚焦到DeepSeek身上。一年前那個用低成本路徑顛覆行業(yè)認知的團隊,即將在春節(jié)期間交出新的答卷。

      DeepSeek能否第二次“震驚全世界”,只要再等幾天就會知曉。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      廣東外援東莞樂活:薩林杰跳舞開心,奎因逛街變靚仔

      廣東外援東莞樂活:薩林杰跳舞開心,奎因逛街變靚仔

      老贃是個手藝人
      2026-02-09 16:41:56
      廣州綠皮火車走紅,是因為窮還是為了情懷?

      廣州綠皮火車走紅,是因為窮還是為了情懷?

      八桂知事
      2026-02-08 13:10:27
      怒批沒教養(yǎng)!基恩炮轟曼城:這是英超最大恥辱

      怒批沒教養(yǎng)!基恩炮轟曼城:這是英超最大恥辱

      瀾歸序
      2026-02-09 07:34:09
      不可錯過!2月9日晚16:00比賽!中央5套CCTV5、CCTV5+直播節(jié)目表

      不可錯過!2月9日晚16:00比賽!中央5套CCTV5、CCTV5+直播節(jié)目表

      皮皮觀天下
      2026-02-09 11:17:38
      原來有了男朋友后免疫系統(tǒng)真的會改變?網(wǎng)友:互換身體優(yōu)缺點

      原來有了男朋友后免疫系統(tǒng)真的會改變?網(wǎng)友:互換身體優(yōu)缺點

      另子維愛讀史
      2026-02-08 19:47:35
      滬指漲逾1% 上漲個股超4500只

      滬指漲逾1% 上漲個股超4500只

      財聯(lián)社
      2026-02-09 10:02:53
      油價大跌超1.74元/升,創(chuàng)新低的油價,2026年已“連漲290元/噸”

      油價大跌超1.74元/升,創(chuàng)新低的油價,2026年已“連漲290元/噸”

      油價早知道
      2026-02-08 01:51:14
      不要再隨意猜測楊蘭蘭的身份了,釋放的信號很明顯了

      不要再隨意猜測楊蘭蘭的身份了,釋放的信號很明顯了

      李昕言溫度空間
      2025-08-20 15:01:53
      武則天男寵三大硬性條件曝光:帥僅是入門,第三項卡死90%的人

      武則天男寵三大硬性條件曝光:帥僅是入門,第三項卡死90%的人

      千秋文化
      2026-01-31 21:13:29
      趁你病要你命?美上將叫囂軍事打擊伊朗:這是滅掉它的歷史機遇

      趁你病要你命?美上將叫囂軍事打擊伊朗:這是滅掉它的歷史機遇

      寄星夜幕星河
      2026-02-09 16:52:38
      太寒磣了!中山一3000多人電子廠舉辦年會,讓員工吃自助餐引爭議

      太寒磣了!中山一3000多人電子廠舉辦年會,讓員工吃自助餐引爭議

      科學(xué)發(fā)掘
      2026-02-09 12:25:19
      為何中國軍力嚇不倒日本,石破茂說得一針見血,還會走老路的

      為何中國軍力嚇不倒日本,石破茂說得一針見血,還會走老路的

      瑛派兒老黃
      2025-12-02 21:11:13
      小泉進次郎83歲的老父親,作為日本前首相,對高市早苗評價8個字

      小泉進次郎83歲的老父親,作為日本前首相,對高市早苗評價8個字

      南權(quán)先生
      2025-12-24 16:54:55
      直沖26℃!湖南將迎大升溫!

      直沖26℃!湖南將迎大升溫!

      湖南法治報
      2026-02-09 14:56:32
      高市早苗勝局已定!駐臺代表拋出重磅炸彈,中方早做打算為妙

      高市早苗勝局已定!駐臺代表拋出重磅炸彈,中方早做打算為妙

      東方點兵
      2026-02-09 16:49:44
      2023年,聯(lián)邦法院裁定——李昌鈺偽造證據(jù)罪名成立。

      2023年,聯(lián)邦法院裁定——李昌鈺偽造證據(jù)罪名成立。

      百態(tài)人間
      2026-02-07 15:38:20
      千萬別戴著它跳!米蘭冬奧會速降滑雪冠軍稱金牌已損壞

      千萬別戴著它跳!米蘭冬奧會速降滑雪冠軍稱金牌已損壞

      懂球帝
      2026-02-09 12:58:17
      大巴車風(fēng)生水起,廣東城際陷入困局

      大巴車風(fēng)生水起,廣東城際陷入困局

      小虎新車推薦員
      2026-02-09 03:11:29
      二婚嫁給導(dǎo)演,三婚再嫁給富商,58歲的她怎樣了?

      二婚嫁給導(dǎo)演,三婚再嫁給富商,58歲的她怎樣了?

      鋒哥與八卦哥
      2026-02-05 17:21:45
      三年素顏無人問,領(lǐng)導(dǎo)一句“化妝吧”,隔天全公司笑不活了!

      三年素顏無人問,領(lǐng)導(dǎo)一句“化妝吧”,隔天全公司笑不活了!

      夜深愛雜談
      2026-01-19 20:05:51
      2026-02-09 17:51:00
      字母榜 incentive-icons
      字母榜
      讓未來不止于大。
      2219文章數(shù) 8042關(guān)注度
      往期回顧 全部

      科技要聞

      馬斯克終于想通了:先去月球“刷經(jīng)驗”

      頭條要聞

      女子1個月結(jié)2次婚周旋在倆"老公"之間 孩子是第3人的

      頭條要聞

      女子1個月結(jié)2次婚周旋在倆"老公"之間 孩子是第3人的

      體育要聞

      創(chuàng)中國冬奧最佳戰(zhàn)績!19歲速滑新星含淚向天拉勾

      娛樂要聞

      李亞鵬暫停直播:將投入嫣然醫(yī)院工作

      財經(jīng)要聞

      文玩假拍騙局調(diào)查:3500元瓷瓶估值300萬

      汽車要聞

      長安將搭鈉電池 好比汽車要裝柴油機?

      態(tài)度原創(chuàng)

      家居
      教育
      游戲
      房產(chǎn)
      手機

      家居要聞

      山院煥新 雅聚悅親朋

      教育要聞

      別只等3月內(nèi)卷,抓住“春招提前批”的黃金窗口!

      網(wǎng)友為《生化5》"種族歧視"平反:非洲背景當(dāng)然殺黑人

      房產(chǎn)要聞

      海南又一千億級賽道出現(xiàn),京東、華潤、中石化等巨頭率先殺入!

      手機要聞

      消息稱華為Pura X2預(yù)計會是首臺闊大折疊手機,升級麒麟9030芯片和長焦

      無障礙瀏覽 進入關(guān)懷版