<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      編程表現超越Claude和GPT?DeepSeek準備第二次震驚全世界

      0
      分享至


      本文來自微信公眾號:字母AI,作者:苗正,編輯:王靖,題圖來自:AI生成

      2025年7月,DeepSeek下載量從高峰期的8000多萬暴跌至2000多萬,下滑72.2%,“DeepSeek跌落神壇”成為當時互聯網最熱門的話題。

      但據多位知情人士透露,DeepSeek即將重登王座。他們計劃在2026年二月中旬發布新一代模型DeepSeek-V4。

      也就是在農歷2026年新年期間,距離上一代模型DeepSeek-R1的發布正好一年。

      這次發布的重點是代碼生成和處理能力。

      根據DeepSeek內部的基準測試,V4在編程任務上的表現超過了目前市場上的主流競品,包括Anthropic的Claude和OpenAI的GPT系列。

      據報道,在即將發布的新模型中,DeepSeek團隊解決了許多長期困擾AI發展的技術難題。很可能會徹底改變Vibe Coding產業。

      報道中提到一件事,“DeepSeek-V4模型在整個訓練過程中理解數據模式的能力也有所改進,且性能未出現衰減。”

      這句話有些難以理解,我們不妨拆開來解讀。

      首先是前半句,它指的是模型不再只是死記硬背數據,而是能看透數據背后的規律和邏輯。

      DeepSeek-R1有個具代表性的例子,就是讓模型數strawberry里有幾個r。

      由于當時的DeepSeek模型并不能理解“數”(count)這個概念,只能根據訓練時的數據來輸出答案。可這個數據恰好又是錯的,所以無論DeepSeek怎么思考,它給出的答案大多數情況都是2,而不是正確的3。

      而DeepSeek-V4則會徹底杜絕這個情況,前提是在訓練過程中讓模型徹底理解某一件事。

      后半句的性能退化,指的是在AI訓練中,隨著模型不斷學習新東西或訓練時間加長,往往會出現“學了新的忘了舊的”或模型變得不穩定的情況。

      這種現象在業內被稱為“災難性遺忘”(Catastrophic Forgetting)或“模型坍塌”(Model Collapse)。

      因此,V4在不斷變聰明、變復雜的過程中,依然保持了極高的穩定性和原有能力的完整性,沒有出現任何“副作用”或能力倒退。

      這恰恰是構建編程Agent的前置條件。

      在現代軟件工程中,一個微小的修改可能波及數個文件、數千行代碼的依賴關系。

      但是以往的模型往往受限于上下文窗口或注意力機制的衰減,無法對龐大的項目進行修改。

      V4極有可能是一個為“Agent時代”量身定制的模型。

      一年前,DeepSeek-R1 的發布確實在行業內引起了不小的波動。那款主打推理能力的模型證明了低成本研發路徑的可行性。

      然而,一年后的今天,人工智能行業的關注焦點已經發生了顯著轉移。單純的文本生成或邏輯推理已不再是唯一的競爭高地,代碼生成正在演變為大模型能力的“試金石”。

      在當前的開發環境中,“Vibe Coding”成為新趨勢,這要求AI不僅能補全代碼,更能理解開發者的意圖流(Flow),實現從自然語言到復雜工程邏輯的無縫轉化。

      DeepSeek似乎已經準備好在新賽道上狂飆了。

      如果深入梳理DeepSeek團隊以及核心人物梁文鋒在R1發布之后這一年里的學術軌跡,我們會發現一條清晰且扎實的技術演進路線。

      這些公開發表的論文與技術報告,不僅是對過去成果的總結,更是V4強大能力的注腳與預演。

      2025年9月,DeepSeek-R1的相關論文成功登上了頂級學術期刊《Nature》的封面,梁文鋒署名通訊作者。

      面對審稿人關于是否使用了OpenAI模型輸出進行蒸餾訓練的尖銳質疑,DeepSeek團隊在回應中給出了明確的否認,并首次公開了令人咋舌的低成本數據:從V3-Base訓練到R1,僅花費了29.4萬美元。

      當然,這個成本僅指R1的后訓練階段成本,不包含V3-Base基礎模型本身約600萬美元的訓練投入。

      數據公開后,《Nature》為此專門撰寫社論,這標志著DeepSeek在學術嚴謹性和技術原創性上獲得了國際最高認可,徹底洗刷了外界對于中國大模型“套殼”或“跟隨”的刻板印象。

      不過,真正能佐證DeepSeek-V4在代碼方面有大幅突破的證據,是2025年最后一天,DeepSeek團隊發表的論文《mHC:流形約束超連接》。

      代碼生成任務對模型的邏輯深度和上下文跨度有著極高要求,這通常需要更大規模的模型參數和更深的網絡結構。

      然而,傳統的超連接(Hyper-Connections)架構在模型規模擴大時,會面臨嚴重的信號增益問題,最終導致訓練過程極不穩定甚至崩潰。

      為了解決這一阻礙模型擴容的根本性物理難題,DeepSeek團隊在這篇論文中提出了一種全新的架構mHC。

      簡單來說,它給狂奔的信號加了一道精密的閥門,將信號增益嚴格控制在1.6倍左右。

      論文數據顯示,在3B、9B乃至18B參數規模的模型測試中,應用了mHC架構的模型在BIG-BenchHard推理基準上提升了2.1%。

      這項由梁文鋒聯合署名的研究成果,實際上解決了大模型在“做大”和“做復雜”過程中的穩定性難題。

      這意味著V4模型極有可能采用了這種全新的架構,從而在擁有更龐大參數量和更深層推理能力的同時,依然保持高效的訓練效率和極高的穩定性。

      不僅如此,在2026年1月初,DeepSeek悄無聲息地將arXiV上的R1論文從原本的22頁大幅擴充至86頁。

      多出來的60多頁內容詳盡披露了R1的完整訓練管線,包括冷啟動、推理導向的強化學習(RL)、拒絕采樣與再微調,以及對齊導向的強化學習這四個關鍵步驟。

      業界普遍推測,這種在春節前夕“清庫存”式的技術披露,往往預示著下一代更強大的技術已經成熟。

      既然R1的技術細節已經不再是核心壁壘,那么即將到來的V4必然擁有了更高維度的護城河。

      就在2026年的元旦,另一股來自量化界的力量也加入了戰局。

      由九坤投資創始團隊發起成立的至知創新研究院(IQuestResearch),發布了名為IQuest-Coder-V1的開源代碼大模型。我們曾在文章《又是量化基金,第二個DeepSeek時刻到來了?》中對其進行了介紹。

      這支同樣出身于量化背景的團隊,他們僅有40B參數的模型,在SWE-benchVerified測試中斬獲81.4%的高分,一舉達到了Claude和ChatGPT的水平。

      而在Vibe Coding的戰場上,國內互聯網大廠的動作同樣不容小覷。

      字節跳動的豆包在2025年初就推出了Trae編程工具,并在AI編程功能上實現了HTML預覽、Python運行和完整項目生成等能力,讓開發者可以在一個界面內完成從構思到部署的全流程。

      阿里的通義千問則在12月26日更新到了Qwen Code v0.5.0版本。

      此次更新的最大亮點就是支持在終端窗口中同時運行四個Qwen Code實例,可并行處理智能問答、實時翻譯、原型設計、創意繪圖等不同任務,實現了AI編程“跳出命令行”的突破。

      不過,真正引發行業震動的是豆包在硬件終端上的突破性嘗試。

      2025年12月1日,字節跳動與中興通訊合作推出了搭載豆包手機助手的努比亞M153工程樣機,售價3499元,首批約3萬臺在當天迅速售罄,甚至在二手市場炒出了高價。

      這款手機助手的核心能力在于跨應用操作。用戶只需用自然語言下達指令,AI就能自動跳轉多個應用完成點外賣、訂機票、比價購物等復雜任務。

      這一系列動作背后,折射出的是AI大模型從云端走向終端、從工具走向入口的戰略轉型。

      說不定,DeepSeek手機也不遠了。

      與此同時,資本市場也迎來了大模型行業的收獲季。

      曾經歷過“百模大戰”喧囂的中國AI行業,正在加速向頭部收斂。智譜AI和MiniMax這兩家公司均已成功上市。

      智譜是1月8日在港交所敲的鐘,發行價定在116.2港元/股,上市第一天就給了市場一個驚喜——開盤120港元,收盤131.5港元,第一天就漲了13.17%,市值一下子沖到578.9億港元,成了 “全球大模型第一股”。

      第二天開盤直接137.2港元起,收盤158.6港元,較首日收盤價又漲了20.6%,市值也跟著漲到698.21億港元,兩天下來,按發行價算已經漲了快37%,完全沒給空頭機會。

      MiniMax比智譜晚一天,但風頭更勁。發行價165港元/股,而且是頂格定價,上市前一天的暗盤就已經漲了25%~29%,報205.60~212.60港元。

      上市當天開盤235.4港元,漲了42.7%,之后一路飆升,盤中最高到351.8港元,最終收盤345港元,較發行價暴漲 109.09%,市值來到1054億港元,成了千億市值俱樂部新成員。

      雖然高額的研發投入使得兩家公司目前仍處于虧損狀態,但強勁的增長曲線證明了市場對于高質量AI模型的付費意愿正在形成。

      中國AI方興未艾,但當全球目光已經再次聚焦到DeepSeek身上。一年前那個用低成本路徑顛覆行業認知的團隊,即將在春節期間交出新的答卷。

      DeepSeek能否第二次“震驚全世界”,只要再等幾天就會知曉。

      本文來自微信公眾號:字母AI,作者:苗正

      本內容由作者授權發布,觀點僅代表作者本人,不代表虎嗅立場。如對本稿件有異議或投訴,請聯系 tougao@huxiu.com。

      本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4825140.html?f=wyxwapp

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      李亞鵬房東最新言論炸懵全網,一切都反轉了!

      李亞鵬房東最新言論炸懵全網,一切都反轉了!

      互聯網品牌官
      2026-01-20 14:56:01
      日本對中國最大的幫助是什么?

      日本對中國最大的幫助是什么?

      多村來信
      2026-01-21 11:26:09
      三評西貝風波,越描越黑

      三評西貝風波,越描越黑

      迷世書童H9527
      2026-01-21 11:53:45
      為支付安置項目工程款,13戶村民“被貸款”;當地回應:情況較復雜,正設法解決

      為支付安置項目工程款,13戶村民“被貸款”;當地回應:情況較復雜,正設法解決

      大風新聞
      2026-01-21 20:46:04
      英媒:伊朗抗議活動造成1.6萬人死亡,33萬人受傷,堪比種族滅絕

      英媒:伊朗抗議活動造成1.6萬人死亡,33萬人受傷,堪比種族滅絕

      史政先鋒
      2026-01-19 22:38:36
      網友分享柬埔寨中國大使館門口,躺著一群從園區逃出來的同胞

      網友分享柬埔寨中國大使館門口,躺著一群從園區逃出來的同胞

      映射生活的身影
      2026-01-21 20:41:36
      人去樓空、資金鏈斷裂!又一平臺暴雷,老板疑跑路,有人剛充上萬

      人去樓空、資金鏈斷裂!又一平臺暴雷,老板疑跑路,有人剛充上萬

      品牌觀察官
      2026-01-20 17:53:37
      淮陽人民中學“食堂承包商舉報校領導2年拿走300余萬現金”?官方通報

      淮陽人民中學“食堂承包商舉報校領導2年拿走300余萬現金”?官方通報

      界面新聞
      2026-01-21 10:11:25
      敢攔就開戰?美國給“臺獨”遞刀,中方:公海銷毀沒商量

      敢攔就開戰?美國給“臺獨”遞刀,中方:公海銷毀沒商量

      華山穹劍
      2026-01-19 21:32:59
      被特朗普威脅后,馬克龍又打起中國的主意,呼吁中方加大對歐投資

      被特朗普威脅后,馬克龍又打起中國的主意,呼吁中方加大對歐投資

      近史博覽
      2026-01-21 15:55:53
      突發! 中餐館20人死傷! IS發動炸彈恐襲, 宣稱中國公民為攻擊目標!

      突發! 中餐館20人死傷! IS發動炸彈恐襲, 宣稱中國公民為攻擊目標!

      澳洲紅領巾
      2026-01-21 12:39:50
      女子違停豎中指被撞社死!司機霸氣發聲,警方出手,這下麻煩大了

      女子違停豎中指被撞社死!司機霸氣發聲,警方出手,這下麻煩大了

      離離言幾許
      2026-01-21 20:42:06
      林志玲現身深圳!很多人偶遇

      林志玲現身深圳!很多人偶遇

      深圳晚報
      2026-01-21 10:32:00
      美政府首次回應“斬殺線”

      美政府首次回應“斬殺線”

      新京報政事兒
      2026-01-21 00:16:19
      亞足聯官宣!中國隊進決賽僅一天,傳來一個不利消息,想奪冠難了

      亞足聯官宣!中國隊進決賽僅一天,傳來一個不利消息,想奪冠難了

      侃球熊弟
      2026-01-21 17:59:41
      國資委公布7戶中央企業14名領導人員職務任免

      國資委公布7戶中央企業14名領導人員職務任免

      界面新聞
      2026-01-21 19:45:28
      聯賽第一!廣廈大勝北控豪取7連勝 胡金秋22+7布朗26+6

      聯賽第一!廣廈大勝北控豪取7連勝 胡金秋22+7布朗26+6

      醉臥浮生
      2026-01-21 21:25:51
      新榮記張勇對暴風雨中的賈國龍伸出援手

      新榮記張勇對暴風雨中的賈國龍伸出援手

      界面新聞
      2026-01-21 19:40:41
      國家下狠手了!體制內大地震,少爺、公主們的“天”,要塌了

      國家下狠手了!體制內大地震,少爺、公主們的“天”,要塌了

      霹靂炮
      2026-01-19 22:24:13
      水貝市場已禁售銅條

      水貝市場已禁售銅條

      財聯社
      2026-01-21 08:48:10
      2026-01-22 00:40:49
      虎嗅APP incentive-icons
      虎嗅APP
      個性化商業資訊與觀點交流平臺
      25639文章數 687357關注度
      往期回顧 全部

      科技要聞

      給機器人做仿真訓練 這家創企年營收破億

      頭條要聞

      西安高校創始人兩女兒爭繼承權 判完才發現公證書造假

      頭條要聞

      西安高校創始人兩女兒爭繼承權 判完才發現公證書造假

      體育要聞

      只會防守反擊?不好意思,我們要踢決賽了

      娛樂要聞

      首位捐款的明星 苗圃現身嫣然醫院捐款

      財經要聞

      丹麥打響第一槍 歐洲用資本保衛格陵蘭島

      汽車要聞

      2026款上汽大眾朗逸正式上市 售價12.09萬起

      態度原創

      家居
      教育
      房產
      旅游
      公開課

      家居要聞

      褪去浮華 觸達松弛與欣喜

      教育要聞

      數據顯示:本科生的學習更多停留在淺層

      房產要聞

      那個砸下400億的綠地,又要殺回海南了!

      旅游要聞

      不必跟風“殺豬宴”,鄉村旅游沒有“標準答案”|新京報專欄

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 嫖妓丰满肥熟妇在线精品| 99久久久精品免费观看国产| 国产日韩精品视频无码| 激情综合区| 中国Chinese男男网站| 偏关县| 国产自产V一区二区三区C| 免费国产高清在线精品一区| 农民人伦一区二区三区| 亚洲AV永久无码嘿嘿嘿嘿| 亚洲av午夜福利精品一级无| 羞羞影院午夜男女爽爽| 佛山市| 欧美最新精品videossexohd| 国产女人18毛片精品18水| 俺来也俺也啪www色| 国产精品久久久久久久专区| 国产精品久久久久aaaa| 国产精品久久久国产盗摄| 天天综合天天色| 新妺妺窝人体色7777婷婷| 国产美女裸体无遮挡免费视频| 在线看国产精品三级在线| 精品人妻伦九区久久aaa片| 中文字幕被公侵犯的漂亮人妻| 亚洲男人天堂2018| 绥阳县| 中文字幕一区二区三区日韩精品 | 欧美情侣性视频| 亚洲av麻豆aⅴ无码电影| 人妻资源站| 国产三级最新在线观看不卡| 肉色丝袜足j视频国产| 17岁日本免费bd完整版观看| 临夏市| 国产91特黄特色A级毛片| 成人性做爰aaa片免费看| 精品无码国产av一区二区三区| 美女毛片| 天天综合网网欲色| 猫咪AV成人永久网站在线观看|