<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      DeepSeek-V4雖遲但到!百萬上下文成標配 華為昇騰和英偉達均被寫進其技術報告

      0
      分享至

      財聯社4月24日訊(記者 付靜)今日上午深度求索官宣,全新系列模型DeepSeek-V4的預覽版本正式上線并同步開源,API服務也已同步更新。據稱,DeepSeek-V4擁有百萬字超長上下文,在Agent能力、世界知識和推理性能上均實現了國內與開源領域的領先,深度求索官方稱“邁入百萬上下文普惠時代”。

      DeepSeek可謂2025年科技圈的“頂流”,今年初曾有消息傳出DeepSeek-V4將在今年春節前后發布,一時間業內討論度升溫,大模型行業競爭也空前激烈,新產品扎堆上線、C端營銷玩法豐富、新概念層出不窮、技術譜系加速擴展。不過時至今日,DeepSeek-V4才終于亮相。

      “每家廠商看它其實都有壓力?!币晃婚L期與幾家國產模型廠商、互聯網大廠合作的AI產業鏈人士向財聯社記者如此形容DeepSeek。

      財聯社記者此前多方采訪獲悉,通過接入DeepSeek并將其與多款國產大模型進行協同應用,國內不少垂類平臺、場景實現了成本與效率的兼顧。因此DeepSeek的下一代旗艦模型也受到用戶期待,其中,DeepSeek-V4的上下文長度、Agent能力、推理成本、AI編程能力、多模態能力、模型參數維度等均是行業關注重點。

      DeepSeek時刻再到來

      深度求索方面介紹,DeepSeek-V4模型按大小分為DeepSeek-V4-Pro、DeepSeek-V4-Flash兩個版本,上下文長度均為1M(一百萬)?!皬默F在開始,1M上下文將是DeepSeek所有官方服務的標配?!?/p>


      DeepSeek-V4-Pro的最大亮點在于Agent能力大幅提高。在Agentic Coding評測中,V4-Pro已達到當前開源模型最佳水平,目前DeepSeek-V4已成為公司內部員工使用的Agentic Coding模型,據評測反饋使用體驗優于Sonnet 4.5,交付質量接近Opus 4.6非思考模式,但仍與Opus 4.6思考模式存在一定差距。

      同時,DeepSeek-V4-Pro在世界知識測評中,大幅領先其他開源模型,僅稍遜于閉源模型Gemini-Pro-3.1。推理性能方面,其在數學、STEM、競賽型代碼的測評中超越了當前所有已公開評測的開源模型,取得了比肩世界頂級閉源模型的優異成績。

      相比之下,DeepSeek-V4-Flash則被稱為是“更快捷高效的經濟之選”,模型參數和激活更小。

      值得關注的是DeepSeek-V4的結構創新。

      據稱,DeepSeek-V4開創了一種全新的注意力機制,在token維度進行壓縮,結合DSA稀疏注意力(DeepSeek Sparse Attention),實現長上下文能力,并且相比于傳統方法大幅降低了對計算和顯存的需求。

      財聯社記者還注意到,深度求索罕見地將華為昇騰和英偉達共同寫進DeepSeek-V4技術報告:“我們在英偉達GPU和華為昇騰NPU平臺上驗證了細粒度EP(專家并行)方案?!?/p>


      DeepSeek表示,受限于高端算力,目前DeepSeek-V4-Pro的服務吞吐十分有限,預計下半年昇騰950超節點批量上市后,Pro的價格會大幅下調。

      DeepSeek-V4的亮點還在于Agent能力,其針對Claude Code 、OpenClaw、OpenCode、CodeBuddy等主流Agent進行了適配和優化,在代碼任務、文檔生成任務等方面表現均有提升。

      財聯社記者注意到,自今年1月以來,前述的DeepSeek-V4部分技術創新點已經被“劇透”。

      2月11日,DeepSeek的App端和網頁端已經悄然開始灰度測試一項重大升級。財聯社記者實測了解到,模型上下文窗口長度直接增至1M token。DeepSeek稱,“一次性讀完《三體》三部曲沒問題,70萬個中文字符以內隨便發。”此外,版本模型知識庫截止時間更新至2025年5月。


      2月11日灰度測試版DeepSeek的回復

      在此之前,DeepSeek還罕見地連發兩篇論文,公司創始人梁文鋒均署名參與。

      其中,第一篇論文公開的mHC(Manifold-Constrained Hyper-Connections,流形約束超連接),解決了大規模模型訓練中的穩定性問題;第二篇論文提出了名為Engram(條件記憶)的全新模塊,其顛覆性在于實現了適配超長上下文場景的“存算分離”。DeepSeek實測數據顯示,即使掛載了100B(千億)參數的Engram表到CPU內存,相比于純GPU推理,吞吐量的下降不到3%。

      野村證券在一份研報中預測,V4在技術路徑上將融合mHC和Engram,其技術突破將有效打破“芯片墻”與“內存墻”的桎梏。

      據了解,DeepSeek的V系列是通用大模型的主線迭代版本,擅長百科、寫作、代碼生成等常規任務,響應速度快。2024年初、年中、年末,DeepSeek-V1、V2、V3分別上線。DeepSeek的R系列則側重推理增強,擅長數學、物理、邏輯謎題等需要分步思考的任務,會展示詳細的“思維鏈”。去年1月22日,DeepSeek-R1相關論文發布。

      從DeepSeek迭代進展看,去年V系列先后完成小版本升級(版本號DeepSeek-V3-0324)、發布DeepSeek-V3.1、更新至DeepSeek-V3.1-Terminus版本、發布DeepSeek-V3.2-Exp模型(實驗性版本)、發布正式版DeepSeek-V3.2和DeepSeek-V3.2-Speciale等動作。

      值得一提的是,目前DeepSeek仍未上線多模態能力,專注于純文本和語音交互。

      此前,財聯社記者與灰度測試版DeepSeek對話,其表示,自身還不具備“原生”的多模態理解能力。財聯社記者進一步詢問當前版本號,其回應:“關于我目前的具體版本,情況有些特殊:這次更新后,我并沒有一個像V4或R1那樣具體的版本號?!?/p>


      2月14日灰度測試版DeepSeek的回復

      AI產品經理張亮告訴財聯社記者,“未來要實現AGI,AI大模型一定是多模態融合的方向,這是一個共識。多模態于DeepSeek而言可能是繞不過去的一個能力,未來不僅僅是要理解文本,還能理解圖片、視頻甚至物理事件?!?/p>

      行業將迎新一輪“洗牌”?

      深度求索官方在DeepSeek-V4官宣文稿的最后,提到一句出自《荀子·非十二子》的“不誘于譽,不恐于誹,率道而行,端然正己?!?/p>

      過去幾個月,業內不斷傳出DeepSeek-V4“跳票”、公司人才流失嚴重、對外尋求融資、去CUDA化等消息?!敦斀洝冯s志今日上午發布的獨家消息稱,DeepSeek計劃融資18億美元,投資方為阿里和騰訊。

      一向較為低調的深度求索似乎用上述16個字做出了回應,背后深意值得品味。

      那么,DeepSeek-V4的問世,是否可能引發行業的新一輪洗牌?

      在張亮看來,會不會引發新一輪洗牌,重點還是看DeepSeek-V4整個范式、代際上是否有重大提升。他提到,參考去年備受矚目的DeepSeek-R1,思維鏈和推理成本大幅下降就是明顯的兩點提升。

      不過IDC中國研究總監盧言霞則告訴財聯社記者,這款?被寄予厚望的新品“談不上會對市場格局帶來大的洗牌,因為DeepSeek已經是數一數二了。”

      此前,盧言霞表示,面對DeepSeek-V4,幾家大廠“一定會有壓力”。原因在于,DeepSeek是開源模型,而當前行業企業用戶傾向于私有化部署,一般會選擇開源模型?!八匀绻鸇eepSeek繼續保持技術領先優勢,那它有望成為事實上的Top1大模型?!?/p>

      財聯社記者也從業內獲悉,隨著模型上限不斷接近、模型更迭更加頻繁,各廠商如何結合自身優勢,借勢模型能力的提升鞏固生態占位,或將是下半場競爭的核心。

      回顧2025年初,憑借著開源和低成本的優勢,DeepSeek曾打破了原有市場格局,科技巨頭和頭部初創模型廠商紛紛感受到壓力。

      2026年則更像是中國AI模型產品“大年”。

      2月,或是由于業內傳言DeepSeek-V4即將發布消息,國內幾家科技巨頭趁著春節再度打響流量入口戰。從成效來看,各廠商的營銷投入推動了AI應用普及,豆包、元寶、千問與DeepSeek均躋身“月活躍用戶(MAU)億級俱樂部”。

      同時,在產品層面,字節跳動視頻生成模型Seedance 2.0、圖像模型Seedream 5.0 Lite引發廣泛關注,2月14日豆包大模型2.0正式發布。除夕夜,阿里還開源了新一代千問Qwen3.5模型。

      幾乎同一時間,幾家模型廠商也拋出重磅炸彈,Kimi K2.5、GLM-5、MiniMax M2.5等模型密集發布。

      而在本月,包括Qwen3.6-Plus、Xiaomi MiMo-V2.5、Hy3 preview在內的多款模型也發布。

      技術譜系加速擴展

      財聯社記者觀察到,自ChatGPT引爆此輪人工智能浪潮以來,產業創新迭代令人應接不暇,各頭部廠商均在持續刷新各方向SOTA(state-of-the-art,當前最高水平)、加速推動技術譜系擴展,特別是上下文、Agent能力等方面在近期受到關注。

      上下文(Context)方面,從行業進展看,谷歌Gemini系列于2024年最早支持百萬級超長上下文,今年2月發布的Claude Opus 4.6剛剛實現此能力。

      2月初,騰訊首席AI科學家姚順雨執掌AI之后的第一項公開署名研究發布,同樣聚焦上下文。其團隊指出,“要讓大模型學會從上下文中學習,遠比我們想象的要難。并且,即便抹平了上下文帶來的信息差,模型也未必能解決問題,這說明模型在上下文利用上,依然存在顯著的能力短板。”

      Agent方面,開源AI智能體OpenClaw“龍蝦”成為現象級產品,即便并非是一款適合普通消費者的產品,但也推動了智能體的普及。

      “3月開始‘龍蝦’爆火,4月很快就回歸了理性,熱度有所下降,不過產品的演化速度其實一點都沒有降低。我們的初步結論就是,‘龍蝦’所帶來的智能體的技術革命是不可逆轉的。”英特爾中國區技術部總經理高宇對財聯社記者表示。

      Skills方面同樣熱度不低。

      Agent Skills由元數據(簡要描述)、可配置腳本、執行模板和詳細說明等構成,支持復雜工作流的打包與復用,關鍵優勢在于可控性,通過結構化能力模塊與思維鏈編排機制,使大模型具備可控、可復用、可持續優化的研究執行能力,已應用于不少垂類場景,眾多廠商正在打造AI Skill生態,涉及智能搜索、視頻快剪、游戲輔助、安全護欄等多個場景。

      此前,財聯社記者從金融科技服務商進門方面了解到,其AI產品“進寶”的“投研大腦”能力就類似于Agent Skills。“從行業進化角度看,Skills將推動AI應用從通用聊天走向領域專家;通過將特定工作流程固化為可復用的模塊,解決了通用模型懂道理卻不會按你的規矩干活的核心痛點;讓行業競爭壁壘從比拼基礎模型大小,轉向比拼高質量、專業化Skills生態的構建。”該公司CTO姜銳鋒介紹。

      DeepSeek在多領域“出圈”

      當前,2025年科技圈“頂流”DeepSeek的能力已在多領域“出圈”。

      DeepSeek-V3上線后,隨后DeepSeek-R1在去年春節前夕橫空出世,引發全球關注,英偉達市值單日蒸發5930億美元。從隨后各廠商擁抱“頂流”的進展看,去年春節期間由科技公司打頭陣,三大運營商、阿里、騰訊、字節、百度等旗下云平臺、應用端產品等率先接入DeepSeek-R1/V3,隨后各地政府、央國企等也均在加速適配DeepSeek。

      站在垂類應用視角,“不管是從歸納總結還是生成最終的回復上,DeepSeek對于投研行業的適配度還是很高的?!苯J鋒介紹,其公司的AI產品方案更多地是多模型協同完成,包括用DeepSeek完成語義路由的能力,匹配最能解決用戶問題的投研思維鏈,用Kimi k2.5處理投研工具的調用,讓豆包模型對工具返回結果做裁剪,最終由DeepSeek來匯總輸出。這不僅解決了單一模型的能力問題,更通過分工隱含地兼顧了成本與效率。

      野村證券研報此前也指出,預計mHC和Engram的結合將讓DeepSeek-V4更適合醫療、法律、金融等知識密集型領域的行業大模型訓練。

      軟件領域,去年上半年,財聯社記者在調研某A股軟件公司時注意到其辦公室內部墻壁上張貼的業務建議中提到,所有工作的目標和內容都關聯到DeepSeek,所有工作的過程和方法都充分運用DeepSeek。


      圖片來源:財聯社記者/攝

      騰訊元寶去年12月發布的《元寶×DeepSeek年度報告》稱,自去年2月接入DeepSeek以來,元寶持續更新DeepSeek的最新模型,用戶規模逐步擴大,報告發布當天使用量達到新高,較年初增長超過100倍。目前,元寶在國內原生AI應用中處于前三的位置。

      硬件方面,一體機這一品類也因為DeepSeek走紅。據媒體不完全統計,截至去年2月底,就有超60家企業宣布基于DeepSeek推出一體機。市面上常見的一體機分為推理、訓推兩種,內置DeepSeek-R1 32B、70B、滿血版671B等不同尺寸模型。

      去年年中,OPPO方面透露,旗下人工智能助手“小布助手”系全球接入DeepSeek設備量最大的手機智能助理。

      站在開發者視角,張亮向財聯社記者提到這一群體對DeepSeek-V4的期待:開發者比較關注新模型在參數維度上是否更加全面。

      他介紹,千問在開發者群體中的應用范圍非常廣,是因為模型參數涉獵的范圍非常廣。“哪怕是一個非常低配的GPU,也能夠去找到對應參數的小模型去部署。但是DeepSeek是缺乏這樣的小模型參數的,對于中小企業、開發者不太友好?!?/p>

      此前,DeepSeek憑借開源策略和極致性價比,在全球建立了扎實口碑。而對于DeepSeek-V4,野村證券分析,其核心價值在于通過底層架構創新推動AI應用商業化落地,賦能本土算力硬件與AI應用雙向發展。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      中國第四艘航母官宣:是核動力!舷號19,命名大概率是“江蘇號”

      中國第四艘航母官宣:是核動力!舷號19,命名大概率是“江蘇號”

      諦聽骨語本尊
      2026-04-25 14:44:21
      中國拋得太及時,8500億美債沒人接盤。

      中國拋得太及時,8500億美債沒人接盤。

      流蘇晚晴
      2026-04-26 18:32:23
      1992年,陸定一問秦川:如果黨的一把手腐敗了,那么該由誰來管?

      1992年,陸定一問秦川:如果黨的一把手腐敗了,那么該由誰來管?

      阿器談史
      2026-04-26 14:13:38
      突發!南海055遵義艦實彈亮劍,疑似發射鷹擊-20震懾美日菲艦隊!

      突發!南海055遵義艦實彈亮劍,疑似發射鷹擊-20震懾美日菲艦隊!

      利刃號
      2026-04-26 18:36:56
      白宮晚宴槍擊案全網最全細節:特工疑與槍手互開數槍,特朗普在臺上十分淡定

      白宮晚宴槍擊案全網最全細節:特工疑與槍手互開數槍,特朗普在臺上十分淡定

      爆角追蹤
      2026-04-26 10:29:13
      南京一派出所副所長為完成查處任務,“設計”讓6名未成年人吸毒再查獲,一審獲刑5年

      南京一派出所副所長為完成查處任務,“設計”讓6名未成年人吸毒再查獲,一審獲刑5年

      封面新聞
      2026-04-26 17:18:07
      血虧8億!華晨宇直播崩潰大哭,云南拿地建樂園,臨門一腳被強拆

      血虧8億!華晨宇直播崩潰大哭,云南拿地建樂園,臨門一腳被強拆

      奇怪的鯊魚們
      2026-04-26 16:32:25
      世錦賽戰報:吳宜澤4-4,連爆大冷,3位80后大滿貫得主都被逼平了

      世錦賽戰報:吳宜澤4-4,連爆大冷,3位80后大滿貫得主都被逼平了

      求球不落諦
      2026-04-26 20:17:11
      外媒炸鍋了!當著日本航母的面,055竟然發射鷹擊-20?

      外媒炸鍋了!當著日本航母的面,055竟然發射鷹擊-20?

      凡知
      2026-04-26 21:00:16
      白宮開槍兇手是老師?網傳其剛在洛杉磯拿了“月度優秀教師”獎

      白宮開槍兇手是老師?網傳其剛在洛杉磯拿了“月度優秀教師”獎

      爆角追蹤
      2026-04-26 12:16:15
      老外震驚!中國饅頭橫掃歐美!不是文化輸出,是中國供應鏈贏麻了

      老外震驚!中國饅頭橫掃歐美!不是文化輸出,是中國供應鏈贏麻了

      魔都姐姐雜談
      2026-04-24 11:56:08
      去了趟海參崴,我的三觀被徹底刷新,除了美女多,一無是處!

      去了趟海參崴,我的三觀被徹底刷新,除了美女多,一無是處!

      老特有話說
      2026-04-26 15:56:03
      25歲女孩確診黑色素瘤僅5個月便離世,原本今年要訂婚……生前曾在腹部發現“巨大的腫瘤”

      25歲女孩確診黑色素瘤僅5個月便離世,原本今年要訂婚……生前曾在腹部發現“巨大的腫瘤”

      都市快報橙柿互動
      2026-04-26 19:45:19
      李提香:沒有人愿意輸球,如果保持這種狀態就不會贏得勝利

      李提香:沒有人愿意輸球,如果保持這種狀態就不會贏得勝利

      懂球帝
      2026-04-26 21:58:39
      44歲陳震現身北京車展,從網紅車評人到無人問津,現狀一點都不怨

      44歲陳震現身北京車展,從網紅車評人到無人問津,現狀一點都不怨

      林雁飛
      2026-04-25 17:14:49
      CBA官宣最佳陣容:胡金秋賀希寧領銜一陣 周琦張鎮麟領銜二陣

      CBA官宣最佳陣容:胡金秋賀希寧領銜一陣 周琦張鎮麟領銜二陣

      醉臥浮生
      2026-04-26 18:11:33
      日本政府圖謀出口二手武器,不斷突破“紅線”引擔憂

      日本政府圖謀出口二手武器,不斷突破“紅線”引擔憂

      參考消息
      2026-04-26 20:00:08
      這配速你能跟多久?薩維全馬破2完整配速,35公里后太恐怖

      這配速你能跟多久?薩維全馬破2完整配速,35公里后太恐怖

      全景體育V
      2026-04-26 19:24:48
      真相大白!那臺拉缸的張雪820RR返廠,經拆解后本人公布故障原因

      真相大白!那臺拉缸的張雪820RR返廠,經拆解后本人公布故障原因

      一盅情懷
      2026-04-26 15:32:03
      美國一旦霸權結束,一定會滅亡的三個國家,排第一的果然是它

      美國一旦霸權結束,一定會滅亡的三個國家,排第一的果然是它

      琴音繚繞回
      2026-04-25 07:21:31
      2026-04-26 22:43:00
      財聯社 incentive-icons
      財聯社
      以“準確、快速、權威、專業”為新聞準則,為投資者提供專業的投資資訊。
      712917文章數 1020437關注度
      往期回顧 全部

      科技要聞

      漲價浪潮下,DeepSeek推動AI“價格戰”

      頭條要聞

      以色列政壇重大變局 內塔尼亞胡迎來勁敵

      頭條要聞

      以色列政壇重大變局 內塔尼亞胡迎來勁敵

      體育要聞

      森林狼3比1掘金:逆境中殺出了多孫穆?!

      娛樂要聞

      僅次《指環王》的美劇,有第二季

      財經要聞

      事關新就業群體,中辦、國辦發文

      汽車要聞

      預售19.38萬元起 哈弗猛龍PLUS七座版亮相

      態度原創

      游戲
      藝術
      旅游
      健康
      教育

      3D區女神淪陷!蒂法胸口被加布料 玩家直呼失望

      藝術要聞

      總投資35億!汾酒集團太原的地標大樓,呈現白酒文化!

      旅游要聞

      東阿文旅煥新升級:東阿阿膠城牽手開心麻花開啟文旅融合新征程

      干細胞如何讓燒燙傷皮膚"再生"?

      教育要聞

      加速社會與數字斷連:為了“上岸”身不由己

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 姑娘视频在线观看中国电影| www.18av| 国产AV影院| 亚洲1区二区三区麻豆| 国产女主播免费在线观看| 精品九九在线| 亚洲gv天堂gv无码男同| 国产第一页屁屁影院| 亚洲无av在线中文字幕| 国产精品视频第一区二区三区| 成全高清在线播放电视剧| 老司机精品网| 亚洲成A∨人片在线网| 欧美日韩视频无码一区二区三| 胸大美女又黄的网站| 天天躁日日躁狠狠躁中文字幕| 沐川县| 国产一二视频| 2021少妇久久久久久久久久| 欧美v国产v亚洲v日韩九九| 人妻精品久久久久中文字幕69| mm1313亚洲国产电影精品| 亚洲1区二区三区麻豆| 在线观看AV热码| 色婷婷综合久久久久中文一区二区| 三级国产在线观看| 久久夜色精品国产欧美乱| 国产乱子伦精品免费视频| H色无码网站| 在线播放亚洲人成电影| 国产亚洲精品第一综合| 宿州市| 日韩精品久久一区二区三| 日日碰狠狠躁久久躁综合小说| 人妻有码av中文字幕久久琪| 国产精品久久久久久爽爽爽| 蕾丝av无码专区在线观看| 自慰无码一区二区三区| 日韩精品人妻中文字幕有| 亚洲视频在线观看免费视频| 亚洲色小说|