網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

春節(jié)震撼發(fā)布？DeepSeek V4 發(fā)布在即

2026-01-12 00:10:12　來(lái)源: 投行圈子

北京舉報(bào)

分享至

來(lái)源:Al Reinvent

據(jù)外媒 The Information 援引知情人士消息，中國(guó)頂級(jí)AI獨(dú)角獸DeepSeek即將在未來(lái)幾周內(nèi)發(fā)布其下一代人工智能模型——DeepSeek V4。據(jù)悉，該模型計(jì)劃于2月中旬農(nóng)歷新年期間正式上線，這似乎延續(xù)了該公司在春節(jié)期間發(fā)布重磅產(chǎn)品的傳統(tǒng)。

DeepSeek V4是繼2024年12月發(fā)布的V3模型后的又一次重大迭代。內(nèi)部基準(zhǔn)測(cè)試顯示，V4在編程任務(wù)上的表現(xiàn)已全面超越當(dāng)前市場(chǎng)上的兩大霸主——Anthropic的Claude系列以及OpenAI的GPT系列。

知情人士透露，V4在處理超長(zhǎng)編程提示方面取得了突破性進(jìn)展。這意味著它能更好地理解復(fù)雜的軟件項(xiàng)目架構(gòu)，為開(kāi)發(fā)者提供更精準(zhǔn)的代碼解析與生成。此外，用戶將明顯感受到V4的回答更具條理性和邏輯性，證明其底層推理能力得到了顯著增強(qiáng)。值得一提的是，V4攻克了“隨著訓(xùn)練次數(shù)增加性能衰退”這一行業(yè)難題，在數(shù)據(jù)模式理解上實(shí)現(xiàn)了質(zhì)的飛躍。

上周，DeepSeek CEO梁文鋒親自參與撰寫的論文發(fā)布，提出了一種名為mHC（流形約束超連接）的新架構(gòu)，旨在解決大規(guī)模模型訓(xùn)練中的不穩(wěn)定性問(wèn)題，為V4的性能提升奠定了理論基礎(chǔ)。

本周，DeepSeek在arXiv上低調(diào)更新了其上一代旗艦?zāi)Ｐ蚏1的論文，將頁(yè)數(shù)從22頁(yè)擴(kuò)充至86頁(yè)，毫無(wú)保留地公開(kāi)了訓(xùn)練全流程、超參數(shù)甚至失敗的嘗試。

回顧去年（2025年）1月20日，DeepSeek也是在春節(jié)前夕發(fā)布了引發(fā)全球熱議的R1模型。V4選擇在今年2月中旬的春節(jié)檔發(fā)布，被業(yè)界視為DeepSeek試圖再次制造“春節(jié)熱點(diǎn)”，以硬核技術(shù)搶占全球開(kāi)發(fā)者視線的戰(zhàn)略舉措。

目前，DeepSeek官方尚未對(duì)V4的具體發(fā)布日期作出回應(yīng)。

對(duì)此，您怎么看？

期待您在留言區(qū)文明理性發(fā)布高見(jiàn)，留言點(diǎn)贊最高的朋友，掃碼文末投行君微信，可以獲得投行圈子精美商務(wù)背包一個(gè)。

?感謝耐心閱讀，歡迎順手點(diǎn)個(gè)“在看”

我正在「投行圈子」和朋友們討論有趣的話題，你?起來(lái)吧？點(diǎn)擊閱讀原文，加入投行圈子知識(shí)星球。?

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.