春節(jié)臨近,今年DeepSeek又要給世界一點(diǎn)震撼了。
![]()
外媒The Information消息稱,兩位直接了解該計(jì)劃的知情人士向其透露,2月中旬春節(jié)前后DeepSeek將發(fā)布V4,時(shí)間可能會(huì)調(diào)整。
DeepSeek-V4主打編碼能力,內(nèi)部初步測(cè)試結(jié)果顯示,已超越Anthropic的Claude、OpenAI的GPT系列等現(xiàn)有其它模型。
![]()
兩位知情人士還補(bǔ)充道,V4的核心突破還體現(xiàn)在兩個(gè)方面:
在超長(zhǎng)代碼提示詞的處理與解析上實(shí)現(xiàn)了關(guān)鍵突破。
在整個(gè)訓(xùn)練流程的全階段,其數(shù)據(jù)模式理解能力均未出現(xiàn)性能衰減,且較前代模型有顯著提升。
PS:AI模型的訓(xùn)練過程,要求模型反復(fù)從海量數(shù)據(jù)集中學(xué)習(xí)。但在實(shí)際操作中,隨著訓(xùn)練輪次的不斷增加,模型對(duì)數(shù)據(jù)模式的捕捉能力往往會(huì)出現(xiàn)衰減。對(duì)于擁有大量AI芯片儲(chǔ)備的開發(fā)者而言,解決這一問題的常規(guī)手段,是通過增加訓(xùn)練輪次來(lái)彌補(bǔ)性能損耗。
用戶在實(shí)際使用中很可能會(huì)發(fā)現(xiàn),V4生成的答案邏輯更清晰、結(jié)構(gòu)更規(guī)整。這表明,模型具備更強(qiáng)的深度推理能力,在處理復(fù)雜任務(wù)時(shí)的可靠性也將大幅提升。
值得一提的是,有網(wǎng)友注意到DeepSeek-V3.2論文中有提到他們用大模型競(jìng)技場(chǎng)平臺(tái)(ChatbotArena)進(jìn)行人類偏好評(píng)估。
所以,我們或許可以更早地在大模型競(jìng)技場(chǎng)上測(cè)試到該模型。
![]()
參考鏈接:https://www.theinformation.com/articles/deepseek-release-next-flagship-ai-model-strong-coding-ability?rc=jn0pp4
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.