據(jù)字母AI報道,DeepSeek V4預覽版于近日上線并開源,幾乎同一天OpenAI也推出了GPT 5.5。V4分為Pro與Flash兩個版本,均支持百萬token超長上下文,總參數(shù)規(guī)模分別達到1.6T(激活49B)與284B(激活13B)。
在100萬token上下文場景下,V4 Pro的單token推理FLOPs僅為V3.2的27%,KV cache只有V3.2的10%。這意味著在處理超長材料時,V4不僅“能裝得下”,而且跑得更快、成本更低。不過V4目前并未配備原生多模態(tài)功能,這會限制其在視覺理解、圖表解析等場景的發(fā)揮。
字母AI搭建了簡易離線環(huán)境進行測試。第一個測試是給V4 Pro一組關于MCP、結構化輸出、工具調用、端側模型和推理服務的材料,讓其撰寫技術分析。V4 Pro沒有逐條復述材料,而是抓住了“Agent的競爭不只是模型參數(shù),而是模型如何穩(wěn)定接入外部系統(tǒng)”這一主線,將結構化輸出理解為“讓模型說出機器能直接讀懂的話”,將MCP理解為“讓模型應用更容易接外部工具的標準接口”。
第二個測試是讓V4 Pro用Python寫一個本地命令行工具,用于管理每天收集的AI行業(yè)新聞線索,要求不聯(lián)網(wǎng)、不調用API,具備新增、查看、篩選、去重、自動打新聞價值分并導出markdown日報等功能。V4 Pro直接給出了可運行的小工具,支持錄入公司、標題、類型、來源、鏈接、時間、正文和核驗狀態(tài),自動計算新聞價值分,并按“可直接引用”“需要繼續(xù)核實”“暫不采用”分類,導出的markdown按層級分組。
OpenRouter數(shù)據(jù)顯示,DeepSeek V3系列在2025年token消費超過7.27萬億,排名第五,僅次于Claude Sonnet 4、Gemini 2.0 Flash等模型。DeepSeek V3.2的調用量至今仍在OpenRouter榜單中名列前茅。
近期DeepSeek融資消息密集。最新報道顯示,DeepSeek正以超過200億美元估值尋求融資,阿里、騰訊等公司據(jù)稱正在洽談投資。V4的發(fā)布被視為這一融資節(jié)點上的重要抓手,其專注效率提升的邏輯,抓住了當前開發(fā)者群體最關心的部分。
Qwen、GLM、Kimi都在向Agentic Coding、工具調用和長任務執(zhí)行靠攏,Claude也已將企業(yè)知識工作和代碼工作流做成最重要的商業(yè)抓手。Anthropic今年2月披露,按當時收入節(jié)奏折算,公司年收入規(guī)模已達140億美元,過去三年收入每年都實現(xiàn)10倍以上增長。
V4的定位并非“模型新物種”,而是將“開源模型任務底座”提升到新高度。DeepSeek接下來需要回答的是,這張效率牌能否撐起一家200億美元公司的商業(yè)體量。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.