DeepSeek V4預覽版上線，效率提升或成Agent成本破局關鍵

2026-04-24 18:42:38　來源: 三言科技

北京舉報

分享至

據(jù)字母AI報道，DeepSeek V4預覽版于近日上線并開源，幾乎同一天OpenAI也推出了GPT 5.5。V4分為Pro與Flash兩個版本，均支持百萬token超長上下文，總參數(shù)規(guī)模分別達到1.6T（激活49B）與284B（激活13B）。

在100萬token上下文場景下，V4 Pro的單token推理FLOPs僅為V3.2的27%，KV cache只有V3.2的10%。這意味著在處理超長材料時，V4不僅“能裝得下”，而且跑得更快、成本更低。不過V4目前并未配備原生多模態(tài)功能，這會限制其在視覺理解、圖表解析等場景的發(fā)揮。

字母AI搭建了簡易離線環(huán)境進行測試。第一個測試是給V4 Pro一組關于MCP、結構化輸出、工具調用、端側模型和推理服務的材料，讓其撰寫技術分析。V4 Pro沒有逐條復述材料，而是抓住了“Agent的競爭不只是模型參數(shù)，而是模型如何穩(wěn)定接入外部系統(tǒng)”這一主線，將結構化輸出理解為“讓模型說出機器能直接讀懂的話”，將MCP理解為“讓模型應用更容易接外部工具的標準接口”。

第二個測試是讓V4 Pro用Python寫一個本地命令行工具，用于管理每天收集的AI行業(yè)新聞線索，要求不聯(lián)網(wǎng)、不調用API，具備新增、查看、篩選、去重、自動打新聞價值分并導出markdown日報等功能。V4 Pro直接給出了可運行的小工具，支持錄入公司、標題、類型、來源、鏈接、時間、正文和核驗狀態(tài)，自動計算新聞價值分，并按“可直接引用”“需要繼續(xù)核實”“暫不采用”分類，導出的markdown按層級分組。

OpenRouter數(shù)據(jù)顯示，DeepSeek V3系列在2025年token消費超過7.27萬億，排名第五，僅次于Claude Sonnet 4、Gemini 2.0 Flash等模型。DeepSeek V3.2的調用量至今仍在OpenRouter榜單中名列前茅。

近期DeepSeek融資消息密集。最新報道顯示，DeepSeek正以超過200億美元估值尋求融資，阿里、騰訊等公司據(jù)稱正在洽談投資。V4的發(fā)布被視為這一融資節(jié)點上的重要抓手，其專注效率提升的邏輯，抓住了當前開發(fā)者群體最關心的部分。

Qwen、GLM、Kimi都在向Agentic Coding、工具調用和長任務執(zhí)行靠攏，Claude也已將企業(yè)知識工作和代碼工作流做成最重要的商業(yè)抓手。Anthropic今年2月披露，按當時收入節(jié)奏折算，公司年收入規(guī)模已達140億美元，過去三年收入每年都實現(xiàn)10倍以上增長。

V4的定位并非“模型新物種”，而是將“開源模型任務底座”提升到新高度。DeepSeek接下來需要回答的是，這張效率牌能否撐起一家200億美元公司的商業(yè)體量。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.