網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

豆包 2.0 模型發(fā)布，全信息整理（全網(wǎng)最完整，另附 79 頁(yè) Model Card）

2026-02-14 15:11:50　來(lái)源: 賽博禪心

北京舉報(bào)

分享至

今天 Seed2.0 全系列正式發(fā)布
Seed2.0，也就是豆包大模型2.0（Doubao-Seed-2.0）

包括 Pro、Lite、Mini 三款通用 Agent 模型加一個(gè) Code 模型，圍繞 Agent 使用和大規(guī)模生產(chǎn)，做了系統(tǒng)性優(yōu)化

先看數(shù)據(jù)（本文里所有表格，都是我做的，好不好看?。。。?/p>

Seed2.0 核心評(píng)測(cè)數(shù)據(jù)總覽｜vs GPT-5.2 · Claude Opus-4.5 · Gemini-3 Pro

先一次過(guò)完核心部份：

多模態(tài)，數(shù)學(xué)與視覺(jué)推理 19 項(xiàng)基準(zhǔn) 12 項(xiàng)第一，視覺(jué)感知、文檔理解、長(zhǎng)上下文大部分基準(zhǔn) SOTA，EgoTempo 超過(guò)人類(lèi)分?jǐn)?shù)

LLM 科學(xué)能力，HealthBench 第一，SuperGPQA 超 GPT-5.2，整體與 Gemini 3 Pro、GPT-5.2 相當(dāng)；在深度研究上也取得了不俗的成績(jī)

代碼，有明顯進(jìn)步，部分高難基準(zhǔn)與國(guó)際領(lǐng)先模型仍有差距

已上線，豆包 App 選「專(zhuān)家」模式 / TRAE 選「Doubao-Seed-2.0-Code」，全系列 API 已上線火山引擎，價(jià)格較同級(jí) GPT 和 Claude 便宜一個(gè)數(shù)量級(jí)

Model Card 也有，同時(shí)發(fā)布的還有一份 79 頁(yè)的 Model Card，公眾號(hào)后臺(tái)回復(fù)「Seed2.0」，獲取這份 Model Card

先說(shuō)定價(jià)

Seed2.0 全系列的這四款模型，API 已上線火山引擎。以下為分段計(jì)費(fèi)中 ≤32k 輸入的價(jià)格，單位元/百萬(wàn) tokens，這里我也做了個(gè)對(duì)比圖：

價(jià)格對(duì)比（人民幣計(jì)價(jià)）

Pro（doubao-seed-2-0-pro-260215）旗艦全能，面向復(fù)雜推理與長(zhǎng)鏈路 Agent 任務(wù)
輸入 3.2 / 輸出 16 / 緩存命中 0.64

Lite（doubao-seed-2-0-lite-260215）均衡型，綜合能力超 Seed1.8，兼顧質(zhì)量與速度
輸入 0.6 / 輸出 3.6 / 緩存命中 0.12

Mini（doubao-seed-2-0-mini-260215）低時(shí)延高并發(fā)，256k 上下文，4 檔思考長(zhǎng)度
輸入 0.2 / 輸出 2 / 緩存命中 0.04

Code（doubao-seed-2-0-code-preview-260215）編程加強(qiáng)版，適配 Claude Code 等 IDE 工具鏈
輸入 3.2 / 輸出 16 / 緩存命中 0.64

四款模型均支持文字、圖片、視頻輸入，文字輸出

token 定價(jià)，比海外模型低了約一個(gè)數(shù)量級(jí)。Agent 跑一次 workflow 消耗的 token 是人類(lèi)對(duì)話的幾十倍

在現(xiàn)實(shí)世界的復(fù)雜任務(wù)中，大規(guī)模推理與長(zhǎng)鏈路生成將消耗大量 token，這個(gè)成本變量會(huì)越來(lái)越重

火山引擎模型詳情頁(yè)：https://console.volcengine.com/ark/region:ark+cn-beijing/model/detail?Id=doubao-seed-2-0-pro

本次的優(yōu)化

Seed 團(tuán)隊(duì)分析了通用模型在 MaaS 服務(wù)中的真實(shí)調(diào)用情況

MaaS 調(diào)用場(chǎng)景分布

Seed 通用模型 MaaS 服務(wù)在中國(guó)大陸的調(diào)用場(chǎng)景分布，數(shù)據(jù)來(lái)自「火山方舟協(xié)作獎(jiǎng)勵(lì)計(jì)劃」

最高比例的需求是處理混雜圖表、文檔等非結(jié)構(gòu)化信息的知識(shí)內(nèi)容。企業(yè)端的典型模式：先讓模型做「讀得多、想得多」的任務(wù)，再進(jìn)入復(fù)雜且專(zhuān)業(yè)的流程型工作

基于這個(gè)真實(shí)需求，Seed2.0 重點(diǎn)優(yōu)化三個(gè)方向：

?更穩(wěn)健的視覺(jué)與多模態(tài)理解：復(fù)雜文檔、表格、圖形、視頻內(nèi)容的解析能力顯著提升
?更可靠的復(fù)雜指令執(zhí)行：多約束、多步驟、長(zhǎng)鏈路任務(wù)的理解與執(zhí)行能力強(qiáng)化
?更靈活的推理選擇：Pro、Lite、Mini 三檔加 Code 模型，覆蓋不同場(chǎng)景

除了生產(chǎn)級(jí)需求，Seed2.0 還在推高模型智能上限。目前已經(jīng)能從解決奧林匹克競(jìng)賽類(lèi)問(wèn)題邁向支持研究級(jí)推理，比如嘗試探索埃爾德什級(jí)別的數(shù)學(xué)問(wèn)題，也可以完成部分科學(xué)相關(guān)任務(wù)的編程工作

能解埃爾德什問(wèn)題和能幫你整理一堆掃描版合同，是兩種能力
Seed2.0 兩個(gè)都在做

多模態(tài)理解：大部分基準(zhǔn) SOTA 數(shù)學(xué)與視覺(jué)推理

Seed2.0 Pro 在 MathVista、MathVision、MathKangaroo、MathCanvas 等數(shù)學(xué)推理基準(zhǔn)上達(dá)到業(yè)界最優(yōu)水平。LogicVista、VisuLogic 等視覺(jué)解謎與邏輯推理基準(zhǔn)上，較 Seed1.8 顯著提升

數(shù)學(xué)與視覺(jué)推理評(píng)測(cè)數(shù)據(jù)

標(biāo)注 * 的數(shù)據(jù)引自公開(kāi)技術(shù)報(bào)告

視覺(jué)感知

VLMsAreBiased、VLMsAreBlind、BabyVision 等基準(zhǔn)中取得業(yè)界最高分。面對(duì)不同類(lèi)型的視覺(jué)輸入時(shí)仍能保持準(zhǔn)確且可信的感知和判斷能力

視覺(jué)感知與通用 VQA 評(píng)測(cè)數(shù)據(jù)

標(biāo)注 * 的數(shù)據(jù)引自公開(kāi)技術(shù)報(bào)告

文檔理解與長(zhǎng)上下文

模型面對(duì)的，往往是復(fù)雜版式混排的原始材料。相比 Seed1.8，處理非結(jié)構(gòu)化信息的能力顯著強(qiáng)化，ChartQAPro 與 OmniDocBench 1.5 達(dá)到頂尖水準(zhǔn)

長(zhǎng)上下文方面，DUDE、MMLongBench、MMLongBench-Doc 均取得業(yè)界最佳分?jǐn)?shù)

文檔理解與長(zhǎng)上下文評(píng)測(cè)數(shù)據(jù)

標(biāo)注 * 的數(shù)據(jù)引自公開(kāi)技術(shù)報(bào)告

視頻理解

時(shí)間序列與運(yùn)動(dòng)感知方面，TVBench、TempCompass、MotionBench 等關(guān)鍵測(cè)評(píng)處于領(lǐng)先位置

EgoTempo 超過(guò)人類(lèi)分?jǐn)?shù)（人類(lèi) 63.2，Seed2.0 Pro 71.8），對(duì)「變化、動(dòng)作、節(jié)奏」的捕捉更為穩(wěn)定

長(zhǎng)視頻場(chǎng)景中，Seed2.0 在大部分評(píng)測(cè)上超越了其他頂尖模型，可以高效準(zhǔn)確地處理小時(shí)級(jí)別的長(zhǎng)視頻。視頻工具 VideoCut 進(jìn)一步提高了長(zhǎng)視頻處理的時(shí)長(zhǎng)范圍和推理精度

流式實(shí)時(shí)視頻方面同樣表現(xiàn)優(yōu)異，能完成實(shí)時(shí)視頻流分析、環(huán)境感知、主動(dòng)糾錯(cuò)與情感陪伴，可應(yīng)用于健身、穿搭等場(chǎng)景

視頻理解評(píng)測(cè)數(shù)據(jù)

標(biāo)注 * 的數(shù)據(jù)引自公開(kāi)技術(shù)報(bào)告

LLM 與 Agent：真實(shí)長(zhǎng)程任務(wù)執(zhí)行能力提升

Seed 團(tuán)隊(duì)觀察到一個(gè)典型失衡：模型已經(jīng)可以順利解決競(jìng)賽難題，但放在真實(shí)世界中，依然很難端到端地完成實(shí)際任務(wù)，比如一次性構(gòu)建一個(gè)設(shè)計(jì)精良、功能完整的小程序

原因來(lái)自兩點(diǎn)。真實(shí)世界任務(wù)跨越更長(zhǎng)時(shí)間尺度、包含多個(gè)階段，現(xiàn)有 LLM Agent 難以自主構(gòu)建高效工作流。真實(shí)世界知識(shí)具有很強(qiáng)的領(lǐng)域壁壘且呈長(zhǎng)尾分布，各行業(yè)的經(jīng)驗(yàn)不在訓(xùn)練語(yǔ)料的高頻區(qū)

長(zhǎng)尾領(lǐng)域知識(shí)

Seed2.0 通過(guò)系統(tǒng)性加強(qiáng)長(zhǎng)尾領(lǐng)域知識(shí)來(lái)應(yīng)對(duì)

SuperGPQA 超過(guò) GPT-5.2，HealthBench 第一名，科學(xué)領(lǐng)域整體成績(jī)與 Gemini 3 Pro 和 GPT-5.2 相當(dāng)。FrontierSci 等 STEM 基準(zhǔn)表現(xiàn)突出，部分場(chǎng)景得分超過(guò) Gemini 3 Pro

LLM 科學(xué)能力評(píng)測(cè)數(shù)據(jù) 指令遵循

Seed2.0 保持較強(qiáng)的一致性與可控性，為 Agent 模型在長(zhǎng)鏈路、多步驟任務(wù)中嚴(yán)格按約束條件執(zhí)行奠定了基礎(chǔ)

指令遵循評(píng)測(cè)數(shù)據(jù) 深度研究

Seed2.0 在長(zhǎng)鏈路任務(wù)中表現(xiàn)突出，尤其擅長(zhǎng)連續(xù)完成「找資料、做歸納、寫(xiě)結(jié)論」這類(lèi)連續(xù)工作流

三項(xiàng)深度研究評(píng)測(cè)，Pro 和 Lite 都取得了不俗的成績(jī)

深度研究評(píng)測(cè)數(shù)據(jù) 真實(shí)世界任務(wù)

在具備直接經(jīng)濟(jì)價(jià)值的現(xiàn)實(shí)任務(wù)評(píng)測(cè)中，Seed2.0 在客服問(wèn)答、信息抽取、意圖識(shí)別、中小學(xué)階段問(wèn)題解答等高頻場(chǎng)景上表現(xiàn)穩(wěn)定。GDPVal-Diamond、XPert Bench 等復(fù)雜專(zhuān)業(yè)任務(wù)基準(zhǔn)上同樣取得有競(jìng)爭(zhēng)力的結(jié)果

真實(shí)世界任務(wù)評(píng)測(cè)數(shù)據(jù) 科學(xué)發(fā)現(xiàn)

FrontierSci-research 等前沿科研基準(zhǔn)上表現(xiàn)強(qiáng)勁，AInstein Bench 領(lǐng)先，體現(xiàn)出在科學(xué)發(fā)現(xiàn)場(chǎng)景中較強(qiáng)的假設(shè)驅(qū)動(dòng)式推理能力

科學(xué)發(fā)現(xiàn)評(píng)測(cè)數(shù)據(jù) 從研究想法到實(shí)驗(yàn)方案

Seed2.0 還能把「研究想法」推進(jìn)到「形成可落地的實(shí)驗(yàn)方案」

以高爾基體蛋白分析為例，模型把基因工程、小鼠模型構(gòu)建、亞細(xì)胞分離與多組學(xué)分析串成一條完整流程，細(xì)化到關(guān)鍵環(huán)節(jié)怎么做、用什么做對(duì)照排除污染、用哪些指標(biāo)評(píng)估純度

相關(guān)領(lǐng)域?qū)＜业姆答仯悍桨冈诳鐚W(xué)科的實(shí)驗(yàn)細(xì)節(jié)與步驟化表達(dá)上超出預(yù)期，能產(chǎn)出結(jié)構(gòu)清晰、科學(xué)上相對(duì)可靠、具有可執(zhí)行性的實(shí)驗(yàn)草案

高爾基體蛋白分析實(shí)驗(yàn)方案示例代碼：有進(jìn)步，有差距

端到端整體代碼生成、上下文學(xué)習(xí)方面取得了明顯進(jìn)步

Vibe Coding 及上下文評(píng)測(cè)數(shù)據(jù)

部分高難基準(zhǔn)上，與國(guó)際領(lǐng)先模型相比仍有提升空間

最后

除了火山 API 之外，Seed2.0 Pro 和 Code 還已分別上線：

? 豆包 App：選擇「專(zhuān)家」模式，開(kāi)啟對(duì)話
? TRAE：在「內(nèi)置模型」中選擇「Doubao-Seed-2.0-Code」

以及，火山的這個(gè)模型，也已上線方舟 Coding Plan，且首月低至 8.91 元

新春限時(shí)特惠 ?? 二月特別補(bǔ)貼

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.