<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>

色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3

<pre id="pvyf0"><p id="pvyf0"></p></pre><s id="pvyf0"></s>

<legend id="pvyf0"><li id="pvyf0"><menuitem id="pvyf0"></menuitem></li></legend>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

豆包2.0的目標，不是成為做題家

2026-02-15 10:06:51　來源: 字母榜

北京舉報

0

分享至

對于大模型，OpenAI、Anthropic、谷歌等全球頂尖的AI公司，都在不斷地強調模型的通用性，以及其涌現能力。可字節在豆包2.0上，卻來了一波“反向操作”。

字節跳動選擇了一條更務實的路徑。他們從真實業務場景倒推模型能力。

豆包團隊發現，企業用戶最高頻的需求不是解奧數題，而是處理混雜著圖表、文檔的非結構化信息，然后在這個基礎上完成多步驟的專業任務。

于是豆包2.0把優化重點放在了多模態理解、長上下文處理、指令遵循這些“不那么性感但很實用”的能力上。

這種路徑選擇可能更接近AGI的本質。

真正的通用智能不是在所有基準測試上都拿高分，而是能在真實世界各種雜七雜八的約束下，依然按要求完成任務。

一個能解IMO金牌題但無法完成企業報表分析的模型，和一個可以穩定完成業務流程的模型，哪個更“智能”？

豆包2.0的答案很明確。

我把這段話發給了豆包2.0，它回答我說

雖然有些阿諛奉承、迎風拍馬，但我們的觀點是相似的。

01

豆包2.0來了

就在2026年情人節這天，豆包更新了2.0版本。PC、網頁版、手機用戶都可以從對話框選擇“專家”模式，以開啟豆包2.0。

與此前版本相比，豆包2.0的核心變化在于從“能解題”轉向“能做事”——針對大規模生產環境的使用需求進行了系統性優化。

豆包2.0系列包含Pro、Lite、Mini三款通用Agent模型和一款 Code 模型。

豆包2.0Code 接入了AI編程產品TRAE，而火山引擎也同步上線了豆包2.0系列模型API服務。

從公開的基準測試數據來看，豆包2.0 Pro在多個維度上取得了有競爭力的成績。

豆包2.0在IMO、CMO 數學競賽和ICPC編程競賽中獲得金牌成績，在 Putnam基準測試上超越了Gemini 3 Pro。

在HLE-Text（人類的最后考試）這項綜合性評測中，豆包2.0 Pro得分54.2，在參與對比的模型中排名第一。

不過需要注意的是，基準測試成績與實際應用表現之間存在差異。

字節跳動團隊自己也承認，豆包2.0在端到端整體代碼生成、上下文學習等方面，與國際領先模型相比仍有提升空間。

這種坦誠的表態，比單純強調優勢更有說服力。

在科學領域知識測試中，豆包2.0的表現與Gemini 3 Pro和GPT-5.2處于同一水平線。

在SuperGPQA測試中，豆包2.0 Pro得分68.7，略高于GPT-5.2的67.9。在HealthBench測試中得分57.7，排名第一。

這些數據表明，相較于豆包1.8，新版本的豆包在長尾領域知識覆蓋上有所加強。

豆包2.0在多模態理解上的提升是全方位的。

在視覺推理方面，模型在MathVista、MathVision等基準上達到了業界最優水平。

這些考試比簡單的圖像識別要復雜得多。

因為這些測試的目的，是考察模型能否從圖像中提取數學關系、理解幾何結構、進行邏輯推演。

在文檔理解場景中，豆包2.0在ChartQA Pro與OmniDocBench 1.5基準上的表現達到頂尖水平。

現實中的文檔往往是表格、圖表、文字、公式混雜的復雜版式，模型需要準確識別結構、提取信息、理解關系。

在長上下文理解方面，豆包2.0在 DUDE、MMLongBench等測試中取得了較好成績。

視頻理解是豆包2.0的一個重點優化方向。

在TVBench、TempCompass、MotionBench等測試中，豆包2.0處于領先位置。

值得注意的是，在EgoTempo基準上，豆包2.0的得分超過了人類水平。這個細節說明，模型在捕捉“變化、動作、節奏”這類時序信息時，可能比人類更穩定.

豆包2.0還支持流式實時視頻分析，可以實現環境感知、主動糾錯與交互。這種能力的應用場景包括健身指導、穿搭建議等，模型能實時觀察并給出反饋，而不是事后分析錄像。

02

豆包團隊如何實現？

其實豆包2.0的這些提升背后，涉及到了多個層面的優化。

多模態融合架構的改進是基礎。

傳統的多模態模型是把視覺編碼器和語言模型簡單拼接，視覺信息和文本信息的交互深度不夠。

豆包2.0強化了視覺與語言的深度融合，讓模型能更好地理解圖像中的語義信息。

人類看一張圖，它是包含因果關系的。

就拿這張圖來說，傳統多模態大模型看到這張圖，它理解的是“姚順宇”、“話筒”、“手”、“西裝”。

但是人類理解這張圖是“姚順宇西裝革履拿著話筒正在演講”。

即使圖片是靜態的，也能因為他的神態、穿著來判斷此時正在做什么。

此外，豆包2.0對注意力機制的改進，為它帶來了長上下文處理能力的提升。

處理長文本或長視頻時，模型需要在海量信息中保持注意力，不能顧此失彼。

就比如你在閱讀這篇文章的時候，A部分出現了大量的技術名詞、術語，你也只會挑其中的圖片以及數字來一目十行地看，不會逐字逐句認真看。

因此豆包2.0其實是以人類讀長文章時那樣，自動抓重點，而不是平均分配注意力。

技術上，這需要更高效的注意力計算方法和更合理的信息篩選機制。

最后，豆包2.0推理能力的提升不只是記住更多知識，而是真正提升了從已知推導未知的能力。

這涉及到訓練過程中對推理鏈的顯式建模，讓模型學會“一步步思考”而不是直接給答案。這種能力在解決復雜問題時尤為重要。

03

現實不是競賽

字節跳動團隊觀察到一個現象，語言模型已經可以順利解決競賽難題，但放在真實世界中，它們依然很難端到端地完成實際任務。

比如一次性構建一個設計精良、功能完整的小程序。

這個鴻溝的原因主要有兩點，第一是知識覆蓋的問題。

競賽題目通常聚焦在數學、編程等核心領域，而真實任務往往涉及長尾領域的專業知識，比如前文提到的醫療、法律、工程、商業等等。

第二是指令遵循的問題。

真實任務通常包含多個步驟、多重約束，模型需要嚴格按照要求一步步推進，不能跑偏，不能遺漏。

豆包2.0試圖通過系統性加強長尾領域知識和強化指令遵循能力來彌合這個鴻溝。

從測試數據來看，在深度研究任務、復雜agent能力評估等方面，豆包2.0達到了業界第一梯隊水平。

在客服問答、信息抽取、意圖識別等高頻應用場景上，模型表現也比較穩定。

播客中給出了一個有意思的案例——高爾基體蛋白分析。

豆包2.0不僅能給出總體實驗路線，還能把基因工程、小鼠模型構建、亞細胞分離與多組學分析串成完整流程，細化到關鍵環節怎么做、用什么進行對照、用哪些指標評估純度。

相關領域專家表示，這個方案在跨學科的實驗細節與步驟化表達上，超出了他們對大模型的預期。

不過，從“能給出方案”到“方案真正可行”，中間還有驗證的距離。這個案例更多說明模型在知識整合和表達能力上的進步，而不是說它已經能替代科研人員做實驗設計。

眾所周知，AI編程是2026年最火的賽道，豆包2.0 Code是針對編程場景優化的版本，已上線TRAE作為內置模型。

字節團隊展示的案例是“TRAE春節小鎮·馬年廟會”互動項目。通過1輪提示詞構建基本架構，再經過幾次調試，總共5輪提示詞完成作品。

這個小鎮里有11位由大語言模型驅動的NPC，會根據人設自然聊天、招呼顧客、現場砍價。

AI游客自己決定去哪家攤位、買什么、說什么。

其中，煙花升空時的祝福語、孔明燈上的題詞都由AI即時生成。每次進入小鎮，看到的互動都可能不同。

這個案例展示了豆包2.0 Code模型在快速原型開發上的能力。不過需要注意的是，從原型到產品之間還有很長的路要走。

從字節跳動的策略來看，豆包2.0強調“面向真實世界復雜任務”，這是一個務實的定位。

通過分析真實使用場景來指導模型優化，而不是單純為了刷榜。

這種以需求為導向的研發思路，可能比單純追求基準測試分數更有價值。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

最新研究戳穿AI寫代碼的致命騙局：越改越爛，連人類屎山都打不過！

鈦媒體APP 2026-03-30 11:05:10
45 跟貼 45
早于DeepSeek Engram！用「查表」重置Transformer記憶 | ICLR

新智元 2026-03-30 21:26:03
0 跟貼 0

推理成功率暴漲 30%！極佳視界發布全新世界模型GigaWorld-Policy

機器之心Pro 2026-03-30 13:27:50
0 跟貼 0

龍蝦時代，老板再無避風港，紅衣大叔重回一線打了個樣

智東西 2026-03-30 18:53:43
0 跟貼 0
全球OCR新王來自中國開源！GitHub狂攬73300+Star

量子位 2026-03-30 22:11:02
0 跟貼 0

支持遠程操控和通用GUI操作3

機器之心Pro 2026-03-02 13:36:13
0 跟貼 0

斯坦福、英偉達、新國立推出InfoTok，用信息論定義高效視頻分詞

機器之心Pro 2026-03-30 15:39:13
0 跟貼 0
三維空間太難懂？2

機器之心Pro 2025-12-31 13:49:19
0 跟貼 0

人大林衍凱教授：OpenClaw就像早期Linux，真正的競爭才剛開始

機器之心Pro 2026-03-30 15:29:06
0 跟貼 0
讓多模態模型學會主動說話：主動交互從訓練到評估的完整方案

機器之心Pro 2026-03-30 13:16:01
0 跟貼 0
人類一離座AI就進化！伯克利開源MetaClaw，靜態Agent慌了

新智元 2026-03-30 21:27:11
0 跟貼 0
百度沈抖自曝：老忘吃藥，用AI做了個小程序

量子位 2026-03-27 11:25:23
0 跟貼 0
“物理AI第一股”五一視界董事長李熠：商業模式將從仿真軟件銷售轉型為“物理AI工廠”

每日經濟新聞 2026-03-30 21:53:05
0 跟貼 0
對話騰訊健康用戶平臺總經理吳志剛：商業化非首要，不對標友商，定位醫療AI的“連接者”

每日經濟新聞 2026-03-30 21:36:05
0 跟貼 0
龍蝦為啥越養越貴，越用越蠢？

鈦媒體APP 2026-03-28 19:53:33
11 跟貼 11
印度小伙0工資招6類工程師，3周收到47份簡歷

報錯免疫體 2026-03-30 13:55:05
1 跟貼 1
豆包和紅果證明，字節的流量用來做游戲太浪費了

源Sight 2026-03-30 17:15:10
3 跟貼 3
DeepSeek崩潰10小時，這是好事啊，梁文鋒得為V4沖擊波做好準備

鈦媒體APP 2026-03-30 18:10:32
4 跟貼 4
天津老城中心開了一條小吃街，名字叫

天津族 2026-03-30 07:33:40
2 跟貼 2
劉慈欣15年前寫的宇宙法則，正在殺死2026年的開源社區

閃存獵手 2026-03-30 12:36:26
0 跟貼 0
成都家長養蝦到底從哪只蝦開始？

成都教育 2026-03-30 11:34:12
4 跟貼 4
遠程團隊3年踩坑：把辦公室習慣搬進Zoom，協作效率暴跌40%

我是一個粉刷匠2 2026-03-28 11:48:34
0 跟貼 0
李宏燁博士挑戰郭德綱：公式相聲對決，狂傲姿態引熱議

月影沙丘d 2026-03-30 06:18:47
5 跟貼 5
豆包視頻怎么去除水印,無水印下載#豆包視頻水印怎么去除

二米文檔 2026-03-30 17:05:13
3 跟貼 3
適合春天讀的17本新書！

博集天卷書友會 2026-03-30 19:18:02
0 跟貼 0
《一個陌生女人的來信》作者茨威格，流亡巴西時，和妻子共赴黃泉

結綠 2026-03-30 10:07:46
0 跟貼 0
內存條價格出現斷崖式下跌，16G內存條1天跌了上百元，專家：未來將持續降價

極目新聞 2026-03-29 22:53:03
4754 跟貼 4754
程序員工程師的一家子，老公寫程序媳婦焊板子

獨悅生活志 2026-03-28 21:26:16
1 跟貼 1
英國工簽系統把3萬行代碼逼瘋：薪資閾值不是數字，是道數學題

Ping值焦慮 2026-03-30 15:18:33
0 跟貼 0
交通運輸部檢查指導組在吉林檢查時發現“百噸王”多發頻發

界面新聞 2026-03-30 11:14:13
35 跟貼 35
中方決定對日本國會眾議員古屋圭司采取反制措施

央視新聞客戶端 2026-03-30 10:43:13
1786 跟貼 1786
印度又官宣自研五代機！17年就憋出個模型，能趕超中美俄嗎？

浩然簡史 2026-03-28 16:39:42
0 跟貼 0
1911 模型槍欣賞

飛翔大白鯨 2026-03-29 09:56:29
0 跟貼 0
上海男籃的難題又來了！

新民晚報 2026-03-30 10:42:17
378 跟貼 378
保定一小店售賣咸菜絲燒餅意外爆火，排隊人數太多店鋪宣布暫停營業，店主：流量太大了，我們承接不住，也擔心影響燒餅品質

極目新聞 2026-03-26 22:43:02
1748 跟貼 1748
中國將在長江水下開高鐵

環球網資訊 2026-03-30 09:38:29
944 跟貼 944
蔡磊透露身體近況：四個人同時攙扶也無法邁步

極目新聞 2026-03-29 22:40:10
1384 跟貼 1384
液晶電視機有聲音沒圖像黑屏，一般都是這2個原因

阿兵電器維修 2026-03-26 19:27:16
5 跟貼 5
企微開源“養蝦大殺器”！AI可接管消息、日程、文檔，12個Skill一次放出

智東西 2026-03-30 15:51:28
0 跟貼 0
尚界Z7首發靜態體驗：不廢話，全干貨！

興森家里 2026-03-29 04:50:48
0 跟貼 0

王維代理蘇州市市長，最強地級市何以先行示范？

王維代理蘇州市市長，最強地級市何以先行示范？

黎禾梨財經人物

2026-03-30 21:40:55

絕對“鈔能力”！哈蘭德用不到一周工資，入手限量LV聯名邁巴赫！

絕對“鈔能力”！哈蘭德用不到一周工資，入手限量LV聯名邁巴赫！

田先生籃球

2026-03-30 21:35:46

杜月笙在河邊釣魚，遇到地痞要保護費，杜月笙：找你們老板過來

杜月笙在河邊釣魚，遇到地痞要保護費，杜月笙：找你們老板過來

千秋文化

2026-03-25 21:29:50

廣州暴雨“一秒天黑”高架橋變“高架河”

廣州暴雨“一秒天黑”高架橋變“高架河”

界面新聞

2026-03-30 17:25:06

LV，賣不動了？

中國新聞周刊

2026-03-30 18:15:39

有一是一，阿隆索不僅耽誤了維尼修斯，同時也耽誤了巴爾韋德！

有一是一，阿隆索不僅耽誤了維尼修斯，同時也耽誤了巴爾韋德！

田先生籃球

2026-03-29 22:07:38

臨時世界排名更新！趙心童創新高，丁俊暉保前16吳宜澤直逼肖國棟

臨時世界排名更新！趙心童創新高，丁俊暉保前16吳宜澤直逼肖國棟

世界體壇觀察家

2026-03-30 00:03:55

山西一兒媳住院公公陪床，趁護士換藥塞紙條，護士看后直接報警

山西一兒媳住院公公陪床，趁護士換藥塞紙條，護士看后直接報警

五元講堂

2024-10-24 10:54:37

順豐控股：2026年擬使用不超380億元購買理財產品

順豐控股：2026年擬使用不超380億元購買理財產品

每日經濟新聞

2026-03-30 21:48:41

上海內環，樓市地位下滑比較嚴重的地方

上海內環，樓市地位下滑比較嚴重的地方

環線房產咨詢

2026-03-30 19:02:37

美國媒體：越來越多證據顯示，特朗普正在利用伊朗戰爭操縱市場

美國媒體：越來越多證據顯示，特朗普正在利用伊朗戰爭操縱市場

一家說

2026-03-30 18:12:33

張本智和父親公開叫板：希望中國人別罵我兒子，他很受日本人尊重

張本智和父親公開叫板：希望中國人別罵我兒子，他很受日本人尊重

拳擊時空

2026-03-30 06:19:57

香港影壇最短傳奇：兩年五部神作，叫好又賣座，卻為何突然落幕？

香港影壇最短傳奇：兩年五部神作，叫好又賣座，卻為何突然落幕？

可樂談情感

2026-03-30 09:00:04

8連敗！寶島核心空砍34分，CBA關鍵1戰：山東新援27分征服球迷！

8連敗！寶島核心空砍34分，CBA關鍵1戰：山東新援27分征服球迷！

話體壇

2026-03-30 22:20:30

敗退臺灣的蔣介石，看到上甘嶺戰報，含淚說出了15個字的高度評價

敗退臺灣的蔣介石，看到上甘嶺戰報，含淚說出了15個字的高度評價

史韻流轉

2026-03-30 09:22:48

1億成本，首映僅449萬，《蜂蜜的針》票房撲街，袁梅虧到懷疑人生

1億成本，首映僅449萬，《蜂蜜的針》票房撲街，袁梅虧到懷疑人生

電影票房預告片

2026-03-28 23:57:45

大陸定性賴清德后，鄭麗文當眾爆料，民進黨瞞著2300萬臺胞的真相

大陸定性賴清德后，鄭麗文當眾爆料，民進黨瞞著2300萬臺胞的真相

奧字侃劇

2026-03-30 13:51:34

森林北沒想到，李榮浩四連問單依純僅1天，50歲汪峰竟意外火出圈

森林北沒想到，李榮浩四連問單依純僅1天，50歲汪峰竟意外火出圈

攬星河的筆記

2026-03-30 16:06:14

CBA排名一夜大變！北京2分險勝，遼寧102-94福建，山東排第6

CBA排名一夜大變！北京2分險勝，遼寧102-94福建，山東排第6

薇說體育

2026-03-30 22:24:10

快扔掉！戴一天，輻射量相當于拍117次胸片

快扔掉！戴一天，輻射量相當于拍117次胸片

FM93浙江交通之聲

2025-10-28 00:01:43

讓未來不止于大。

2329文章數 8055關注度

往期回顧全部

科技要聞

一句謊言引發的硅谷血案

頭條要聞

開發商承諾有學校3年后交房沒建業主起訴被當地駁回

頭條要聞

開發商承諾有學校3年后交房沒建業主起訴被當地駁回

體育要聞

想進世界杯，意大利還要過他這一關

娛樂要聞

單依純凌晨發長文道歉！李榮浩再回應

財經要聞

本輪地緣沖突，A股憑什么走出獨立行情

汽車要聞

限時12.58萬起銀河星耀8遠航家系列上市

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

房產

健康

數碼

教育

游戲

房產要聞

重磅！番禺20宗涉宅地亮相，萬博CBD宅地將上新！

干細胞抗衰4大誤區,90%的人都中招

數碼要聞

4499元起！vivo Pad6 Pro正式發布搭載行業首款4K屏

教育要聞

媽媽不要怕，有我在，你的兒子女兒會平安快樂長大！

四月PS新會免游戲爆料！類魂與二次元雙大作領銜

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版