春節前夕,國內大模型行業迎來迭代高峰,AI(人工智能)賽道硝煙彌漫,而在這場全面打響的競逐中,字節跳動再度“亮劍”。
2月14日,在連續發布Seedance 2.0視頻模型、Seedream 5.0 Lite圖像模型后,字節正式推出豆包大模型2.0系列。官方介紹,豆包2.0針對大規模生產環境進行系統性優化,旨在提升真實世界復雜任務的執行能力。
值得注意的是,這是豆包大模型自2024年5月正式發布以來首次大版本的跨代升級。在春晚倒計時這一國民級流量節點,字節“三箭齊發”,全棧AI布局野心盡顯。
與此同時,各類AI產品也在春節場景中加速落地。千問斥資30億元修筑生態圍欄,錘煉真實應用。而除夕夜,字節還會將語音模型、視頻模型直接搬上春晚舞臺。
字節能否“大力出奇跡”尚未可知,模型能力提升的同時,算力消耗也在水漲船高。Seedance 2.0全面上線后,不少用戶反饋排隊現象嚴重。字節又將如何應對?
近日,市場先后傳出消息稱,字節跳動今年計劃至少生產10萬顆AI推理芯片以及AI芯片團隊擴招。對此,《每日經濟新聞》記者向字節方面求證,截至發稿均未獲回應。但記者通過招聘軟件發現,字節跳動“AI芯片系統軟件架構師/工程師-NPU”“網絡方向—芯片驗證工程師”等崗位都正在招聘。
![]()
圖片來源:每經記者截圖
春節試煉場已然鋪開。Agent(智能體)時代,正在加速走來。
實測豆包2.0:聚焦多輪復雜指令遵循與穩定性
豆包2.0的升級路徑,延續字節一貫的技術思路。
火山引擎總裁譚待曾在2025年12月發布豆包1.8時接受包括《每日經濟新聞》在內的媒體采訪時表示,多模態能力的提升是模型成為復雜Agent的關鍵。“多模態其實代表著模型的應用進入更深的領域。”
此番豆包2.0的突破,正是沿著這一方向展開。
本次發布的豆包大模型2.0提供了多種選擇:包含Pro、Lite、Mini三款多模態通用模型,以及面向開發者的Code模型。其中,旗艦款豆包2.0 Pro定位于復雜深度推理、Agent等高難度任務。
在推理和Agent能力評測中,豆包2.0 Pro在IMO、CMO數學奧賽和ICPC編程競賽中獲得金牌成績,超越了Gemini 3 Pro在Putnam基準測試上的表現。此外,在HLE-text(人類的最后考試)中,豆包2.0 Pro取得最高分54.2分。
據官方介紹,豆包2.0還重點強化了指令遵循能力,可保持較強的一致性與可控性,作為Agent模型能夠在長鏈路、多步驟任務中嚴格按約束條件執行。對此,《每日經濟新聞》記者對豆包大模型2.0 Pro(專家版)進行了實測。
測試由DeepSeek設計,聚焦多輪復雜指令遵循與穩定性。記者以“請幫我規劃一個為期3天的北京旅游行程,預算3000元,獨自一人”為初始條件,并在對話過程中不斷加入新約束,觀察模型是否會遺忘或混淆信息。
面對初始條件,豆包2.0 Pro經過不到2分鐘思考,便給出了一份信息完備的規劃,具體到每個景點的預約方式和游玩路線。由于未指定具體日期,模型自動按旺季價格標準進行了預算測算。
記者又先后補充了“第一天晚餐換成北京評分高的湘菜或者川菜”“帶上母親出游,預算調整為5000元,住宿需要更換為雙床房”“第三天不去長城,換個輕松一點的地方逛”等多個條件。
在保持行程框架不變的前提下,豆包2.0 Pro在收到“帶上長輩”的信息后,主動調整了景點內的游覽路線,增加了游船、園內電動車等適老選項;在滿足第一晚吃辣需求的同時,還核驗了備選餐廳是否有適合長輩的食物。
多模態理解是此次升級的另一重頭戲。從測試成績來看,在空間理解MMSIBench、運動理解MotionBench、視頻理解VideoMME等測評集上,豆包2.0 Pro均略勝Gemini 3 Pro一籌;在圖表理解CharXiv-RQ 上能力也再次大幅提升。
而在實際應用能力上,豆包2.0亦有所提升。據字節官方介紹,面對動態場景,豆包2.0強化了對時間序列與運動感知的理解能力,對“變化、動作、節奏”等信息的捕捉更為穩定,工程側可用性更高。
在長視頻場景中,豆包2.0可作為AI助手完成實時視頻流分析、環境感知、主動糾錯與情感陪伴,實現從被動問答到主動指導的交互升級,可應用于健身、穿搭等陪伴場景。
價格方面,豆包2.0 Pro仍按照“輸入長度”區間定價,32k以內輸入為3.2元/百萬tokens,輸出為16元/百萬tokens,相較Gemini 3 Pro和GPT 5.2具備明顯成本優勢。豆包2.0 Lite則主打性價比,綜合性能超越兩個月前發布的上一代主力豆包1.8,百萬tokens輸入價格為0.6元。
目前,豆包2.0 Pro已在豆包App(應用程序)、電腦端、網頁版上線,火山引擎同步開放API(應用程序編程接口)服務。
大力出奇跡?字節不只想贏下AI“春節檔”
相比前兩次迭代,此次豆包2.0沒有發布會也沒有進行過多的預熱。
而春節前夕也恰逢國內大模型密集上新期。阿里1月26日發布Qwen3-Max-Thinking旗艦推理模型;1月27日,月之暗面Kimi K2.5發布;之后,階躍星辰發布新一代開源Agent基座模型Step 3.5 Flash;2月12日,MiniMax正式上線最新旗艦編程模型MiniMax M2.5,作為全球首個為Agent場景原生設計的生產級模型,其編程與智能體性能直接對標國際頂尖模型Claude Opus 4.6。
行業迭代提速,而字節連發三款核心模型,亮出的是全棧AI布局的底牌。
2月12日,已在國內外引發熱議的Seedance 2.0視頻模型正式登場。次日,Seedream 5.0 Lite圖像模型上線,首次支持實時檢索增強能力,可通過聯網獲取最新知識和資訊。
然而,模型能力提升的同時,算力消耗也在水漲船高。Seedance 2.0全面上線后,不少用戶反饋排隊現象嚴重。但值得一提的是,2月14日,記者在即夢平臺體驗Seedance 2.0時發現,模型上新了Seedance 2.0 Fast版本,而其生成視頻消耗平臺積分相對更少。
![]()
圖片來源:每經記者截圖
與此同時,字節跳動對春晚這一頂級流量場的深度參與也已浮出水面。
官方此前宣布,火山引擎成為2026年中央廣播電視總臺春節聯歡晚會獨家AI云合作伙伴。據火山引擎透露,全新Seedance 2.0、Seedream以及空間視頻技術將全面賦能春晚舞臺,將中國傳統文化與AI科技深度融合。此外今年春晚的具身機器人表演,還將通過豆包語音模型實現深度語義理解,精準分析對話語境與情緒變化,讓機器人語言表達更生動、更擬人。
用戶端的觸達也在同步推進。2月13日晚,“豆包過年”活動第一階段啟動,用戶打開App用AI生成拜年祝福、新春寫真、拜年視頻等即可抽紅包。當晚,“豆包紅包”話題詞沖上熱搜。
而從本次春節的活動內容來看,豆包2.0的能力升級或許也能夠作用其中。多模態交互實時視頻流分析適配春晚直播,AI創作能力提供新春寫真、拜年視頻,讓用戶在搶紅包的同時,也在親身體驗多模態Agent的能力。
而在這場AI春節檔的競逐中,誰能最終筑起壁壘?
艾媒咨詢CEO(首席執行官)兼首席分析師張毅在接受《每日經濟新聞》記者采訪時給出了三個判斷維度:資金實力、技術與產品儲備、產品落地能力。
“誰能夠形成最后的壁壘,主要看三點。”張毅表示,“一是資金實力,這很重要,因為現在看來行業競爭是一浪高過一浪的資金投入;二是技術和產品的儲備能力,尤其是技術底蘊是否足夠深厚,能否應對未來幾年的快速迭代;第三點也是最關鍵的一點,產品本身能不能在春節前后緊扣用戶需求,找到落地的場景,吸引數億級用戶形成產品壁壘——這才是最大的護城河。”
工信部信息通信經濟專家委員會委員盤和林則在采訪中對《每日經濟新聞》記者表示,春晚對字節而言更多是錦上添花。“字節的基本盤是自媒體內容創作者,春晚對提高留存率有幫助,但真正能留住用戶的,是AI與剪映的深度融合。”
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.