2026年1月22日,百度于上海召開“文心Moment”大會,正式發(fā)布并上線原生全模態(tài)大模型“文心5.0正式版”。據(jù)多家媒體報道,該模型基于原生全模態(tài)統(tǒng)一建模技術(shù),擁有高達(dá)2.4萬億參數(shù),具備對文本、圖像、音頻、視頻等多種信息的統(tǒng)一理解與生成能力。目前,個人用戶可通過文心APP、文心一言官網(wǎng)體驗,企業(yè)與開發(fā)者則可基于百度千帆平臺進(jìn)行調(diào)用,百度旗下的慧播星、文心助手等產(chǎn)品也已全面接入。
在多項權(quán)威評測中,文心5.0展現(xiàn)了國際一流的競爭力。在40余項權(quán)威基準(zhǔn)的綜合評估中,其語言與多模態(tài)理解能力超越了Gemini-2.5-Pro、GPT-5-High等國際主流模型。特別是在廣受關(guān)注的LMArena全球大模型競技場榜單中,文心5.0以1460分位列文本榜國內(nèi)第一、全球第八,其數(shù)學(xué)能力更是位居全球榜首,視覺理解能力也躋身全球前列,成為該榜單中表現(xiàn)優(yōu)異的中國模型。
![]()
百度集團(tuán)副總裁吳甜在會上詳細(xì)闡釋了文心5.0的核心技術(shù)路徑。與業(yè)界常見的“后期融合”方案不同,文心5.0采用統(tǒng)一的自回歸架構(gòu)進(jìn)行原生全模態(tài)建模,將多源數(shù)據(jù)在同一框架中聯(lián)合訓(xùn)練,實現(xiàn)了多模態(tài)特征的原生深度融合與協(xié)同優(yōu)化。在模型結(jié)構(gòu)上,它采用了超大規(guī)模混合專家(MoE)架構(gòu),并以低于3%的超稀疏激活參數(shù)比例,在保持強大能力的同時顯著提升了推理效率。此外,通過基于思維鏈和行動鏈的強化學(xué)習(xí)訓(xùn)練,模型的智能體與工具調(diào)用能力也得到增強。
得益于原生全模態(tài)的技術(shù)優(yōu)勢,文心5.0在多項實際任務(wù)中表現(xiàn)出色。現(xiàn)場演示顯示,僅輸入一段復(fù)刻“活了么”App的教學(xué)視頻,模型便能自動拆解步驟并生成可運行的前端代碼;在創(chuàng)意寫作中,它能模仿《紅樓夢》王熙鳳的語言風(fēng)格,創(chuàng)作出融合古典與現(xiàn)代商業(yè)思維的文案。這些能力體現(xiàn)了其在復(fù)雜情境下的深度理解與創(chuàng)造性。吳甜還介紹了“文心導(dǎo)師”計劃的進(jìn)展,目前已有來自科技、金融、文化、教育等十余個重點行業(yè)及多個基礎(chǔ)學(xué)科的835位專家加入,在知識傳授、專業(yè)校準(zhǔn)等方面對模型進(jìn)行持續(xù)指導(dǎo)。
有分析文章指出,文心5.0的發(fā)布標(biāo)志著原生全模態(tài)技術(shù)路線走向成熟與實用,展現(xiàn)了中國AI廠商在底層技術(shù)上的自主創(chuàng)新能力。該分析將百度的策略與谷歌的體系化AI路線相類比,認(rèn)為百度長期堅持的“芯-云-模-體”全棧自研體系——涵蓋自研AI芯片(昆侖芯)、智能云、大模型及各類智能體應(yīng)用——雖看似“更重更慢”,卻能在AI工業(yè)化階段構(gòu)建深厚的生態(tài)壁壘,是贏得長期競爭的關(guān)鍵。百度在2025年股價的顯著上漲,也部分反映了市場對其長期技術(shù)路線的認(rèn)可。
在會后的實際測試中,文心5.0也展現(xiàn)了多方面的應(yīng)用潛力。例如,在視頻理解任務(wù)中,它能精確到秒地分析一段旅行視頻的節(jié)奏變化、鏡頭切換與敘事結(jié)構(gòu),顯示出原生多模態(tài)理解的深度。在創(chuàng)意寫作測試中,它能生成技術(shù)細(xì)節(jié)準(zhǔn)確、情感層次豐富的短篇故事。更值得一提的是,在理解中文特定語境(如分析相親簡歷中的潛臺詞)或構(gòu)思高情商回復(fù)等涉及“人情世故”的任務(wù)中,模型展現(xiàn)出了對中文社會文化語境的深刻洞察,這成為其區(qū)別于許多國際模型的一個顯著亮點。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.