11月13日,2025百度世界大會(huì)上,百度正式對外發(fā)布原生全模態(tài)大模型文心大模型5.0。該模型參數(shù)量達(dá)2.4萬億,采用原生全模態(tài)統(tǒng)一建模技術(shù),具備全模態(tài)理解與生成能力,支持文本、圖像、音頻、視頻等多種信息的輸入與輸出。
文心5.0基礎(chǔ)能力全面升級,在多模態(tài)理解、指令遵循、創(chuàng)意寫作、事實(shí)性、智能體規(guī)劃與工具應(yīng)用等方面表現(xiàn)突出,擁有強(qiáng)大的理解、邏輯、記憶和說服力。在40余項(xiàng)權(quán)威基準(zhǔn)的綜合評測中,其語言與多模態(tài)理解能力與Gemini-2.5-Pro、GPT-5-High等模型持平,圖像與視頻生成能力與垂直領(lǐng)域?qū)>P拖喈?dāng),達(dá)到全球領(lǐng)先水平,驗(yàn)證了原生全模態(tài)大模型的能力和潛力。
![]()
文心5.0 在多模態(tài)理解、指令遵循、創(chuàng)意寫作、事實(shí)性、智能體規(guī)劃與工具應(yīng)用等方面表現(xiàn)突出
百度創(chuàng)始人李彥宏會(huì)上表示,大模型技術(shù)在快速迭代,其智能水平不斷突破極限,模型思考時(shí)間變長,原生全模態(tài)統(tǒng)一,將自我學(xué)習(xí)和迭代,具備創(chuàng)新能力。“智能本身是最大的應(yīng)用,而技術(shù)迭代速度是唯一護(hù)城河。百度會(huì)持續(xù)投入、研發(fā)更前沿的模型,推高智能天花板。”
百度首席技術(shù)官王海峰介紹,文心大模型5.0是新一代原生全模態(tài)大模型。不同于業(yè)界多數(shù)的多模態(tài)模型采用后期融合的方式,文心5.0的技術(shù)路線是采用統(tǒng)一的自回歸架構(gòu)進(jìn)行原生全模態(tài)建模,理解與生成一體化。從訓(xùn)練開始便融合語言、圖像、視頻、音頻等多模態(tài)數(shù)據(jù),使得多模態(tài)特征在統(tǒng)一架構(gòu)下充分融合并協(xié)同優(yōu)化,實(shí)現(xiàn)原生的全模態(tài)統(tǒng)一理解與生成。
依托飛槳深度學(xué)習(xí)框架,文心5.0采用了超稀疏混合專家架構(gòu),進(jìn)行龐大的全模態(tài)訓(xùn)練,總參數(shù)規(guī)模超過 2.4 萬億,激活參數(shù)比例低于 3%,在保持模型強(qiáng)大能力的同時(shí)有效提升推理效率。 同時(shí),基于大規(guī)模工具環(huán)境,合成長程任務(wù)軌跡數(shù)據(jù),并采用基于思維鏈和行動(dòng)鏈的端到端多輪強(qiáng)化學(xué)習(xí)訓(xùn)練,顯著提升了模型的智能體和工具調(diào)用能力。
目前,文心大模型5.0 Preview已同步上線文心App,用戶可直接體驗(yàn);開發(fā)者和企業(yè)用戶也可通過百度千帆大模型平臺,調(diào)用文心大模型5.0 API 服務(wù)。
此前在11月8日,LMArena大模型競技場最新排名顯示,文心模型ERNIE-5.0-Preview-1022在文本任務(wù)評測中位列全球并列第二、中國第一,尤其在創(chuàng)意寫作、復(fù)雜問題理解等方面表現(xiàn)突出。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.