網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

百度文心4.5系列正式開(kāi)源，「全棧」加持，全開(kāi)夠硬核！

2025-07-02 07:09:31　來(lái)源: AI異類

北京舉報(bào)

分享至

不知道大家還記不記得，早在今年的2月份，百度官方宣布將在6月30日開(kāi)源旗下大模型，一石激起千層浪。

就在6月30日今天，百度兌現(xiàn)承諾，一口氣開(kāi)源文心4.5系列10款大模型，包含混合專家架構(gòu)、文本與多模態(tài)能力，參數(shù)從0.3B至424B不等。

這不僅是國(guó)內(nèi)史無(wú)前例的一次規(guī)模化開(kāi)源，也是放眼全球都極具競(jìng)爭(zhēng)力的一次技術(shù)釋放。

某種程度上，這次開(kāi)源是令百度大模型與國(guó)際巨頭并肩背后“全棧式AI”技術(shù)能力的最新體現(xiàn)，也為AI應(yīng)用爆發(fā)按下快進(jìn)鍵。

高明的舵手，會(huì)適時(shí)轉(zhuǎn)彎。

一、文心4.5開(kāi)源：性能才是硬道理？

此次百度開(kāi)源文心4.5系列，其目的顯然不限于技術(shù)開(kāi)放本身，更在于通過(guò)開(kāi)放，最大化地推動(dòng)整個(gè)AI生態(tài)的繁榮與應(yīng)用落地。

該系列包含了混合專家（MoE）模型和稠密（Dense）模型兩大類別，參數(shù)量覆蓋從0.3B到424B的范圍，實(shí)現(xiàn)了從輕量級(jí)邊緣部署到超大規(guī)模云端推理的全面覆蓋。

百度方面強(qiáng)調(diào)，其預(yù)訓(xùn)練權(quán)重和推理代碼的完全開(kāi)源，在獨(dú)立自研模型數(shù)量占比、模型類型、參數(shù)豐富度以及開(kāi)源寬松度與可靠性等關(guān)鍵維度上，均已達(dá)到行業(yè)領(lǐng)先水平。

這種全面性，對(duì)于不同需求和資源限制的開(kāi)發(fā)者而言，無(wú)疑提供了極大的靈活性和選擇空間。

在文本模型方面，百度稱其在多個(gè)主流基準(zhǔn)評(píng)測(cè)中超越了DeepSeek-V3和Qwen3。

這并非簡(jiǎn)單的“跑分”優(yōu)勢(shì)，而是意味著其在基礎(chǔ)語(yǔ)言理解、事實(shí)準(zhǔn)確性、指令遵循能力、復(fù)雜推理以及編程能力上具備了更強(qiáng)的實(shí)用性和可靠性。

文心4.5預(yù)訓(xùn)練模型在主流基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異：

文心多模態(tài)后訓(xùn)練模型（支持思考、關(guān)閉思考）在多個(gè)多模態(tài)基準(zhǔn)測(cè)試中達(dá)到SOTA水平

對(duì)于企業(yè)級(jí)應(yīng)用和開(kāi)發(fā)者而言，這些能力的提升直接轉(zhuǎn)化為更高效、更精準(zhǔn)的AI驅(qū)動(dòng)解決方案。

而在更具前瞻性的多模態(tài)能力上，文心4.5系列展現(xiàn)了卓越的視覺(jué)感知能力和豐富的視覺(jué)常識(shí)，實(shí)現(xiàn)了“思考與非思考的統(tǒng)一”。

在視覺(jué)常識(shí)、多模態(tài)推理、視覺(jué)感知等主流多模態(tài)大模型評(píng)測(cè)中，百度披露的數(shù)據(jù)顯示其性能甚至優(yōu)于閉源的OpenAI o1。

尤其值得關(guān)注的是，即使在輕量級(jí)模型上，文心4.5也表現(xiàn)出驚人的競(jìng)爭(zhēng)力，體現(xiàn)了“以小博大”的策略。

比如，文心4.5-21B-A3B-Base文本模型的效果與同量級(jí)的Qwen3相當(dāng)；而文心4.5-VL-28B-A3B多模態(tài)模型更是同量級(jí)中表現(xiàn)最優(yōu)，甚至能與更大參數(shù)量的Qwen2.5-VL-32B不相上下。

對(duì)于廣大開(kāi)發(fā)者而言，這意味著能夠以更低的算力消耗和部署成本，獲得高性能的大模型能力，這無(wú)疑將大幅降低AI應(yīng)用的門(mén)檻，促進(jìn)中小企業(yè)和個(gè)人開(kāi)發(fā)者參與到大模型生態(tài)的建設(shè)中，激發(fā)長(zhǎng)尾創(chuàng)新。

這種對(duì)輕量級(jí)高性能模型的關(guān)注，也符合當(dāng)前AI模型部署走向邊緣化、嵌入式的趨勢(shì)。

此外，開(kāi)發(fā)者可以通過(guò)Hugging Face、飛槳星河社區(qū)等主流開(kāi)源平臺(tái)輕松下載和部署模型，也可以選擇在百度智能云千帆大模型平臺(tái)使用開(kāi)源模型的API服務(wù)。

這種多渠道、靈活的接入方式，不僅便利了開(kāi)發(fā)者，也體現(xiàn)了百度在推動(dòng)開(kāi)源生態(tài)繁榮上的決心和開(kāi)放性，旨在最大限度地降低使用門(mén)檻。

二、全棧技術(shù)底氣：搶占戰(zhàn)略制高點(diǎn)

文心4.5系列的全面開(kāi)源，并非一時(shí)調(diào)整，而是百度十多年來(lái)在AI領(lǐng)域深耕細(xì)作、“全棧”技術(shù)布局的必然結(jié)果。

這種全棧優(yōu)勢(shì)，覆蓋了芯片、框架、模型到應(yīng)用的各個(gè)層面，形成了一個(gè)高效的反饋閉環(huán)，為開(kāi)源策略提供了堅(jiān)實(shí)的支撐，同時(shí)也構(gòu)筑了其獨(dú)特的競(jìng)爭(zhēng)壁壘。

首先是算力基礎(chǔ)設(shè)施。

大模型的訓(xùn)練和推理對(duì)算力有著近乎苛刻的需求，這被普遍視為AI發(fā)展的關(guān)鍵瓶頸之一。百度自研的昆侖芯在性能和性價(jià)比上具備優(yōu)勢(shì)，被認(rèn)為是降低單位算力成本的重要途徑。根據(jù)公開(kāi)資料，昆侖芯能在更少的計(jì)算資源下運(yùn)行大規(guī)模模型，從而直接降低了訓(xùn)練和推理所需的計(jì)算量和成本。

更關(guān)鍵的是，百度智能云成功點(diǎn)亮國(guó)內(nèi)首個(gè)自研昆侖芯三代萬(wàn)卡集群，并計(jì)劃進(jìn)一步點(diǎn)亮3萬(wàn)卡集群。

這種大規(guī)模集群的建設(shè)，不僅提供了充足的算力供應(yīng)，更通過(guò)任務(wù)并行調(diào)度、彈性算力管理等方式，極大提高了計(jì)算資源利用率，避免算力閑置，從而降低了整體算力成本。

在穩(wěn)定性方面，百度自研的「BCCL（百度集合通信庫(kù)）」能夠快速定位故障并提供自動(dòng)化容錯(cuò)能力，將故障恢復(fù)時(shí)間從小時(shí)級(jí)降低到分鐘級(jí)，確保集群有效訓(xùn)練率達(dá)到98%。

這種對(duì)底層算力設(shè)施的掌握和優(yōu)化能力，是支撐大規(guī)模模型訓(xùn)練和穩(wěn)定推理的根本保障，也是百度選擇開(kāi)源的深層底氣。

其次是深度學(xué)習(xí)框架飛槳。

作為百度的核心技術(shù)資產(chǎn)，飛槳為文心大模型的訓(xùn)練、推理和部署提供了強(qiáng)大支撐。

今年4月1日，深度學(xué)習(xí)平臺(tái)飛槳宣布新一代飛槳框架3.0正式發(fā)布，其核心亮點(diǎn)在于“動(dòng)靜統(tǒng)一自動(dòng)并行”等五大核心技術(shù)創(chuàng)新，旨在大幅降低大模型開(kāi)發(fā)訓(xùn)練成本，讓算法創(chuàng)新回歸核心價(jià)值。

飛槳框架3.0的“訓(xùn)推一體”設(shè)計(jì)理念，打破了訓(xùn)練與推理的割裂狀態(tài)，通過(guò)全方位深度優(yōu)化，能夠支持眾多開(kāi)源大模型進(jìn)行高性能推理，據(jù)稱，在DeepSeek-R1等模型上，飛槳的單機(jī)部署吞吐量甚至能提升一倍。

這種效率提升，直接關(guān)系到開(kāi)發(fā)者的實(shí)際使用成本和開(kāi)發(fā)效率。

李彥宏曾在2024年初的財(cái)報(bào)電話會(huì)上透露，文心大模型的推理成本已降至一年前的1%。

這一數(shù)據(jù)如果屬實(shí)，無(wú)疑是行業(yè)內(nèi)的重要突破，它不僅大幅降低了百度自身的運(yùn)營(yíng)成本，也為企業(yè)和開(kāi)發(fā)者基于文心大模型進(jìn)行開(kāi)發(fā)和二次開(kāi)發(fā)提供了更低的成本門(mén)檻，從而加速了模型的商業(yè)化落地。

飛槳框架與文心大模型的協(xié)同優(yōu)化，正是百度實(shí)現(xiàn)【框架層+模型層”雙層開(kāi)源】的關(guān)鍵。

這種模式不僅僅是開(kāi)放了最先進(jìn)的模型，更提供了支撐模型運(yùn)行和優(yōu)化的底層工具，這對(duì)于構(gòu)建一個(gè)活躍、健康的開(kāi)發(fā)者生態(tài)至關(guān)重要。

截至2024年10月，飛槳文心生態(tài)已凝聚1808萬(wàn)開(kāi)發(fā)者，服務(wù)了43萬(wàn)家企事業(yè)單位，創(chuàng)建了101萬(wàn)個(gè)模型，這些數(shù)據(jù)都印證了其生態(tài)的活力和影響力。

這種從底層到應(yīng)用的全面開(kāi)放策略，旨在吸引更廣泛的參與者，形成強(qiáng)大的網(wǎng)絡(luò)效應(yīng)。

三、應(yīng)用驅(qū)動(dòng)：開(kāi)源的最終目的在于價(jià)值落地

大模型開(kāi)源與閉源的路線之爭(zhēng)，最終都要回歸到一點(diǎn)：能否解決現(xiàn)實(shí)問(wèn)題，能否產(chǎn)生真實(shí)價(jià)值。

從單純的技術(shù)能力競(jìng)賽轉(zhuǎn)向?qū)嶋H應(yīng)用落地，從實(shí)驗(yàn)室走向市場(chǎng)，真正賦能千行百業(yè)，越來(lái)越成為必然。

文心4.5的開(kāi)源，正是為了加速AI應(yīng)用的爆發(fā)，將百度內(nèi)部已驗(yàn)證的成功經(jīng)驗(yàn)推向外部，形成“內(nèi)部勢(shì)能外溢”的效應(yīng)。百度內(nèi)部已率先基于文心4.5進(jìn)行了多項(xiàng)應(yīng)用升級(jí)，并取得了顯著成果，這些案例成為了文心4.5能力落地的最佳證明。

最典型的例子是近期火爆出圈的羅永浩數(shù)字人直播帶貨的成功。

這場(chǎng)直播首秀創(chuàng)下超1300萬(wàn)人次觀看、GMV突破5500萬(wàn)元的行業(yè)新紀(jì)錄，甚至在部分核心品類帶貨量反超真人直播。

這類數(shù)字人具備聲形超擬真、內(nèi)容更專業(yè)、互動(dòng)更靈活的特點(diǎn)，并能根據(jù)直播間實(shí)時(shí)熱度和轉(zhuǎn)化情況，靈活調(diào)度助播、場(chǎng)控、運(yùn)營(yíng)等角色，真正實(shí)現(xiàn)了“一個(gè)人就是一支營(yíng)銷(xiāo)團(tuán)隊(duì)”的效能，極大地提升了直播效率和轉(zhuǎn)化率。

這同時(shí)也印證了李彥宏在今年4月百度Create開(kāi)發(fā)者大會(huì)上的預(yù)判：“2025年最令人激動(dòng)的突破性應(yīng)用之一，就是AI數(shù)字人。”

IDC報(bào)告顯示，百度居中國(guó)AI數(shù)字人市場(chǎng)份額第一，這與多模態(tài)大模型的底層支撐密不可分，也預(yù)示著數(shù)字人市場(chǎng)即將迎來(lái)爆發(fā)。

除了數(shù)字人，百度旗下的其他AI應(yīng)用產(chǎn)品也正在基于文心4.5進(jìn)行功能升級(jí)，展現(xiàn)了模型賦能業(yè)務(wù)的多元化。

比如說(shuō)，文心快碼發(fā)布了獨(dú)立IDE，成為行業(yè)首個(gè)多模態(tài)、多智能體協(xié)同AI IDE，集成了文心最新模型，為開(kāi)發(fā)者提供更強(qiáng)大的智能交互體驗(yàn)，極大地提高了編程效率和智能輔助水平。

文小言也升級(jí)了多模型調(diào)度、圖片問(wèn)答等能力，通過(guò)整合百度自研模型（如文心X1、文心4.5）并接入DeepSeek-R1、可靈等第三方模型，實(shí)現(xiàn)了多模型間的智能協(xié)同，提升了用戶在多模態(tài)交互場(chǎng)景下的體驗(yàn)。

這些內(nèi)部應(yīng)用的成功實(shí)踐，不僅驗(yàn)證了文心4.5在實(shí)際業(yè)務(wù)場(chǎng)景中的效能，也為外部開(kāi)發(fā)者提供了可復(fù)制的經(jīng)驗(yàn)和可參考的落地路徑，加速了AI能力的普惠和商業(yè)化進(jìn)程。

從更廣闊的視角來(lái)看，開(kāi)源的趨勢(shì)正在全球范圍內(nèi)加速，這是一種行業(yè)共識(shí)的形成。

Gartner在2025年中國(guó)人工智能（AI）十大趨勢(shì)中明確指出，開(kāi)放式GenAI模型已成為中國(guó)超大規(guī)模云和AI提供商的普遍做法，并預(yù)測(cè)到2026年，中國(guó)50%的AI產(chǎn)業(yè)生態(tài)將基于開(kāi)放式GenAI模型構(gòu)建。

這表明開(kāi)源已不僅僅是技術(shù)選擇，更成為一種不可逆轉(zhuǎn)的產(chǎn)業(yè)趨勢(shì)，它將極大促進(jìn)創(chuàng)新、技術(shù)進(jìn)步和AI普惠。

四、全球AI格局的開(kāi)放轉(zhuǎn)向

百度文心4.5的開(kāi)源，正值全球AI巨頭策略調(diào)整的關(guān)鍵時(shí)期，尤其是在OpenAI和谷歌兩大玩家的動(dòng)向中，這種“開(kāi)放”轉(zhuǎn)向表現(xiàn)得尤為明顯，描繪出了一場(chǎng)沒(méi)有硝煙的AI生態(tài)博弈。

長(zhǎng)期以來(lái)，OpenAI以其閉源的GPT系列模型主導(dǎo)市場(chǎng)，一度被視為“閉源模型”的圖騰。然而，其策略正在發(fā)生顯著變化。

今年1月底，OpenAI CEO薩姆·奧特曼罕見(jiàn)表態(tài)稱，OpenAI過(guò)去在開(kāi)源AI軟件方面“一直站在歷史的錯(cuò)誤一邊”，并承認(rèn)內(nèi)部正在討論公開(kāi)AI模型的權(quán)重等事宜。這種公開(kāi)承認(rèn)“錯(cuò)誤”的姿態(tài)，本身就極不尋常。

此后，OpenAI相繼開(kāi)源了AgentSDK、輕量級(jí)編程智能體Codex CLI（兼容o3、o4-mini），并在4月25日深夜突然宣布時(shí)隔6年再次推出開(kāi)源大模型，并向所有用戶開(kāi)放其核心工具“深度研究”（Deep Research）的輕量版本。

雖然此次發(fā)布的開(kāi)放權(quán)重模型，與完全公開(kāi)訓(xùn)練代碼和數(shù)據(jù)仍有差異，但已非常接近開(kāi)源社區(qū)主流模式，被業(yè)內(nèi)視為OpenAI在開(kāi)源與閉源戰(zhàn)略平衡中的關(guān)鍵轉(zhuǎn)折。

這種轉(zhuǎn)變并非空穴來(lái)風(fēng)，其背后有著深刻的驅(qū)動(dòng)因素。來(lái)自中國(guó)的競(jìng)爭(zhēng)加劇，特別是中國(guó)開(kāi)源模型的崛起，無(wú)疑給OpenAI帶來(lái)了巨大壓力。

奧特曼曾坦言，“OpenAI未來(lái)仍會(huì)開(kāi)發(fā)出更好的模型，但領(lǐng)先優(yōu)勢(shì)將比往年有所減少。”

這種略顯“不自信”的表態(tài)，正是中國(guó)大模型力量快速崛起正在改變?nèi)駻I格局的鮮明例證。

甚至有媒體猜測(cè)，2月路透社爆料百度將在3月中發(fā)布文心4.5的消息后，OpenAI在當(dāng)日凌晨發(fā)布GPT-4.5，但其性能被吐槽“差強(qiáng)人意”，發(fā)布略顯倉(cāng)促，頗有應(yīng)對(duì)之意，反映出市場(chǎng)競(jìng)爭(zhēng)的激烈程度和信息快速流動(dòng)的壓力。

谷歌在開(kāi)源方面也持續(xù)發(fā)力。

今年2月，谷歌宣布其最新AI模型套件Gemini 2.0正式向所有用戶開(kāi)放使用。

3月，谷歌更是推出了開(kāi)源多模態(tài)大模型Gemma 3，其主打低成本、高性能的特點(diǎn)，并通過(guò)與Hugging Face、Kaggle等平臺(tái)的無(wú)縫集成，以及與英偉達(dá)合作優(yōu)化GPU推理性能，試圖構(gòu)建“模型+工具鏈+社區(qū)”的全棧優(yōu)勢(shì)，以期在開(kāi)源生態(tài)中占據(jù)制勝關(guān)鍵。

谷歌的這些動(dòng)作，都表明其在開(kāi)源AI領(lǐng)域的重大戰(zhàn)略升級(jí)，也預(yù)示著其在全球AI生態(tài)競(jìng)爭(zhēng)中的新姿態(tài)。

這足以表明，一場(chǎng)中美AI開(kāi)源生態(tài)博弈正在較量中。

無(wú)論是為了擴(kuò)大新技術(shù)采用率，吸引更多開(kāi)發(fā)者共建生態(tài)，還是為了應(yīng)對(duì)日益激烈的市場(chǎng)競(jìng)爭(zhēng)，開(kāi)源都已成為推動(dòng)AI技術(shù)進(jìn)步和產(chǎn)業(yè)繁榮的有效路徑。

五、高明的舵手，會(huì)適時(shí)轉(zhuǎn)彎。

百度文心4.5系列的全面開(kāi)源，不僅展現(xiàn)了其深厚的技術(shù)積累和前瞻性的戰(zhàn)略布局，更是對(duì)當(dāng)前全球AI發(fā)展趨勢(shì)的積極響應(yīng)。

在【發(fā)力AI應(yīng)用】的下半場(chǎng)，技術(shù)本身固然重要，但最終的衡量標(biāo)準(zhǔn)，在于其能否大規(guī)模解決現(xiàn)實(shí)問(wèn)題，能否在千行百業(yè)中落地生根，創(chuàng)造真實(shí)的商業(yè)和社會(huì)價(jià)值。

李彥宏曾言：“開(kāi)源有助于擴(kuò)大新技術(shù)的采用率，更快推進(jìn)規(guī)模化應(yīng)用爆發(fā)。”

當(dāng)大模型的能力日益強(qiáng)大，且門(mén)檻因開(kāi)源而不斷降低時(shí)，真正的競(jìng)爭(zhēng)將聚焦于如何將這些強(qiáng)大的模型能力轉(zhuǎn)化為用戶觸手可及、解決實(shí)際痛點(diǎn)的智能應(yīng)用。

這需要對(duì)垂直行業(yè)的深刻理解，對(duì)用戶需求的精準(zhǔn)把握，以及強(qiáng)大的工程化和產(chǎn)品化能力。

在國(guó)內(nèi)眾多AI企業(yè)中，百度是少數(shù)幾家擁有全場(chǎng)景布局的企業(yè)之一，因?yàn)樗鼡碛凶约旱钠脚_(tái)和生態(tài)系統(tǒng)邏輯，并占據(jù)著獨(dú)特的生態(tài)位，這些優(yōu)勢(shì)決定了其對(duì)大模型技術(shù)的態(tài)度。

這場(chǎng)由中國(guó)力量積極參與的開(kāi)源浪潮，無(wú)疑將加速全球AI格局的演變。

它不僅推動(dòng)了模型性能的提升，更帶動(dòng)了開(kāi)發(fā)者生態(tài)的繁榮，促進(jìn)了更多創(chuàng)新應(yīng)用的涌現(xiàn)。

正如歷史上硅谷巨頭的發(fā)展一樣，企業(yè)決策從來(lái)不是一成不變的，而是基于技術(shù)、市場(chǎng)的動(dòng)態(tài)權(quán)衡。

百度此次選擇全面開(kāi)源，正是其在當(dāng)下市場(chǎng)環(huán)境下，對(duì)技術(shù)成熟度、市場(chǎng)需求和生態(tài)建設(shè)進(jìn)行綜合考量后的戰(zhàn)略選擇。

在新的AI紀(jì)元里，開(kāi)放、協(xié)作和實(shí)際落地將成為衡量AI技術(shù)真正價(jià)值的關(guān)鍵標(biāo)準(zhǔn)。

未來(lái)的AI，不再是象牙塔里的理論模型，而是滲透到各行各業(yè)，賦能個(gè)體與組織，推動(dòng)社會(huì)進(jìn)步的強(qiáng)大力量……

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.