不知道大家還記不記得,早在今年的2月份,百度官方宣布將在6月30日開(kāi)源旗下大模型,一石激起千層浪。
就在6月30日今天,百度兌現(xiàn)承諾,一口氣開(kāi)源文心4.5系列10款大模型,包含混合專家架構(gòu)、文本與多模態(tài)能力,參數(shù)從0.3B至424B不等。
這不僅是國(guó)內(nèi)史無(wú)前例的一次規(guī)模化開(kāi)源,也是放眼全球都極具競(jìng)爭(zhēng)力的一次技術(shù)釋放。
某種程度上,這次開(kāi)源是令百度大模型與國(guó)際巨頭并肩背后“全棧式AI”技術(shù)能力的最新體現(xiàn),也為AI應(yīng)用爆發(fā)按下快進(jìn)鍵。
高明的舵手,會(huì)適時(shí)轉(zhuǎn)彎。
![]()
一、文心4.5開(kāi)源:性能才是硬道理?
此次百度開(kāi)源文心4.5系列,其目的顯然不限于技術(shù)開(kāi)放本身,更在于通過(guò)開(kāi)放,最大化地推動(dòng)整個(gè)AI生態(tài)的繁榮與應(yīng)用落地。
該系列包含了混合專家(MoE)模型和稠密(Dense)模型兩大類別,參數(shù)量覆蓋從0.3B到424B的范圍,實(shí)現(xiàn)了從輕量級(jí)邊緣部署到超大規(guī)模云端推理的全面覆蓋。
![]()
百度方面強(qiáng)調(diào),其預(yù)訓(xùn)練權(quán)重和推理代碼的完全開(kāi)源,在獨(dú)立自研模型數(shù)量占比、模型類型、參數(shù)豐富度以及開(kāi)源寬松度與可靠性等關(guān)鍵維度上,均已達(dá)到行業(yè)領(lǐng)先水平。
![]()
這種全面性,對(duì)于不同需求和資源限制的開(kāi)發(fā)者而言,無(wú)疑提供了極大的靈活性和選擇空間。
在文本模型方面,百度稱其在多個(gè)主流基準(zhǔn)評(píng)測(cè)中超越了DeepSeek-V3和Qwen3。
這并非簡(jiǎn)單的“跑分”優(yōu)勢(shì),而是意味著其在基礎(chǔ)語(yǔ)言理解、事實(shí)準(zhǔn)確性、指令遵循能力、復(fù)雜推理以及編程能力上具備了更強(qiáng)的實(shí)用性和可靠性。
文心4.5預(yù)訓(xùn)練模型在主流基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異:
![]()
文心多模態(tài)后訓(xùn)練模型(支持思考、關(guān)閉思考)在多個(gè)多模態(tài)基準(zhǔn)測(cè)試中達(dá)到SOTA水平
![]()
對(duì)于企業(yè)級(jí)應(yīng)用和開(kāi)發(fā)者而言,這些能力的提升直接轉(zhuǎn)化為更高效、更精準(zhǔn)的AI驅(qū)動(dòng)解決方案。
而在更具前瞻性的多模態(tài)能力上,文心4.5系列展現(xiàn)了卓越的視覺(jué)感知能力和豐富的視覺(jué)常識(shí),實(shí)現(xiàn)了“思考與非思考的統(tǒng)一”。
在視覺(jué)常識(shí)、多模態(tài)推理、視覺(jué)感知等主流多模態(tài)大模型評(píng)測(cè)中,百度披露的數(shù)據(jù)顯示其性能甚至優(yōu)于閉源的OpenAI o1。
尤其值得關(guān)注的是,即使在輕量級(jí)模型上,文心4.5也表現(xiàn)出驚人的競(jìng)爭(zhēng)力,體現(xiàn)了“以小博大”的策略。
比如,文心4.5-21B-A3B-Base文本模型的效果與同量級(jí)的Qwen3相當(dāng);而文心4.5-VL-28B-A3B多模態(tài)模型更是同量級(jí)中表現(xiàn)最優(yōu),甚至能與更大參數(shù)量的Qwen2.5-VL-32B不相上下。
![]()
對(duì)于廣大開(kāi)發(fā)者而言,這意味著能夠以更低的算力消耗和部署成本,獲得高性能的大模型能力,這無(wú)疑將大幅降低AI應(yīng)用的門(mén)檻,促進(jìn)中小企業(yè)和個(gè)人開(kāi)發(fā)者參與到大模型生態(tài)的建設(shè)中,激發(fā)長(zhǎng)尾創(chuàng)新。
這種對(duì)輕量級(jí)高性能模型的關(guān)注,也符合當(dāng)前AI模型部署走向邊緣化、嵌入式的趨勢(shì)。
此外,開(kāi)發(fā)者可以通過(guò)Hugging Face、飛槳星河社區(qū)等主流開(kāi)源平臺(tái)輕松下載和部署模型,也可以選擇在百度智能云千帆大模型平臺(tái)使用開(kāi)源模型的API服務(wù)。
這種多渠道、靈活的接入方式,不僅便利了開(kāi)發(fā)者,也體現(xiàn)了百度在推動(dòng)開(kāi)源生態(tài)繁榮上的決心和開(kāi)放性,旨在最大限度地降低使用門(mén)檻。
![]()
二、全棧技術(shù)底氣:搶占戰(zhàn)略制高點(diǎn)
文心4.5系列的全面開(kāi)源,并非一時(shí)調(diào)整,而是百度十多年來(lái)在AI領(lǐng)域深耕細(xì)作、“全棧”技術(shù)布局的必然結(jié)果。
這種全棧優(yōu)勢(shì),覆蓋了芯片、框架、模型到應(yīng)用的各個(gè)層面,形成了一個(gè)高效的反饋閉環(huán),為開(kāi)源策略提供了堅(jiān)實(shí)的支撐,同時(shí)也構(gòu)筑了其獨(dú)特的競(jìng)爭(zhēng)壁壘。
首先是算力基礎(chǔ)設(shè)施。
大模型的訓(xùn)練和推理對(duì)算力有著近乎苛刻的需求,這被普遍視為AI發(fā)展的關(guān)鍵瓶頸之一。百度自研的昆侖芯在性能和性價(jià)比上具備優(yōu)勢(shì),被認(rèn)為是降低單位算力成本的重要途徑。根據(jù)公開(kāi)資料,昆侖芯能在更少的計(jì)算資源下運(yùn)行大規(guī)模模型,從而直接降低了訓(xùn)練和推理所需的計(jì)算量和成本。
更關(guān)鍵的是,百度智能云成功點(diǎn)亮國(guó)內(nèi)首個(gè)自研昆侖芯三代萬(wàn)卡集群,并計(jì)劃進(jìn)一步點(diǎn)亮3萬(wàn)卡集群。
這種大規(guī)模集群的建設(shè),不僅提供了充足的算力供應(yīng),更通過(guò)任務(wù)并行調(diào)度、彈性算力管理等方式,極大提高了計(jì)算資源利用率,避免算力閑置,從而降低了整體算力成本。
在穩(wěn)定性方面,百度自研的「BCCL(百度集合通信庫(kù))」能夠快速定位故障并提供自動(dòng)化容錯(cuò)能力,將故障恢復(fù)時(shí)間從小時(shí)級(jí)降低到分鐘級(jí),確保集群有效訓(xùn)練率達(dá)到98%。
這種對(duì)底層算力設(shè)施的掌握和優(yōu)化能力,是支撐大規(guī)模模型訓(xùn)練和穩(wěn)定推理的根本保障,也是百度選擇開(kāi)源的深層底氣。
其次是深度學(xué)習(xí)框架飛槳。
作為百度的核心技術(shù)資產(chǎn),飛槳為文心大模型的訓(xùn)練、推理和部署提供了強(qiáng)大支撐。
今年4月1日,深度學(xué)習(xí)平臺(tái)飛槳宣布新一代飛槳框架3.0正式發(fā)布,其核心亮點(diǎn)在于“動(dòng)靜統(tǒng)一自動(dòng)并行”等五大核心技術(shù)創(chuàng)新,旨在大幅降低大模型開(kāi)發(fā)訓(xùn)練成本,讓算法創(chuàng)新回歸核心價(jià)值。
飛槳框架3.0的“訓(xùn)推一體”設(shè)計(jì)理念,打破了訓(xùn)練與推理的割裂狀態(tài),通過(guò)全方位深度優(yōu)化,能夠支持眾多開(kāi)源大模型進(jìn)行高性能推理,據(jù)稱,在DeepSeek-R1等模型上,飛槳的單機(jī)部署吞吐量甚至能提升一倍。
這種效率提升,直接關(guān)系到開(kāi)發(fā)者的實(shí)際使用成本和開(kāi)發(fā)效率。
李彥宏曾在2024年初的財(cái)報(bào)電話會(huì)上透露,文心大模型的推理成本已降至一年前的1%。
這一數(shù)據(jù)如果屬實(shí),無(wú)疑是行業(yè)內(nèi)的重要突破,它不僅大幅降低了百度自身的運(yùn)營(yíng)成本,也為企業(yè)和開(kāi)發(fā)者基于文心大模型進(jìn)行開(kāi)發(fā)和二次開(kāi)發(fā)提供了更低的成本門(mén)檻,從而加速了模型的商業(yè)化落地。
飛槳框架與文心大模型的協(xié)同優(yōu)化,正是百度實(shí)現(xiàn)【框架層+模型層”雙層開(kāi)源】的關(guān)鍵。
這種模式不僅僅是開(kāi)放了最先進(jìn)的模型,更提供了支撐模型運(yùn)行和優(yōu)化的底層工具,這對(duì)于構(gòu)建一個(gè)活躍、健康的開(kāi)發(fā)者生態(tài)至關(guān)重要。
截至2024年10月,飛槳文心生態(tài)已凝聚1808萬(wàn)開(kāi)發(fā)者,服務(wù)了43萬(wàn)家企事業(yè)單位,創(chuàng)建了101萬(wàn)個(gè)模型,這些數(shù)據(jù)都印證了其生態(tài)的活力和影響力。
這種從底層到應(yīng)用的全面開(kāi)放策略,旨在吸引更廣泛的參與者,形成強(qiáng)大的網(wǎng)絡(luò)效應(yīng)。
![]()
三、應(yīng)用驅(qū)動(dòng):開(kāi)源的最終目的在于價(jià)值落地
大模型開(kāi)源與閉源的路線之爭(zhēng),最終都要回歸到一點(diǎn):能否解決現(xiàn)實(shí)問(wèn)題,能否產(chǎn)生真實(shí)價(jià)值。
從單純的技術(shù)能力競(jìng)賽轉(zhuǎn)向?qū)嶋H應(yīng)用落地,從實(shí)驗(yàn)室走向市場(chǎng),真正賦能千行百業(yè),越來(lái)越成為必然。
文心4.5的開(kāi)源,正是為了加速AI應(yīng)用的爆發(fā),將百度內(nèi)部已驗(yàn)證的成功經(jīng)驗(yàn)推向外部,形成“內(nèi)部勢(shì)能外溢”的效應(yīng)。百度內(nèi)部已率先基于文心4.5進(jìn)行了多項(xiàng)應(yīng)用升級(jí),并取得了顯著成果,這些案例成為了文心4.5能力落地的最佳證明。
最典型的例子是近期火爆出圈的羅永浩數(shù)字人直播帶貨的成功。
![]()
這場(chǎng)直播首秀創(chuàng)下超1300萬(wàn)人次觀看、GMV突破5500萬(wàn)元的行業(yè)新紀(jì)錄,甚至在部分核心品類帶貨量反超真人直播。
這類數(shù)字人具備聲形超擬真、內(nèi)容更專業(yè)、互動(dòng)更靈活的特點(diǎn),并能根據(jù)直播間實(shí)時(shí)熱度和轉(zhuǎn)化情況,靈活調(diào)度助播、場(chǎng)控、運(yùn)營(yíng)等角色,真正實(shí)現(xiàn)了“一個(gè)人就是一支營(yíng)銷(xiāo)團(tuán)隊(duì)”的效能,極大地提升了直播效率和轉(zhuǎn)化率。
這同時(shí)也印證了李彥宏在今年4月百度Create開(kāi)發(fā)者大會(huì)上的預(yù)判:“2025年最令人激動(dòng)的突破性應(yīng)用之一,就是AI數(shù)字人。”
IDC報(bào)告顯示,百度居中國(guó)AI數(shù)字人市場(chǎng)份額第一,這與多模態(tài)大模型的底層支撐密不可分,也預(yù)示著數(shù)字人市場(chǎng)即將迎來(lái)爆發(fā)。
除了數(shù)字人,百度旗下的其他AI應(yīng)用產(chǎn)品也正在基于文心4.5進(jìn)行功能升級(jí),展現(xiàn)了模型賦能業(yè)務(wù)的多元化。
比如說(shuō),文心快碼發(fā)布了獨(dú)立IDE,成為行業(yè)首個(gè)多模態(tài)、多智能體協(xié)同AI IDE,集成了文心最新模型,為開(kāi)發(fā)者提供更強(qiáng)大的智能交互體驗(yàn),極大地提高了編程效率和智能輔助水平。
![]()
文小言也升級(jí)了多模型調(diào)度、圖片問(wèn)答等能力,通過(guò)整合百度自研模型(如文心X1、文心4.5)并接入DeepSeek-R1、可靈等第三方模型,實(shí)現(xiàn)了多模型間的智能協(xié)同,提升了用戶在多模態(tài)交互場(chǎng)景下的體驗(yàn)。
這些內(nèi)部應(yīng)用的成功實(shí)踐,不僅驗(yàn)證了文心4.5在實(shí)際業(yè)務(wù)場(chǎng)景中的效能,也為外部開(kāi)發(fā)者提供了可復(fù)制的經(jīng)驗(yàn)和可參考的落地路徑,加速了AI能力的普惠和商業(yè)化進(jìn)程。
從更廣闊的視角來(lái)看,開(kāi)源的趨勢(shì)正在全球范圍內(nèi)加速,這是一種行業(yè)共識(shí)的形成。
Gartner在2025年中國(guó)人工智能(AI)十大趨勢(shì)中明確指出,開(kāi)放式GenAI模型已成為中國(guó)超大規(guī)模云和AI提供商的普遍做法,并預(yù)測(cè)到2026年,中國(guó)50%的AI產(chǎn)業(yè)生態(tài)將基于開(kāi)放式GenAI模型構(gòu)建。
這表明開(kāi)源已不僅僅是技術(shù)選擇,更成為一種不可逆轉(zhuǎn)的產(chǎn)業(yè)趨勢(shì),它將極大促進(jìn)創(chuàng)新、技術(shù)進(jìn)步和AI普惠。
![]()
四、全球AI格局的開(kāi)放轉(zhuǎn)向
百度文心4.5的開(kāi)源,正值全球AI巨頭策略調(diào)整的關(guān)鍵時(shí)期,尤其是在OpenAI和谷歌兩大玩家的動(dòng)向中,這種“開(kāi)放”轉(zhuǎn)向表現(xiàn)得尤為明顯,描繪出了一場(chǎng)沒(méi)有硝煙的AI生態(tài)博弈。
長(zhǎng)期以來(lái),OpenAI以其閉源的GPT系列模型主導(dǎo)市場(chǎng),一度被視為“閉源模型”的圖騰。然而,其策略正在發(fā)生顯著變化。
今年1月底,OpenAI CEO薩姆·奧特曼罕見(jiàn)表態(tài)稱,OpenAI過(guò)去在開(kāi)源AI軟件方面“一直站在歷史的錯(cuò)誤一邊”,并承認(rèn)內(nèi)部正在討論公開(kāi)AI模型的權(quán)重等事宜。這種公開(kāi)承認(rèn)“錯(cuò)誤”的姿態(tài),本身就極不尋常。
此后,OpenAI相繼開(kāi)源了AgentSDK、輕量級(jí)編程智能體Codex CLI(兼容o3、o4-mini),并在4月25日深夜突然宣布時(shí)隔6年再次推出開(kāi)源大模型,并向所有用戶開(kāi)放其核心工具“深度研究”(Deep Research)的輕量版本。
雖然此次發(fā)布的開(kāi)放權(quán)重模型,與完全公開(kāi)訓(xùn)練代碼和數(shù)據(jù)仍有差異,但已非常接近開(kāi)源社區(qū)主流模式,被業(yè)內(nèi)視為OpenAI在開(kāi)源與閉源戰(zhàn)略平衡中的關(guān)鍵轉(zhuǎn)折。
這種轉(zhuǎn)變并非空穴來(lái)風(fēng),其背后有著深刻的驅(qū)動(dòng)因素。來(lái)自中國(guó)的競(jìng)爭(zhēng)加劇,特別是中國(guó)開(kāi)源模型的崛起,無(wú)疑給OpenAI帶來(lái)了巨大壓力。
奧特曼曾坦言,“OpenAI未來(lái)仍會(huì)開(kāi)發(fā)出更好的模型,但領(lǐng)先優(yōu)勢(shì)將比往年有所減少。”
這種略顯“不自信”的表態(tài),正是中國(guó)大模型力量快速崛起正在改變?nèi)駻I格局的鮮明例證。
甚至有媒體猜測(cè),2月路透社爆料百度將在3月中發(fā)布文心4.5的消息后,OpenAI在當(dāng)日凌晨發(fā)布GPT-4.5,但其性能被吐槽“差強(qiáng)人意”,發(fā)布略顯倉(cāng)促,頗有應(yīng)對(duì)之意,反映出市場(chǎng)競(jìng)爭(zhēng)的激烈程度和信息快速流動(dòng)的壓力。
![]()
谷歌在開(kāi)源方面也持續(xù)發(fā)力。
今年2月,谷歌宣布其最新AI模型套件Gemini 2.0正式向所有用戶開(kāi)放使用。
3月,谷歌更是推出了開(kāi)源多模態(tài)大模型Gemma 3,其主打低成本、高性能的特點(diǎn),并通過(guò)與Hugging Face、Kaggle等平臺(tái)的無(wú)縫集成,以及與英偉達(dá)合作優(yōu)化GPU推理性能,試圖構(gòu)建“模型+工具鏈+社區(qū)”的全棧優(yōu)勢(shì),以期在開(kāi)源生態(tài)中占據(jù)制勝關(guān)鍵。
谷歌的這些動(dòng)作,都表明其在開(kāi)源AI領(lǐng)域的重大戰(zhàn)略升級(jí),也預(yù)示著其在全球AI生態(tài)競(jìng)爭(zhēng)中的新姿態(tài)。
這足以表明,一場(chǎng)中美AI開(kāi)源生態(tài)博弈正在較量中。
無(wú)論是為了擴(kuò)大新技術(shù)采用率,吸引更多開(kāi)發(fā)者共建生態(tài),還是為了應(yīng)對(duì)日益激烈的市場(chǎng)競(jìng)爭(zhēng),開(kāi)源都已成為推動(dòng)AI技術(shù)進(jìn)步和產(chǎn)業(yè)繁榮的有效路徑。
![]()
五、高明的舵手,會(huì)適時(shí)轉(zhuǎn)彎。
百度文心4.5系列的全面開(kāi)源,不僅展現(xiàn)了其深厚的技術(shù)積累和前瞻性的戰(zhàn)略布局,更是對(duì)當(dāng)前全球AI發(fā)展趨勢(shì)的積極響應(yīng)。
在【發(fā)力AI應(yīng)用】的下半場(chǎng),技術(shù)本身固然重要,但最終的衡量標(biāo)準(zhǔn),在于其能否大規(guī)模解決現(xiàn)實(shí)問(wèn)題,能否在千行百業(yè)中落地生根,創(chuàng)造真實(shí)的商業(yè)和社會(huì)價(jià)值。
李彥宏曾言:“開(kāi)源有助于擴(kuò)大新技術(shù)的采用率,更快推進(jìn)規(guī)模化應(yīng)用爆發(fā)。”
當(dāng)大模型的能力日益強(qiáng)大,且門(mén)檻因開(kāi)源而不斷降低時(shí),真正的競(jìng)爭(zhēng)將聚焦于如何將這些強(qiáng)大的模型能力轉(zhuǎn)化為用戶觸手可及、解決實(shí)際痛點(diǎn)的智能應(yīng)用。
這需要對(duì)垂直行業(yè)的深刻理解,對(duì)用戶需求的精準(zhǔn)把握,以及強(qiáng)大的工程化和產(chǎn)品化能力。
在國(guó)內(nèi)眾多AI企業(yè)中,百度是少數(shù)幾家擁有全場(chǎng)景布局的企業(yè)之一,因?yàn)樗鼡碛凶约旱钠脚_(tái)和生態(tài)系統(tǒng)邏輯,并占據(jù)著獨(dú)特的生態(tài)位,這些優(yōu)勢(shì)決定了其對(duì)大模型技術(shù)的態(tài)度。
這場(chǎng)由中國(guó)力量積極參與的開(kāi)源浪潮,無(wú)疑將加速全球AI格局的演變。
它不僅推動(dòng)了模型性能的提升,更帶動(dòng)了開(kāi)發(fā)者生態(tài)的繁榮,促進(jìn)了更多創(chuàng)新應(yīng)用的涌現(xiàn)。
正如歷史上硅谷巨頭的發(fā)展一樣,企業(yè)決策從來(lái)不是一成不變的,而是基于技術(shù)、市場(chǎng)的動(dòng)態(tài)權(quán)衡。
百度此次選擇全面開(kāi)源,正是其在當(dāng)下市場(chǎng)環(huán)境下,對(duì)技術(shù)成熟度、市場(chǎng)需求和生態(tài)建設(shè)進(jìn)行綜合考量后的戰(zhàn)略選擇。
在新的AI紀(jì)元里,開(kāi)放、協(xié)作和實(shí)際落地將成為衡量AI技術(shù)真正價(jià)值的關(guān)鍵標(biāo)準(zhǔn)。
未來(lái)的AI,不再是象牙塔里的理論模型,而是滲透到各行各業(yè),賦能個(gè)體與組織,推動(dòng)社會(huì)進(jìn)步的強(qiáng)大力量……
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.