![]()
文:董指導
題圖由文心一言4.5生成
本期要點
#AI#大模型#多模態#百度
何小鵬在接受《晚點》采訪時,對新能源車行業用了四個字:寬容個屁。這個描述,對于大模型行業,也是有過之而無不及。
大模型行業,就像一個古羅馬競技場。只是看臺上坐的不是貴族,而是用戶;競技場內不只有創業者,巨頭們也成為了角斗士。不管是以算法起家的、有國民級應用的、云平臺領先的、擅長流量運作的,還是AI入局最早的,都容不得一絲懈怠。
對百度而言,大模型這場仗,輸不起。外界對百度在大模型上一舉一動也非常關注。
01 反擊,很意外
出乎意料,百度在周日,連發兩大前沿大模型。沒有發布會,直接上線。
3月16日早間,百度發布了文心大模型4.5和文心大模型X1。文心4.5是首個原生態多模態大模型,對標的是Open AI的GPT4.5、GPT4O,從評測跑分看,略勝一籌。X1直接對標最當紅的推理模型DeepSeek R1,主要能力上不輸,差異化優勢是有多模態能力,能調用工具。
百度這兩款模型是“現貨”,任何人都可以馬上用,免費。之前百度預告的是文心4.5將在4月1號才免費,事實上提前了半個月。對企業客戶,API調用的價格也非常有競爭力,文心4.5的API調用價格是GPT4.5的1/100;文心X1的API價格也只有DeepSeek R1的一半。
海外,路透、彭博等主流媒體報道之后,引發了社交媒體X.COM上很多科技自媒體的關注,被認為是DeepSeek之后,又一中國大模型的里程碑,甚至有網友@open AI,說“游戲結束了”。
![]()
AI競技場,百度展開絕地反擊。但面向未來,百度的AI,AI里的百度,何去何從?
02 變化,不糾結
DeepSeek對AI行業產生了巨大影響:
一是提醒行業,大模型能力提升,不只有堆算力的方式,算法創新依然有很大空間;
二是向行業宣告,大模型依然處于能力提升、實力競爭的階段,還沒有進入商業變現階段;
三是證明了“開源未必好用,但好用的產品開源”,就能形成快速傳播、打開通往AI基礎設施之路。這一點連OpenAI的奧特曼也開始反思,閉源路線有點問題。
一句話總結就是:行業正經歷著新一輪的劇烈變化。既是行業競爭的變化,也是行業趨勢的變化。這個關鍵時刻的企業選擇、做法,會更加重要、對未來影響也更為深遠。
面對變化,一家企業如果怠慢變化,就會患上腐朽的“大企業病”;忽略變化,就存在被淘汰的隱患;拒絕變化,就是通向被淘汰命運的最快路徑。
而2025年一開年,業界就發現:百度開始變了。
2月16日,行業內不少產品還處于DeepSeek接入灰度測試時,百度就宣布:百度搜索全面接入DeepSeek,繼而是文心智能體、百度地圖等等多個產品。而在之前,百度內部推動的一直是所有產品全面接入自家的文心一言大模型。
李彥宏最近在一次內部講話時說,“我們有一個思路轉變,過去兩年非常強調要用文心,所有的業務都給文心提要求,我們希望一個通用的模型能夠解決所有的業務問題。
現在看起來,一方面我們的資源也有限,不可能支持所有的需求;另外一方面,外界確實也有很多不錯的技術,所以我們應該保持一個開放的心態,如果外面有好的東西,應該拿來用,我們自己干的都是外部買不到的。”
另一個重大變化是,和之前“文心3.5免費、文心4.0收費“的模式截然相反,文心4.5發布之日,就即刻免費,而且也會正式開源。
![]()
這兩個變化,并非輕描淡寫。這意味著用戶導向和開放心態。應用的最終目的,是讓用戶可以高效、高質量地解決需求,并非糾結底層用誰的大模型;大模型的最終用處,也是解決用戶需求,而非豎起高院深墻。
這些理念,在騰訊旗下微信、騰訊元寶等多個產品接入DeepSeek的決策中,也是同樣體現。
也有一些人會用這些決定,來對比百度此前的判斷和決定。我想,在百度內部也一定有過類似的爭吵、質疑、擔憂,甚至吹胡子、拍桌子,但最終呈現給大眾的則是:
在所謂“打臉”和“沉默”、“里子”和“面子”之間,百度還是選擇了前者,選擇了思考反思、選擇了直面變化、而且擁抱變化。
這個做法,可以說是回擊了市場對百度戰略判斷能力的質疑。所謂“諸葛一生唯謹慎,呂端大事不糊涂”。
當行業發生重大變化、之前判斷的環境依據發生改變、行業競爭來到關鍵時刻時,能否做出正確的判斷和執行,不僅是能力體現,更關乎企業的生存和發展。
畢竟,戰略,不是文字,而是行動。
03 沖鋒,多模態
DeepSeek也為AI行業帶來了機遇:
一是文本能力的顯著改善,可應用的場景增加,實用性提升。正如李彥宏之前判斷,大模型只有具有實用性,才會有價值。這也是眾多產品、企業,紛紛接入DeepSeek的原因之一。
二是加速了AI的普及。DeepSeek在中外媒體的報道下,快速傳播,在一周內就獲得了億級別的用戶,成為互聯網史上增長最快的產品。這個進程,也讓更多人接觸到了AI,開始嘗試使用AI。龐大的用戶基礎和仍處于旺盛的嘗鮮意愿,也會對整個行業產生正面影響。
三是用開源、免費的方式,為行業打了樣。DeepSeek被認為有望成為中國AI基礎設施之一,但目前DeepSeek仍聚焦于文本領域,于是,就留下了新的戰略位置:多模態基礎設施。
為什么多模態是重要的戰略位置?我把這個問題發給了百度最新發布的文心X1深度思考模型。它的答案包括了技術演進、應用場景、商業價值和未來生態四個方面。我對答案非常認同。
現實的世界就是多模態的,純文本模型難以處理多維信息,而多模態則可以提升AI對復雜場景的理解能力,實用性提升,從“工具”邁向“智能體”。
![]()
這就不難理解,百度官方特別強調,“文心大模型4.5是百度自研新一代原生多模態基礎大模型”,并且通過多個測試集的跑分,證明在多模態能力上超過GPT-4o。
3月初,李彥宏在人民網發表的署名文章還提到:“原生多模態大模型,打破之前先訓練單模態模型再拼接的方式,通過統一架構實現文本、圖像、音頻、視頻等多模態數據的?原生級融合,實現對復雜世界的統一理解,這是邁向通用人工智能(AGI)的重要一步。”
如何搶占多模態的關鍵位置呢?
DeepSeek-R1橫空出世后,網民紛紛問它一個問題:幾個大廠為什么沒有做出R1?并且要求R1采用各種口吻來調侃。
與網民們歡樂的心情不同,大廠們除了反思之外,更多的精力還是投向了研發。畢竟,商業江湖,實力說話、產品說話。
百度被網民們稱為 “AI 起大早者”,其實百度并不只是國內最早的人工智能公司,目前也依然是研發實力在線的公司:文本、語音、圖像、視頻;強化學習、MoE、甚至底層芯片設計;各個條線上的帶頭人,依然是活躍在技術圈的大咖;也有新人能沖、老人能穩的人才梯隊。
網上有個說法,百度不是沒有研發實力,而是太想追求商業模式(微軟、OpenAI 也是如此)。而 DeepSeek 的 V3、R1,則是兩記響亮的 “鞭聲”,嚴肅的提醒。
于是,一個多月后,百度自主研發的新一代原生多模態基礎大模型文心 4.5 就發布了。從體驗效果來看,文心 4.5 能對文字、圖片、音頻、視頻等內容進行綜合理解。不僅有 “高智商” 可以解答數理問題,也有 “高情商”,懂網絡梗圖、諷刺漫畫。
比如,輸入網絡梗圖“連續不一定可倒、可倒不一定連續”后,文心 4.5 既能識別其中的幽默,也能解釋對應的數學概念。

文心 X1 則是首個能自主運用工具的深度思考模型。支持高級搜索、文檔問答、圖片理解、AI 繪圖、代碼解釋器、網頁鏈接讀取、TreeMind 樹圖、百度學術檢索、商業信息查詢、加盟信息查詢等等多款工具。
比如,我給 X1 一張圖,讓它根據這張圖,給我繪制一個曲線圖,表現 “美國前 100 強公司總裁的部門背景 ”。
![]()
X1 在經過一段思考推理后,調用了代碼工具,用 python 寫了一段程序,最后生成了一個非常準確且漂亮的曲線圖。
![]()
性能的背后,是算法的提升。比如文心 4.5 采用了 FlashMask 動態注意力掩碼、 多模態異構專家擴展等多個技術;文心 X1 創新性地應用遞進式強化學習方法,基于思維鏈和行動鏈的端到端訓練,并建立了統一的評估系統,可以為模型訓練提供更加魯棒的反饋。
除了算法突破之外,大模型要有實用性,還要有算力支撐,避免 “服務器繁忙,請稍后再試”。這對于大模型公司而言,既考驗算力能力、也考驗算力成本。
在算力方面,阿里有自研的 “平頭哥”,百度也有自研的 “昆侖芯”,基于第三代昆侖芯的萬卡集群也在 2 月 5 日成功點亮,這是確保用戶體驗的重器。
如果沒有文心 4.5 和 X1 的發布,百度接入 DeepSeek、免費之類的改變,很容易被懷疑是 “妥協”;而兩大前沿模型連發,則是自研實力的證明,不僅說明百度依然在 AI 的牌桌上,位于第一梯隊里,更是表明了百度用 “實用性”,向多模態這個戰略位置的邁進、插旗。
04 結語
兩年前,百度是國內首個發布對標 GPT 產品的科技大廠;隨后行業開啟了日新月異的變化。
在這種環境下,一家企業,該冒的風險必須要去冒,實在不行就退回來。如果每邁出一步都要經過深思熟慮才邁,那不是步子邁得穩,而是邁得太慢。
畢竟,在變化迅速的時代與領域,大膽創新勝于平庸保守。
前段時間我看到一個數據,還是頗有驚訝。著名的投資機構a16z,發布了全球月活用戶數排名前50的移動端AI應用,位列全球第四、中國第一的產品,是百度AI搜索。
![]()
這就說明,龐大的用戶數,只要創新,就有機會。
這一次,不管是發布的原生多模態基礎大模型文心 4.5 和深度思考大模型文心 X1,還是采用的免費、開源做法,都是打破保守、回到創新的表現。
于百度公司而言,這是向多模態戰略高地的沖鋒;于 AI 行業而言,這是多模態能力平權的加速;于國家而言,這是 AI 基礎設施形成的又進一步。
但是,模型性能提升、實用性增強,是一場需要時刻用百米沖刺的速度來跑的馬拉松,是一場需要時刻警醒的競技賽。百度唯有保持迭代的技術、迭代的思想,一路狂奔,才能留在 C 位。
---全文完,歡迎交流
理工/金融 復合背景
暢銷書《英偉達之道》譯者
百億私募/頭部自媒體 雙重經歷
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.