![]()
MiniCPM-o 4.5讓人機交互再上新臺階。
據IPO早知道消息,面壁智能日前發布了新的全模態模型 MiniCPM-o 4.5。
值得一提的是,MiniCPM-o 4.5 是行業首個全雙工全模態大模型,模型「重新定義人機交互方式」,是面壁 2025 年 1 月份全球首次開源全模態模型 MiniCPM-o 2.6 之后,又一次具有「行業引領意義」的模型。2025年,MiniCPM-o 2.6 就已讓端側大模型實現了持續看、實時聽、自然說的能力。
具體而言,MiniCPM-o 4.5 參數為 9B,讓人機交互再上新臺階——AI 不止于死板的“對講機”回合制交互,通過「邊看、邊聽、主動說」的全模態能力,在各種情況下都隨時保持「看」和「聽」的感知,可以選擇恰當的時機給出及時回應,并根據環境變化實時調整對話策略,成為行業首個可以「即時自由對話」的大模型,感知不中斷、交互零等待、對話不死板,真正具備了「類人感知+交互溝通」能力,開啟了人機交互的新時代。
這次發布的MiniCPM-o 4.5 也繼承了面壁小鋼炮一貫的“高密度”特點,僅靠 9B 參數,在全模態、視覺理解、文檔解析、語音理解和生成、聲音克隆等方方面面,均做到了全模態模型 SOTA 水準。同時,MiniCPM-o 4.5 不僅在模型能力密度上再上臺階,也一直致力于追求大模型的極致「能效比」,通過更低的顯存占用、更快的響應速度,確保在提供 SOTA 級全模態表現的同時,實現了最佳的推理效率和最低的推理開銷。
得益于具備類人感知與交互能力、再加上只有 9B 的“小身材”,像具身機器人、汽車、PC 等不同終端交互模式都將進化。以具身機器人為例,目前具身廠商是以研發運控、VLA 模型為主,但行業一直缺乏“理解、溝通、交互”的能力,而像 MiniCPM-o 4.5 則有望補齊具身機器人大腦能力,變得更加智能。
![]()
此外,面壁智能本次還同步官宣了面壁首款 AI 硬件松果派(Pinea Pi)——一款 AI 原生 (AI Native) 的端側智能開發板將于今年年中上市,通過面壁智能在多模態模型技術積累、主流芯片適配、智能硬件商業化應用等優勢,幫助開發者快速開發端側智能硬件,即使無技術背景,也可快速上手開發。松果派將率先支持離線多模態個人知識助理、具身智能、編程教具等場景的全棧開發。
無論你是 AI 工程師、創客團隊、學生,都能利用松果派,創造端側智能的無限想象。”面壁智能表示。
在MiniCPM-o 4.5發布及首款 AI 硬件官宣之際,面壁智能聯合創始人兼 CEO 李大海,清華大學計算機系長聘教授、面壁智能聯合創始人兼首席科學家劉知遠,面壁智能聯合創始人兼 COO 雷升濤以及清華大學人工智能學院助理教授、面壁智能多模態首席科學家姚遠向「IPO早知道」等分享了對于面壁最新產品的思考、以及對面壁整體戰略的規劃。
以下系經「IPO早知道」整理的對話節選:
Q:這次你們發布的MiniCPM-o 4.5是一個全模態模型,最初的思考邏輯是怎樣的?
面壁智能:當我們在做的時候,還是把它當成基礎模型來看待。所以我們在研發的時候首先是關注它作為全模態基礎模型的整體能力如何提升、泛化性怎么提高;其次,我們相信全模態模型未來在賦能終端上有非常大的潛力,不管是汽車、手機還是機器人,MiniCPM-o 4.5這樣的全模態模型能夠同時全雙工地去感知環境,然后再去回應用戶,也就是把我們現在設備的被動式響應變成一個主動式智能,這是一個范式的提升,未來一定能夠衍生出非常多的場景。
對于我們面壁智能而言,我們作為一家基模公司,我們的工作模式一定不是說去針對某一個場景去訓一個模型,而是我們要通過技術驅動訓出一個好的基礎模型,從而一下子開放出一批場景。
Q:但這個行業變化實在太快,怎么讓自己持續在牌桌上?
面壁智能:我認為最重要的是能夠不斷推出優秀的模型。我們面壁一直秉承的定位是要做“大模型的光刻機”,這個光刻機就是指讓我們不斷訓練出更高知識密度的大模型,這才是最重要的產品。同時,作為一家創業公司,在擁有技術優勢的時候,我們也要同步去構建其他維度的優勢,比如商業側的優勢、生態側的優勢、品牌的優勢等等,要把自己的優勢從單一優勢變成綜合性優勢,這也是我們在持續做的事情。
其實面壁作為一個大模型公司,我們一直是“兩條腿走路”——我們從2023年開始就積極地在做商業化,在不斷地提升自己模型能力的同時亦積極在做商業化,到今天為止我們在商業化上面也交出了我們自己認為還不錯的答卷。
Q:坦率說,競爭也是很殘酷的,無論是同為創業公司友商或者大廠都隨時有可能切入同樣的事情?
面壁智能:AI本身是一個產業級別的機會、是第四次技術革命,所以創業公司肯定會有大量的機會,無非就是這家公司想要在一個非常廣闊的賽道里占領比較小的份額,還是說要在一個比較垂直的市場爭取頭部。這取決于各家創業公司的策略,但總體而言大家都還有很大的發揮空間。
Q:最近也有不少模型公司開始重視端側模型了,這其實本來是你們最擅長的。
面壁智能:端側是一個大方向,端側里面也有非常多不同的終端,每個終端面向的場景又都不一樣,所以它不是一個統一的市場。換句話說,端側市場是一個非常大的市場,足夠同時容納多家不同的創業公司,我們面壁也不是要把整個市場都占下來。從另一個角度來看,這樣一個分散的、長尾的,又具有諸多高價值場景的市場,才更有可能是創業公司在創業初期去攻克的領域,我們目前也做得還不錯。
終端本身就是一個非常大的代名詞,有著各種各樣的終端。從策略上來講,我們也不會跟其他公司去打“陣地戰”,現在還沒到那個階段,還處于一片藍海的狀態,大家只要能做出足夠的差異化。哪怕就是在同一個領域里,客戶或者用戶的需求也是多種多樣的。還是回到那句話,這個市場能容得下很多家創業公司,各自都能有比較好的發展。
相對而言,我們起步更早一些,當我們2023年開始做的時候,無論是資本市場還是客戶,都在質疑說手機、車、機器人需要大模型嘛。到了2024年中蘋果推出iphone intelligence后,大家又覺得既然蘋果都在硬在端側模型了,那說明手機上可以跑大模型了。我們很快就收到了來自投資人的積極反饋,覺得我們做對了。
所以在我們看來,越好的廠商進入這個賽道、把這個行業的蛋糕最大,是一件非常值得高興的事情,也說明我們最初的認知、最初的堅持得到了大家的認可。
Q:這次你們還官宣了首款AI硬件“松果派”將于今年年中發布的信息,這又是怎樣的一個考慮?
面壁智能:其實當我們發力端側模型來時,就判斷軟硬協同、軟硬一體是未來的發展趨勢。包括后來在做智能座艙等業務的時候,越發覺得這個判斷是正確的,也想著怎么在“軟硬一體”這個方向上有所突破。
“松果派”更多還是希望把整個生態建立起來,對商業化沒有太大的訴求。我們希望的是通過這樣一個軟硬一體解決方案,讓更多人、更快地感知到我們的模型能力并在各個場景中用起來,也就是打通模型到應用的最后一“公里”,這是現在行業的痛點之一。
這其實也是在踐行我們發布端側原生模型的一個理念,就是在發布的時候能把模型和硬件適配好。松果派只是第一個,我們希望后續有更多的硬件廠商、芯片廠商能夠加入到這個計劃中來,這樣我們的模型就能在各種主流芯片中都適配得非常好,從而把行業生態搭建起來。
在商業化的角度,單純說把MiniCPM部署到數百億臺設備上,這件事情確實可能比較難,但我們可以更多依靠開發者生態幫助我們一起達成這個目標。
在2025年上半年的時候,我們的一個投資人在深圳做了一次調研,發現在深圳做AI硬件的,但凡要用到端側模型,一半以上都在用我們的MiniCPM,這個數據讓我們非常吃驚,也是我們今年想要發力開發者生態、提升硬件產品的一大原因。
生態的作用就在于此,它可以自然生長,只要你能提供好基礎的營養原料、養分,它就能自動生長出很多你意向不到的場景,所以我們就想把更多的發揮空間留著我們的開發者。
本文為IPO早知道原創
作者|Stone Jin
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.