Jay 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
嚯!先是OpenClaw玩轉(zhuǎn)互聯(lián)網(wǎng),這下春晚也被機(jī)器人占領(lǐng)了。
打開電視,到處都是機(jī)器人,簡(jiǎn)直成了一場(chǎng)硅基生物狂歡節(jié)。
宇樹、魔法原子、銀河通用……各家機(jī)器人輪番上陣,引得家里客廳驚呼連連。
確實(shí)很難想象,明明去年還在扭秧歌,今年居然已經(jīng)發(fā)展成了這樣子。
但要說印象最深刻的,還得是松延動(dòng)力的這個(gè)小品節(jié)目,《奶奶的最愛》。
蔡明老師的大孫子們——西天取經(jīng)四「人」組,閃亮登場(chǎng)!
![]()
當(dāng)時(shí)這四位一立正,我一看,就尋思最右邊這小家伙不簡(jiǎn)單。
不僅衣服是本命紅,還戴個(gè)紅色小棉帽,估計(jì)是最受偏愛的「大孫子」。
![]()
也確實(shí)不怪節(jié)目組偏心,這個(gè)小奶音,配上拽拽的走路姿勢(shì),實(shí)在太萌了。

但可別被它的外表輕易蒙蔽,最受奶奶偏愛的「孫子」,說話可是相當(dāng)不饒人。
- 你確實(shí)是個(gè)笑話!
![]()
對(duì)了,亦莊機(jī)器人馬拉松上的「小孩哥」也在,這次還是雙胞胎。
講著講著,咵一下給觀眾來了個(gè)后空翻。

下面更是重磅,千算萬算沒算到,會(huì)有個(gè)和蔡明老師長得一模一樣的機(jī)器人出現(xiàn)……
![]()
很難想象,這要是去年的我,看到2026年春節(jié)的自己窩在沙發(fā)上——
嗑瓜子的手停滯在半空中,目瞪口呆地看著這一個(gè)比一個(gè)離譜的機(jī)器人,會(huì)是什么想法……
春晚幕后大揭秘
線上終究隔了層屏幕,為了檢驗(yàn)這些機(jī)器人在節(jié)目下的真實(shí)表現(xiàn),量子位特意近距離給大家伙瞅了瞅。
看,這就是春晚開場(chǎng)登臺(tái)的,蔡明老師的寶貝大孫子組合!
臺(tái)上表現(xiàn)很chill,其實(shí)訓(xùn)練相當(dāng)刻苦,天天擱這猛猛排練節(jié)目。
![]()
令人印象深刻的是,相比節(jié)目上,「小孩哥」在線下的沖擊力明顯強(qiáng)很多。
小身體大能量,而且有聲音的加成,機(jī)器元件在空翻時(shí)碰撞的聽感非常清脆。
聽松延動(dòng)力的工作人員說,「小孩哥」每天的日常就是隨地大小翻,室內(nèi)翻完馬路翻,馬路翻完草坪翻。
為了給觀眾表演一次成功的空翻,「小孩哥」承受了太多它這個(gè)年齡不該承受的東西…

接下來,要給大家著重介紹,這次春晚松延動(dòng)力大家族中,我個(gè)人最喜歡的機(jī)器人——小布米。
對(duì),就是節(jié)目上一身本命紅,腦袋上系個(gè)大棉帽的「小奶娃」。
這是全球首款萬元級(jí)機(jī)器人,售價(jià)9998元起
特別迷你,身高不到一米,跟剛學(xué)會(huì)走路的小朋友差不多。
配合上這勁爆的舞姿,實(shí)在太萌了。

最讓我驚喜的,是它的語音交互。
當(dāng)時(shí)工作人員讓它講了個(gè)冷笑話。
要不是現(xiàn)場(chǎng)人太多,我真有點(diǎn)要蚌埠住了。關(guān)鍵誰受得了它這樣「一本正經(jīng)」地調(diào)侃企鵝啊。
![]()
問了下才知道,奶聲奶氣的小布米背后,原來是AI界的「小品女王」——豆包
沒錯(cuò),它倆底層都是豆包大模型
雖然個(gè)頭小小,但智商真不容小覷。
我們?cè)诂F(xiàn)場(chǎng)考了它那個(gè)困擾無數(shù)頂尖AI的「洗車悖論」:
- 家離洗車店800米,我應(yīng)該開車還是走路去?
本來沒抱啥希望,結(jié)果——它居然答對(duì)了!?
平時(shí)沒少和AI語音聊天,但親眼看到這么小一個(gè)機(jī)器人,用奶聲奶氣的萌娃音跟你說話,真的很不一樣。
EQ也很高。
當(dāng)聽到有人說「和朋友吵架了」,小布米沒有一上來就講大道理,而是先共情:「一定很難受吧。」
還拿「牙齒和舌頭」打比方,說好朋友鬧別扭很正常,建議等氣消了好好聊聊。
大過年的,咱就不要搞硬核技術(shù)測(cè)試了。
量子位托小布米祝大家馬年快樂,「快樂馬不停,每天都馬力全開」!
不錯(cuò)不錯(cuò),咱也算是第一波收到硅基生物定制拜年的人類了。
松延動(dòng)力x火山引擎,大腦與身體的強(qiáng)強(qiáng)聯(lián)手
2025年底,松延動(dòng)力發(fā)布了首款萬元級(jí)人形機(jī)器人小布米Bumi,面向ToC啟動(dòng)了量產(chǎn)。
但光有硬件還不夠。要想真正交付給消費(fèi)者,小布米必須能自然地和人交互。
畢竟,目前家庭場(chǎng)景里,機(jī)器人的核心角色還是「陪伴」。如果不能說話、聽不懂指令,體驗(yàn)會(huì)大打折扣。
語音是消費(fèi)級(jí)機(jī)器人的關(guān)鍵入口。不管是陪聊、跳舞,還是日常互動(dòng),幾乎都得靠對(duì)話來觸發(fā)。
這也正是火山引擎和松延動(dòng)力達(dá)成合作的重要契機(jī)。
沒想到的是,在正式交付前,春晚成了第一個(gè)實(shí)戰(zhàn)考場(chǎng)。
松延動(dòng)力的節(jié)目比較特殊,它不是純表演型,而是語言類,高度依賴實(shí)時(shí)對(duì)話和角色互動(dòng)。
而在真人陪聊、角色扮演這一塊,豆包應(yīng)該是當(dāng)之無愧的「女王」了。
于是雙方一拍即合,把這套方案搬上了春晚舞臺(tái)。
具體來說,火山引擎為「演員們」定制了一套端到端的豆包語音交互全家桶,核心是三個(gè)環(huán)節(jié):ASR(語音識(shí)別)、LLM(大語言模型)、TTS(語音合成)。
先看ASR。
這個(gè)環(huán)節(jié)直接影響模型智商的下限。識(shí)別出了問題,LLM再聰明,回復(fù)也是牛頭不對(duì)馬嘴。
火山引擎為松延動(dòng)力配的豆包語音識(shí)別模型2.0,是一雙會(huì)「思考」的耳朵。
打個(gè)比方,一般來說,當(dāng)你提到蘇轍被貶的「筠州」,普通模型很容易聽成其他同義詞,比如「云州」或「鄆州」。
人類通常不會(huì)犯這種錯(cuò)誤,只要有一定的上下文,我們就能反應(yīng)過來——
「噢,現(xiàn)在在聊蘇轍,那應(yīng)該是筠州。」
豆包的語音識(shí)別便參考了這種真人交互習(xí)慣。
接下來便交由LLM組織語言,采用的是豆包大模型
這點(diǎn)就不多做贅述了,大家日常都體驗(yàn)過。
一旦LLM開始輸出第一個(gè)Token,TTS便開始同步生成語音,邊生成邊播放。
當(dāng)然,讓人感受最直觀的,肯定還是聽到聲音出來的那一瞬間。
這次春晚用的是豆包語音合成模型2.0
相比傳統(tǒng)模型,豆包在文本的情緒演繹上下了更多功夫,比如語氣、語調(diào)、停頓等。
這層額外的情緒信息,是豆包的「人味秘方」。
不僅音色還原度高,更能根據(jù)當(dāng)前對(duì)話內(nèi)容,選擇最合適的「聲音表演」方式。
![]()
可能有人會(huì)說:這套「聽見-思考-說話」的閉環(huán),火山引擎上不是早就有現(xiàn)成方案了嗎?
理論上沒錯(cuò),但要達(dá)到春晚級(jí)別的效果,不是調(diào)個(gè)API就能搞定的。
最直觀的差異來自輸入端硬件。
機(jī)器人的攝像頭分辨率不如手機(jī),麥克風(fēng)陣列布局、收音結(jié)構(gòu)也不同。這些都得重新適配和優(yōu)化。
更大的挑戰(zhàn)是使用場(chǎng)景
平時(shí)你用手機(jī)和AI聊天,嘴離麥克風(fēng)就十幾厘米;但在家庭場(chǎng)景里,人和機(jī)器人往往隔著一到兩米,甚至更遠(yuǎn)。
而春晚舞臺(tái)?更是地獄級(jí)難度:演員站位不固定、環(huán)境噪音嘈雜、網(wǎng)絡(luò)信號(hào)波動(dòng)……
并且?guī)缀趿闳蒎e(cuò),全國觀眾盯著的。
為了保證節(jié)目效果,火山引擎直接開啟「爆肝模式」,專門打造了一套春晚定制版實(shí)時(shí)音視頻方案,負(fù)責(zé)語音數(shù)據(jù)的采集、處理和低延遲傳輸。
在此基礎(chǔ)上,還疊加了多項(xiàng)黑科技:3A降噪、VAD打斷、聲紋識(shí)別……
可以說,為了讓機(jī)器人在臺(tái)上博觀眾一笑,火山引擎在背后都快轉(zhuǎn)冒煙了。
最終效果大家也看到了。整體時(shí)延控制在1秒以內(nèi),已經(jīng)接近人與人對(duì)話的自然狀態(tài)。
![]()
不過,費(fèi)這么大功夫,如果只是為了和機(jī)器人聊天,有點(diǎn)殺雞用牛刀。
具身形態(tài)的真正價(jià)值,在于它可以把語言和肢體動(dòng)作結(jié)合起來。
舉個(gè)例子。
當(dāng)一個(gè)小朋友放學(xué)回家,郁悶地站在門口嘆氣:
「我今天考試考砸了。」
如果只是個(gè)智能音箱,或許只能說——
「沒關(guān)系,我們一起看看哪里可以改進(jìn)」。
但如果是小布米,它可以慢慢走到孩子身邊,伸出「圓手」,輕輕拍拍他的肩膀。
這一刻,肢體接觸傳遞的溫度,是再多文本Token也換不來的。
具身智能正在走向消費(fèi)級(jí)
自去年夏天的WAIC以來,關(guān)于人形機(jī)器人是不是泡沫的爭(zhēng)論,幾乎沒停過。
但另一方面,這恰恰也說明,機(jī)器人在公眾視野里的出現(xiàn)頻率越來越高,迭代速度越來越快,已經(jīng)到了無法被忽視的程度。
去年春晚,人形機(jī)器人還只是在臺(tái)上轉(zhuǎn)個(gè)手絹;
今年呢?遍地開花,連小品都安排上了。
盡管如此,開懷大笑之后,仍然無法避免那個(gè)靈魂之問:
我們真的需要講小品的機(jī)器人嗎?
![]()
對(duì)此,松延動(dòng)力創(chuàng)始人姜哲源的回答是:
技術(shù)存在的意義,從來都不只有幫人類干活。
在他看來,對(duì)于所有產(chǎn)品,價(jià)值都可以分為兩種,實(shí)用價(jià)值和情緒價(jià)值。
很多消費(fèi)品都不能干活,它們存在的意義,就是讓人開心。
機(jī)器人也一樣。
能端茶倒水當(dāng)然最好,但如果它能陪伴老人、安慰小孩、甚至讓你笑出聲,那也是一種真實(shí)的價(jià)值。
更何況,對(duì)消費(fèi)級(jí)市場(chǎng)而言,機(jī)器人也并不是只能提供情緒價(jià)值。
K12教育,便是松延動(dòng)力正在重點(diǎn)探索的下一個(gè)落地方向。
以編程為例,有一個(gè)硬件載體,孩子能更直觀看到代碼-動(dòng)作的映射,會(huì)如何影響現(xiàn)實(shí)世界。
這種即時(shí)、具象的反饋,是屏幕給不了的。
而人形,本身就是人類科技最前沿、也最浪漫的想象。
小布米支持圖形化編程,通過拖拽式編程軟件,孩子可以給機(jī)器人設(shè)定這樣一個(gè)任務(wù):
- 在父母結(jié)婚紀(jì)念日時(shí),從房間里走出來,比一個(gè)心。
姜哲源表示,有一個(gè)機(jī)器人在家里,對(duì)拓寬孩子的視野有很大幫助。
- 如果孩子從小就接觸人形機(jī)器人,他對(duì)這些領(lǐng)域的感知,會(huì)比同齡人早好幾年。
事實(shí)也印證了松延動(dòng)力的思考。
從一線反饋看,無論是家長還是學(xué)校,對(duì)教育機(jī)器人都有非常強(qiáng)烈的需求。而這些需求,都是現(xiàn)有技術(shù)已經(jīng)能滿足的。
過去,人形機(jī)器人的落地場(chǎng)景,主要還是兩類:商演和科研
但這兩條路,都算不上「長坡厚雪」。
商演天然有邊際效應(yīng)遞減。
第一次看很驚艷;第二次,還不錯(cuò);但第三次,就不禁想問「它啥時(shí)候能去工廠擰螺絲?」
相對(duì)而言,科研要堅(jiān)固一些。但場(chǎng)景集中在高校,天花板很大程度上取決于學(xué)校預(yù)算。
而且,科研存在周期性波動(dòng),一旦熱度下降,需求回落得也會(huì)很快。
教育,可能是破局的關(guān)鍵。
首先,這是一場(chǎng)確定性極高的大趨勢(shì):隨著AI滲透進(jìn)基礎(chǔ)教育,人形機(jī)器人作為「具身教具」,角色只會(huì)越來越重。
一開始可能集中在超級(jí)城市,但很快會(huì)向其他地區(qū)滲透。最終,這會(huì)是一個(gè)規(guī)模巨大的市場(chǎng)。
更重要的,是滲透深度。
機(jī)器人+教育,不是把一臺(tái)機(jī)器人塞進(jìn)教室這么簡(jiǎn)單,必須配套完整的體系:
教師培訓(xùn)、課程設(shè)計(jì)、教學(xué)場(chǎng)景適配、評(píng)估標(biāo)準(zhǔn)……
一旦這套解決方案跑通,形成成熟的解決方案,機(jī)器人會(huì)成為教學(xué)基礎(chǔ)設(shè)施的一部分,提供長期穩(wěn)定存在的結(jié)構(gòu)性需求。
雖然暫時(shí)還不能在家當(dāng)保姆,但這個(gè)中間態(tài),可以在創(chuàng)造價(jià)值的同時(shí),為具身智能的發(fā)展,爭(zhēng)取更多時(shí)間,
![]()
跳舞、演小品,只是起點(diǎn)。
未來,硅基智能在生活中的比例只會(huì)越來越高。
也許五年后的除夕夜——
真會(huì)有一臺(tái)機(jī)器人,翹著二郎腿坐在你家沙發(fā)上,一邊幫你剝瓜子,一邊吐槽春晚節(jié)目。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.