魏強(qiáng)簡(jiǎn)介 /智元機(jī)器人靈犀業(yè)務(wù)線總裁:
本碩就讀于西安交通大學(xué),后于日本京都大學(xué)攻讀博士,專攻系統(tǒng)設(shè)計(jì)與機(jī)器人方向。先后就職于松下、京東、華為,安克創(chuàng)新等公司,主導(dǎo)了多款智能硬件產(chǎn)品的研發(fā)項(xiàng)目。
![]()
“我們?cè)龅揭晃豢蛻簦鞘且患易蚤]癥兒童的康復(fù)中心。在和這里的孩子們交流時(shí),他們的問題出乎產(chǎn)品經(jīng)理的意料。例如他們覺得靈犀X2怎么沒有更可愛的名字?年齡多大?對(duì)什么感興趣?”
魏強(qiáng)說,這給了他們啟發(fā)——靈犀的潛在用戶中,可能更希望一個(gè)有鮮活形象、自我認(rèn)知、自己性格的產(chǎn)品。
于是,近日開啟合作伙伴招募的靈犀X2,主打的特點(diǎn)之一就是「生物感和溫暖感」。它不僅擁有了「硅基少年」的稱號(hào),甚至還被內(nèi)置了ENFP的外向性格。
“硅基少年指的是形態(tài):靈犀X2的身高為1.3米左右,相當(dāng)于15歲左右的少年。但其實(shí)它的大腦能力是遠(yuǎn)超這一年齡段的。”魏強(qiáng)說道。
三個(gè)版本的區(qū)別
據(jù)介紹,靈犀X2集運(yùn)動(dòng)、交互、作業(yè)能力于一體,可應(yīng)用于文娛表演、展廳講解、科研教育、康養(yǎng)陪伴等場(chǎng)景。
魏強(qiáng)表示,靈犀X2的價(jià)格范圍在十幾萬(wàn)到三四十萬(wàn)元不等,具體要參考場(chǎng)景需求和選裝的配置。
![]()
此次招募合作伙伴銷售的靈犀X2機(jī)器人分為三個(gè)版本:
在X2(交互版)「擬人步態(tài)、語(yǔ)音對(duì)話、觸摸反饋、情緒表達(dá)、靈動(dòng)動(dòng)作」的基礎(chǔ)上,X2 Pro(探索版)及X2 Ultra(旗艦版)新增了更加豐富的交互、作業(yè)原子能力開發(fā)接口,提供自主導(dǎo)航功能的選配。
X2 Ultra(旗艦版)可進(jìn)階選配自適應(yīng)夾爪OmniPicker、末端靈巧手OmniHand、超視距遙操和動(dòng)捕動(dòng)作錄入功能。
![]()
魏強(qiáng)補(bǔ)充介紹稱,X2交互版不提供二次開發(fā)的能力,主要場(chǎng)景是展廳講解、文娛展演;
而X2探索版提供二次開發(fā)的接口,可以選配各種自由度,感知交互頭也可以自由選配,比較適合于科研教育領(lǐng)域;
X2旗艦版則相當(dāng)于「功能全集」,具備靈巧手、夾爪作業(yè)能力,可用于科研教育的,論文研究,或者要求更高的公園、場(chǎng)館場(chǎng)景。
同時(shí),旗艦版的軟件功能配置也比較豐富,例如自主導(dǎo)航、多模態(tài)交互的功能,都是以軟件包的形式給到用戶。
架構(gòu)設(shè)計(jì)思路
“在設(shè)計(jì)系統(tǒng)架構(gòu)的時(shí)候,我們不想把端側(cè)做得太重。于是選擇用一個(gè)RK芯片來進(jìn)行一些運(yùn)控,還有簡(jiǎn)單視覺。而大語(yǔ)言模型和全量語(yǔ)音識(shí)別,都是放在云端做的。”
魏強(qiáng)表示,為了給用戶更多選擇,靈犀X2也提供英偉達(dá)Orin的高算力平臺(tái),可用于室內(nèi)外導(dǎo)航。
“有的用戶只想做自己的功能和算法,不想為此再外掛一個(gè)板子或者芯片,他們想拿到之后就直接開發(fā)算法,所以我們提供了這樣的配置。”
同時(shí),靈犀X2也可以只提供本體和二次開發(fā)接口,供用戶接入其他的軟硬件平臺(tái)。
![]()
靈犀X2的三大特點(diǎn)
目前,智元機(jī)器人的業(yè)務(wù)線包括:
1、遠(yuǎn)征系列:以遠(yuǎn)征A2為例,它是一臺(tái)高1.7米的全尺寸機(jī)器人,有40多個(gè)自由度,主要用于工廠作業(yè);
2、靈犀系列:以X2半尺寸機(jī)器人為例,它同時(shí)具有自動(dòng)運(yùn)控、多模交互和具身操作的能力。同時(shí)該系列會(huì)在Q2發(fā)布一款四足機(jī)器人產(chǎn)品,內(nèi)部名稱為靈犀D1,主要面向教育場(chǎng)景和家庭開發(fā)場(chǎng)景,提供本體運(yùn)動(dòng)能力和開發(fā)平臺(tái)。
3、精靈系列:輪式+雙臂的機(jī)器人產(chǎn)品。
而靈犀X2的三個(gè)特點(diǎn),就是靈動(dòng)、親和,智能。
![]()
魏強(qiáng)稱,靈動(dòng)表現(xiàn)在其全身的自由度——除了腿部和手臂外,其腰部也設(shè)置了三個(gè)自由度,頭部有兩個(gè),手部除了能進(jìn)行復(fù)雜的舞蹈表演外,還可以進(jìn)行抓取或是一些簡(jiǎn)單作業(yè)。
親和主要表現(xiàn)在交互層面:X2通過視覺交互、語(yǔ)音交互、觸覺交互外,還能通過頭部顯示屏顯示表情。
“我們通過語(yǔ)言、視覺甚至觸摸,以及空間物理位置系統(tǒng),構(gòu)成一種復(fù)雜的基于物理世界場(chǎng)景的交互,這樣也可以獲取更多交互數(shù)據(jù),來不斷提升硅光動(dòng)語(yǔ)大模型的能力。”
至于智能程度,主要表現(xiàn)在室內(nèi)外相對(duì)確定的環(huán)境下進(jìn)行自主導(dǎo)航、避障的能力。用戶可以選配自主導(dǎo)航功能包,徹底拋開搖控器,獨(dú)立進(jìn)行工作。
場(chǎng)景的需求及發(fā)展
“靈犀X2是靈動(dòng)的,有生命力的。它可以坐在椅子上面自己甩甩腿,也可以自主地走到某一朵花前邊駐足欣賞,完全像一個(gè)生物一樣。”魏強(qiáng)指出,這是X2最主要的特點(diǎn)。
![]()
除了教育領(lǐng)域,文娛場(chǎng)景,它另一個(gè)關(guān)鍵場(chǎng)景是展廳講解:“現(xiàn)在我們已經(jīng)開始和中國(guó)移動(dòng)進(jìn)行合作,在展廳中開展了講解服務(wù)。”
他表示,雖然X2還在開發(fā)過程中,但已經(jīng)有很多客戶產(chǎn)生了意向,希望在公園里面做一些展演,而且需求量還是不小的,預(yù)計(jì)今年下半年的量會(huì)逐漸增多。
至于后續(xù)的場(chǎng)景拓展,養(yǎng)老是依然是一個(gè)重要方向。
“康養(yǎng)陪伴剛開始不是直接走入家庭的,而是在養(yǎng)老社區(qū)的環(huán)境中。比如說送水、拿藥,提醒吃藥等服務(wù)。不過,未來終有一天,機(jī)器人能夠走到家庭里面,真正起到家庭里面當(dāng)保姆、保潔、保安,三保服務(wù)的功能。”
人形機(jī)器人的瓶頸
魏強(qiáng)認(rèn)為,機(jī)器人最需要的還是泛化能力。首先,在硬件層面,關(guān)節(jié)電機(jī)的靈活度需要不斷提升。
他介紹稱,從人形機(jī)器人整本構(gòu)成來說,最重要的就是關(guān)節(jié)鏈接模組,再就是各種控制域的控制芯片。
“現(xiàn)在關(guān)節(jié)電機(jī)的靈活度,雖然和兩三年前有很大提升,能夠做到幾厘米之內(nèi)精巧的動(dòng)作,但和人體相比還有很大提升空間。”他指出,當(dāng)下關(guān)鍵模組的重量、壽命、散熱、功耗和效率其實(shí)都還有待進(jìn)步。
同時(shí),相對(duì)于手機(jī)有專門用的芯片SOC,人形機(jī)器人的SOC和整體硬件方案都還在發(fā)展過程中。
另外,在交互能力上,機(jī)器人對(duì)復(fù)雜場(chǎng)景的理解和判斷能力同樣還有上升空間,也就是在模型端還需要有更高維度的進(jìn)階。
“人形機(jī)器人的多模態(tài)交互,不僅僅包括語(yǔ)音和視頻,還包括數(shù)據(jù)、觸覺、動(dòng)作,以及各種各樣的傳感器。所有的傳感器的輸入如何能夠讓模型有正確的理解,然后將正確的反饋直接映射到所有的電機(jī)、傳感器的輸出上,這個(gè)其實(shí)也還在發(fā)展過程中,還有很大的發(fā)展空間。”
何時(shí)才能降本?
“我覺得技術(shù)突破和成本控制之間沒有必然聯(lián)系,算力現(xiàn)在也并不是構(gòu)成現(xiàn)在技術(shù)卡點(diǎn)的關(guān)鍵因素。”
魏強(qiáng)認(rèn)為,從成本來看,「量」是很關(guān)鍵的因素。如果有足夠大的規(guī)模,整個(gè)產(chǎn)業(yè)鏈?zhǔn)强梢葬槍?duì)需求來不斷優(yōu)化的,成本肯定會(huì)不斷下降。
“但是,目前的人形機(jī)器人的還處于量產(chǎn)的初期階段。這不是靠一兩家企業(yè),而是要靠整個(gè)產(chǎn)業(yè)鏈。包括關(guān)節(jié)、電機(jī),還有結(jié)構(gòu)模組、芯片、靈巧手,材料等等,都需要一同實(shí)現(xiàn)高品質(zhì)規(guī)模化,才能實(shí)現(xiàn)整體成本進(jìn)行降低。”
市場(chǎng)形態(tài)及變化
今年,機(jī)器人租賃市場(chǎng)快速膨脹,但魏強(qiáng)覺得這只是一個(gè)短期現(xiàn)象。
“我覺得這不一定是健康的模式,它需要回歸到一個(gè)比較理性或者有迭代的模式下才有價(jià)值。過去幾個(gè)月,大家做出的都是同樣的東西,拿著搖控器做一做,同質(zhì)化太嚴(yán)重了。例如在文藝場(chǎng)景中,基本上都是遙控一下,揮揮手,這甚至第一步都不算。我們這次這些產(chǎn)品,除了基本運(yùn)控可以揮手、坐下起來、跳舞還有交互功能。”
![]()
至于海外市場(chǎng),魏強(qiáng)表示,現(xiàn)在智元所有的產(chǎn)品都是針對(duì)全球市場(chǎng)來進(jìn)行設(shè)計(jì)的。智元會(huì)將產(chǎn)品直接銷到海外,然后通過當(dāng)?shù)睾献骰锇榈那馈⒎?wù)能力,將產(chǎn)品送到用戶手里面。
“目前看,海外比較旺盛,尤其是在科研教育領(lǐng)域,這基于大家對(duì)這一新技術(shù)發(fā)展時(shí)間點(diǎn)的認(rèn)知。”
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.