![]()
文| 明麗 初一
“對人類而言困難的任務,對機器反而容易;對人類輕松的事,對機器卻異常艱難。”這是20世紀80年代由漢斯·莫拉維克等人提出的“莫拉維克悖論”,這一點在機器人觸覺感知領域得到了尤為鮮明的印證。
具身智能觸覺感知及行業解決方案供應商——帕西尼感知科技,其CTO張恒第對我們解釋,觸覺感知技術出現得最早,但被人理解并使用卻是最晚,原因是觸覺信號復制難度極大,很多機器人企業,原本想做觸覺,但卻沒能實現。
“沒有觸覺,機器人能唱歌跳舞,能跑馬拉松,但無法進廠打工,無法操作精細工種,真正地為人類所用。”張恒第說。
觸覺傳感器廣泛應用后,機器人進廠打工將成為現實,尤其是在高危特種環境中,機器人將發揮其獨特價值。
但帕西尼的目標不止于此。“以觸覺為始,后續要配套觸覺算法、觸覺模型,最后生成控制策略,利用觸覺感知技術服務千行百業,人類生活方式也將開啟一個全新篇章。”張恒第說,未來他們一定會改變世界。
張恒第從AI算法、技術前景展望,數據處理等方面向我們分享了經驗。
我們的終極目標是改變人類的生活習慣
產聯社:有人把帕西尼稱為深圳機器人六小龍之一,你如何看待這個評價?
張恒第:帕西尼在機器人生態中處于一個特殊生態位,通常情況下,大家認為眼睛是獲取外界信息最重要的通道,但事實證明,沒有觸覺,機器人無法像人類一樣精細化操作。所以我認為觸覺生態位本身得到了大家認可。
產聯社:深圳也是公認的創新沃土,為什么一提到機器人,大家會先想到杭州六小龍,而不是深圳六小龍?
張恒第:問題很犀利,我愿意回答一下。
技術在早期會給大家帶來希望,但也會在遇到卡點時讓大家失望。我想說的是:技術既不瘋狂,也不一無是處。實際上,技術會逐步提升,在無聲無息中,便已無處不在。
我們現在所處的正是技術發展的早期階段,這個階段會在不經意間帶給大家很多遐想——我們看到機器人跑步、跳舞、拳擊等,都是由杭州六小龍呈現的。
但是,機器人的價值只有跳舞嗎?一旦上升到靈巧操作層面,需要的算法是截然不同的。如果機器人一直停留在前期階段,大家也會失望。
所以我認為:杭州與深圳,一表一里,都在為機器人的廣泛存在做準備。
“表”在于,機器人要給大家希望。我舉個例子,儒勒·凡爾納在《海底兩萬里》中寫到,“我有一艘船,叫鸚鵡螺號,可以在海底行駛得非常遠。”那時還沒有潛水艇,但是100年后,潛水艇出現了。杭州讓大家知道,機器人能跑能跳,終究會為大家所用,這一次,我們或許不需要等100年,快的話只要一到兩年,科幻就能照進現實。
科幻在照進現實的過程中,總要落地。在這個階段,深圳有最全的產業鏈與商業場景,很多企業還在厚積薄發的過程中,深圳與杭州都在為機器人落地而努力。
產聯社:創始人與你都是從國外留學回來的,并且是不同的國家,你們當時湊在一起,想把這個企業落戶在深圳,背后的故事和考量是什么?
張恒第:帕西尼 CEO 許晉誠博士畢業于日本早稻田大學,該校實驗室做出了世界上第一個現代意義上的人形機器人。日本做機器人歷史很悠久,也為之后的機器人技術奠定了極為重要的基礎。而我們最終決定來中國,一是因為中國是機器人硬件發展最好的地方,這主要是因為中國產業鏈非常完整,這是別的國家所不具備的。美國、日本和歐洲的想法如果需要落地,都要送到珠三角來打樣,打完樣后送回去還需要一個月,而在中國,整個時間只需數天。所以中國是最佳的創業地。
二是深圳開拓創新的精神,對初創企業包容度高,可以媲美硅谷。在日本,如果沒有日本的大型落地項目,基金會就不會長期扶持初創企業,他們認為創新是一種風險。但在深圳,創新不是風險,而是義不容辭的使命。我們的股東很多是來自產業方的超級頭部企業,他們對我們新技術的引入非常期待,持開放包容態度。
我們看到,很多偉大案例正在深圳發生著,即使有一些現在不被人看好,但在未來,一定能改變世界。
產聯社:說一說你們企業成立的初衷,和目的。
張恒第:從現在開始,以觸覺為基點,后續要配套觸覺算法、觸覺模型,最后生成控制策略:利用觸覺信號服務千行百業,人類生活方式也將開啟一個全新篇章。
為什么是“帕西尼”
產聯社:帕西尼聽起來有點像西藥的名字,這個名字怎么來的?
張恒第:帕西尼是一位意大利生理學家,他發現了人類觸覺感受器,能夠讓人類獲得觸覺感知的能力,為紀念他的偉大發現,人們將這種感受器命名為帕西尼小體。當然,還有其他細胞名字供選擇:默克爾盤、魯非尼小體等,我們考慮過“默克爾”,但是“默克爾”被德國前總理用了。
![]()
總之,帕西尼很universal,又很具象,同時代表了我們的愿景,人類通過帕西尼有了觸覺,機器人通過我們帕西尼獲得觸覺信號,這是一個非常美妙的事情。
產聯社:觸覺對機器人有多重要?
張恒第:人手上的觸覺信號非常重要,我們經常提到的物理直覺,機械刺激引起的疼痛,自我知覺,這些都是觸覺,嬰兒最先開始就是靠觸覺來學習外部感知,并建立自我知覺的。
在具身智能應用方面,光靠視頻生成的模型不夠準確,比如球掉地上,反彈力度多大?沒有觸覺模型就生成不了。觸覺可以讓機器人知輕重,進行復雜的感知和掌內靈巧操作,人們每天的日常動作,如使用筷子、寫字等,沒有一個能離開觸覺而完成。
產聯社:我說一個觀點,在機器人領域里,觸覺相對于視覺聽覺來說,走得更慢。
張恒第:走得很慢,觸覺出現得最早,為人所用最晚。早在單細胞時期,生物為了確保生存安全和輔食就發展出了觸覺,然而直到2021年,第一個觸覺領域的諾貝爾獎才誕生,人類才明白,怎么把觸覺機械力刺激變成神經信號。視覺領域的突破則在400年前——歐洲做出了玻璃,對光學和人類視覺的研究和應用催生了透視法和近代繪畫藝術,甚至也助力了文藝復興運動。
很多做機器人的企業也想過做觸覺,但都感受到了嚴峻的技術挑戰。因為觸覺是一種多模態信號,集合了分布力測量、震動測量、溫度測量,研發難度極大。但是觸覺又很重要,沒有觸覺,機器人就只能跑步跳舞,無法進廠打工、真正地為人類服務。在被國外“卡脖子”名單中,觸覺排在第四位,我們希望改變這一格局。而通過“十四五”期間的努力,如今,這一局面已然改變。
產聯社:我知道觸覺難,但是難在哪?
張恒第:人如何產生觸覺?人類的細胞膜上有分子級別的膜蛋白“傳感器”(Piezo2 Protein),當細胞膜被拉伸的時候,膜蛋白“傳感器”會像門一樣拉開,陽離子涌入,觸發了神經信號,膜蛋白“傳感器”會劣化、會壞掉,但沒關系,人體可以快速合成新蛋白。但機器人沒有再生功能,所以機器人的觸覺傳感器需要非常強的耐久度和可靠性。
還有一個難點。觸覺產生于測量分布力大小。以前有秤測力,但秤是靜態的,且反應非常慢,大概三秒鐘才能顯示結果。但觸覺是即時反饋的。如何實時獲得力覺信號、溫度信號,是觸覺的另一難點。
最后,人類生產的東西,包括現在機器人本體,絕大部分是硬質物,關節也由電機連接。但觸覺不一樣,它需要根據物體的形狀進行變形,它必須是柔軟的,且要在柔軟的情況下,還能精確測量力信號。
產聯社:你們準備怎么解決它?
張恒第:從原理的選擇上,我們選擇了霍爾原理,特點是可以從原理上將彈性體和測量電路分開,將測量電路充分保護,從而做到具備極佳的靈敏性的同時,擁有千萬次按壓壽命和極端環境可靠性,可以耐烈焰灼燒、耐超低溫、耐潮濕、耐20倍量程極限工況重力按壓……
我們從材料選擇、磁路設計、彈性體設計、逆向有限元算法設計等方面進行極端優化,最后將此前僅能在大型仿真軟件中運行的復雜算法壓縮至微型計算單元(MCU),嵌入到觸覺傳感器。通過這一技術路徑,傳感器可快速輸出具備高一致性和重復性的最終力觸覺信號。該方案既可以保證傳感器的柔軟性,又可以保證其測力的精確性。
最后,我們要讓它的體積足夠小,能夠形成模組化的形態,不能像以前一樣——敏感單元、數采卡、信號處理在不同設備上。這種分離式布局與機器人的發展相悖。機器人零件不比新能源車少,但機器人的體積比車小多了。所以模塊化、集成化很重要。
基于這樣的設計理念,以及在算法和材料上的技術積累,最終讓信號的采集、分析、輸出全部集成在緊湊的模組上,使其可以被方便可靠地使用。
產聯社:這對于成本管控有什么好處?
張恒第:我們將觸覺傳感器這一個品類價格從開始的1萬美元降為現在的199元人民幣起。
機器人:差異要小,要快,要能復制
騰訊的優勢在于:
產聯社:能舉例說明一下現在帕西尼傳感器的敏銳達到了什么程度?
張恒第:即便是一片羽毛落到我們的觸覺傳感器上,傳感器也會瞬間感受到,執行器能根據傳感信號做出相應的抓握動作。
產聯社:是不是比人的觸覺還要更靈敏?
張恒第:人和機器的不同點在于:
·人的個體差異大。比如,男女對于觸覺的敏感度不同,男生力氣大,但觸感相對比較鈍;女生力氣小,但觸感相對更靈敏。
·人類習得速度慢。比如,我們普遍接受這一事實——人需要花費數十年時間去學習舞蹈、游泳、武術才能達到較高水平。
·人類技能無法復制。比如,即便是一個人的靈魂“穿越”到另一個人的身體,也會有很長一段時間無法適應。人的身體變了,大腦也要花很長時間進行適配。
而機器人是反過來的——機器人個體間的差異要小,要快,要能復制。我們訓練一臺機器人端茶倒水,它學會后,要能快速復制到別的機器人身上,這就要確保傳感器的響應速度一致。為滿足這一需求,需要統一標準,從應用端倒推回來的標準,而非一味追求超越人類的靈敏性。
產聯社:你剛才舉例提到了人體穿越,可不可以理解為,現在很多機器人廠家生產的是外殼,傳感器則相當于人的神經元、人的內核?
張恒第:可以這么認為,傳感器連接到從大腦引出的最末梢的神經。比如人的眼睛、皮膚,都可以視為傳感器,大腦實時接收并處理來自海量傳感器的真實世界動態數據,這是具身智能與傳統互聯網AI的最大區別。具身智能可以通過傳感器從外部收集實時動態的信號,通過執行器主動改變外部環境,而傳統互聯網AI主要是處理靜態數據。
產聯社:標準化普及后,我們是不是能看到機器人進廠打工的場景?
張恒第:我們期待的場景已經成為現實,機器人服務人類不再是電影里的科幻景象。已經有客戶向我們提出了類似的業務訴求,讓我們的機器人學習人類的工作,進行數據采集。現在機器人的動作有些慢,但機器人學習能力很強,很快就能跟上。
產聯社:我看你們的宣傳,說帕西尼的機器人,能在一天之內觀察人類手工作業的行為模式,隨后生成數據訓練,就能復制下來對方的行為。這樣產生的數據量級有多大?在存儲、加工與應用層面,帕西尼是如何做的?
張恒第:人的操作能力非常精細,帕西尼通過采集視覺、觸覺、末端動作將觸感數字化到數據集里,這樣的數據量級是巨大的——平均每筆數據幾百兆,我們的數據采集峰值期一天就有50萬筆,一天的數據就是100TB。
一年下來,產生數據是PB級的,我們借用騰訊云平臺,通過終端對數據進行查看、分析,最終將寶貴的數據變成資產。這有一個好處:指令簡單,效果好。我們用COS(對象存儲,相當于云上的存儲空間)將數據搬遷到云上,用GooseFS(數據加速器)把對象存儲里的冷數據變成熱數據,模型可通過工具鏈從加速存儲層快速提取所需訓練數據,生成Cache(緩存)進行模型訓練。這里所要用到的工具鏈集成在騰訊Robotics X的Tairos平臺(別名:鈦螺絲,是騰訊Robotics X實驗室與福田實驗室聯合發布的具身智能開放平臺,定位為國內首個以模塊化方式集成大模型、開發工具和數據服務的軟件平臺,通過即插即用模式向機器人行業開放)。
此外,我們可以在模型訓練中使用騰訊的PipeLine(PipeLine為自定義管道流水線,可以將任務的處理分解為若干個處理階段,即前一個處理單元的結果也是第二個模塊的輸入,實現計算作業流水線化。)只需要幾行簡短的命令,COS里的對象會被加載到GooseFS里,GooseFS再分析哪些數據是需要用到的,迅速提取,再通過特制管線迅速加載到訓練用的集群里。
例如,設定一個虛擬環境,系統會自動完成GPU及配套工具鏈的配置,面對模型的選擇,不管是帕西尼自研的OmniVTLA(來自帕西尼的首個含觸覺靈巧手端到端的具身智能模型。?)還是π0/π0.5(具身智能模型,π0.5通過異構數據協同訓練,讓機器人理解任務語義并在全新環境中執行復雜任務,如清潔廚房等。)RDT-1B(一種基于擴散模型的VLA方案,通過去噪擴散概率模型生成動作,適用于高維動作空間和復雜動作分布)等主流的SOTA(當前最佳技術)模型,只需在騰訊工具鏈中通過簡單選項確定目標模型,再輸入命令即可觸發后續流程。
產聯社:在選數據存儲平臺時,你比較看重哪些特質?
張恒第:作為業界首份A級全模態具身智能數據集生產商,在選數據存儲平臺時我們最看重安全性與穩定性。
一是存儲量大+成本低。
二是要能高效地將冷數據變成熱數據,進行模型訓練。
·可以將數據快速加載到分發系統里并調取數據。
·工具鏈完整,調取模型不必借助其他工具。
·即時反饋精準定位模型待優化項,幫助我們實現高效迭代。
·提供良好仿真環境,讓我們在部署前就能在云上進行大量仿真驗證。
·安全能力高,有效防止外部攻擊。
·Tairos平臺幫助同行業者數據共享。
·Tairos背后的data platform(數據平臺解決方案)算力調度能力強,可以投放大量仿真任務。
我們可以只用幾行簡單的命令,就能便捷地使用各種服務。非常方便。
“是的,我們要力爭全球領先水平”
產聯社:你和許博士都有國外留學經歷,對比過后,中國機器人感知科技在全球大概處于什么位置?
張恒第:具身智能硬件層面,中國已處于世界前列,在中國隨處可見的送餐機器人,已然讓海外民眾感到驚奇。
軟件層面,中國一直扮演的是一個追隨者角色,但中國是一個好的追隨者。比如Chat GPT出現不久,DeepSeek就出現并超越了它。在數據采集上,中國的采集成本、采集質量、采集方式,也是無可比擬的,我們拿到單筆數據的平均價格很低,這樣可以極大發揮AI的優勢。
李開復認為,最好的心態是美國來創新,中國做應用。我不這么認為。日本曾經是機器人發展先鋒,但隨著數據驅動范式的出現,日本退守材料科學等傳統強項,在下游產業不再具備曾經的絕對優勢。我們要做的是將硬件優勢轉化為軟件優勢,打破中國“追隨者”角色。中國硬件那么強,軟件是一定要跟上的,“你不能讓一個強壯的外殼配3歲小孩的腦子。而數據的質和量,在其中扮演最重要角色,我們要充分利用好這一新優勢。”
產聯社:觸覺傳感器研發出來之后,市場應用范圍廣嗎?落地的時候有哪些具體的問題?
張恒第:非常廣泛,我們的傳感器已迭代至第三代,應用于多個領域,像地鐵安檢、汽車裝配、物流倉儲……凡是需要通過觸覺實現感知的,都可以用。
我們把具身智能觸覺比作“登月計劃”。登月的價值不僅僅在于月球上的寶藏,也在于過程積累的技術(溫度控制、漂移抑制技術、磁免疫技術、測力算法)。這些技術在獲得高性能觸覺傳感能力的同時,也能將觸覺傳感成本降低到199元,低成本將使得更多的人參與應用領域的探索,進而催生出豐富的應用。
產聯社:觸覺傳感器技術應用能具體解決現在機器人的哪些問題?
張恒第:最早工業機器人用的是基于規則的算法,對環境和目標物的改變沒有適應能力,傳感器的引入最初都是為了增加機器人對環境變化的適應能力,觸覺傳感也不例外,觸覺信號極大的增加了機器人的適應性。
在此先說一下視覺傳感,機器人眼與人眼不同,機器人眼視覺捕捉后存在30-40毫秒傳輸到VTLA的主干網絡,這個時間很長,有時機器人沒有抓取到物體,但它以為已經抓到,就開始執行后面的操作,失敗率會很高。
從算法來看,加入了觸覺模態的VTLA會讓機器人以更全面的感知能力在泛化的環境下獲得更高收益。有研究報告指出,加入觸覺感知的靈巧手在測試集上成功率達到了100%,之前只有70%,但70%的成功率是不能用于實踐的。這30%的提升會讓機器人應用場景多了成百上千倍。從這一角度來看,觸覺模態會使模型的成功率、穩定性得到極大提升,這一提升是將Demo變成實用模型的最重要因素。
產聯社:我們關注到帕西尼吸引了很多投資,未來準備在哪些領域發力?能與我們分享一下,下一步的計劃嗎?
張恒第:第一,拓展傳感器應用邊界與場景,將人類技能持續地遷移到機器人上,尤其是特種作業、危險場景,我們計劃讓機器人去做,這一過程將從易到難持續10-20年。同時我們將開放社群生態,讓大家參與共創,多開發傳感器的應用可能性。
第二,著重開發垂直領域的優質數據,尤其是此前在工廠、物流等產業方關心的高價值場景,構建高效、穩定的閉環。
總之,數據非常重要。從CNN到Transformer,再到ChatGPT這類大模型的發展的過程中,他們能突破技術到應用的臨界點都是源于數據的積累。所以我們堅信:觸覺難關被攻克后,具身智能將迎來爆發點,這正是我們現階段最期待的。
產聯社:哪一類客戶對觸覺技術的需求更迫切?帕西尼如何針對不同的客戶制定不同的觸覺感知方案?
張恒第:我們的核心技術不會變,在研究過程中,我們會判斷:只要這個原理在某一方面具備優勢,我們就會展開研究,前提是它具備耐久性和信息一致性,如果不具備這兩個條件,我們就會改用其它方案。
其次,我們針對醫療這種精細行業時,就會優化參數將傳感器做得非常細小、纖薄,還要保證其搭載器械的精準拉扯力、咬合力。如果需要大面積平鋪,我們增加用量就好。
產聯社:如何看待你們在機器人賽道上所處的位置?
張恒第:以觸覺為始,延伸形成完整生態,讓具身智能深入到現實生活中,最后賦能更多行業。
產聯社:能否分享一下你們的短中長期目標?
張恒第:短期目標:持續迭代觸覺傳感器,提升銷量;增加產品多樣性。
中期目標:一年內將具身智能領域的數據規模提升至億級,機器人的物理智能提升到可落地的實質性水平。
長期目標:通過觸覺感知以及所有感知技術將 AI 連接到真正的物理世界,以實現第二種智能生物的誕生,并服務于人類,與人類共存。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.