![]()
“當前,大模型在垂直領域已具備足夠的智能,能夠處理事務、回答問題。我們要解決的是,能否為AI賦予身體,使其有形象、能表達?”
公司情報專家《財經涂鴉》獲悉,10月29日,魔琺科技(Xmov)宣布正式上線全球首個高質量、低時延、高并發、低成本、多終端的具身智能3D數字人開放平臺——魔琺星云,以期將AI交互從當前以“文本框”為主的單一模式,全面升級為具備語音、表情、動作等多模態交互能力的智能數字人。
魔琺科技創始人兼CEO柴金祥認為,如今,AI已經可以寫文章、編程序甚至做決策,并且可以調用各種API成為智能體,“然而,現在的AI依然有重大缺失——即缺少了身體。魔琺星云就是要把AI從無形變為有形,讓AI從擁有大腦進化為擁有身體”。
推動AI從大腦進化到「身體」
由于當前的傳統技術方案難以兼顧質量、延時、成本的“鐵三角”,這些挑戰導致高質量3D數字人的交互體驗無法實現規模化商用。
對此,星云平臺利用文生多模態3D大模型+技術實現路徑的協同突破,成為全球首個可大規模商用的具身智能底層基建,讓AI完成了從“大腦”到“身體”的進化。
例如,模型層面,平臺通過自研的全球首個文生多模態3D大模型,直接將文本/語音轉換為語音、動作、表情、手勢等多模態的3D表達信號;架構層面,云-端拆分的方式不僅極大降低了下行帶,亦在端側實現了將參數實時轉化為畫面。
柴金祥透露,魔琺科技自2018年起積累了大量高質量的3D動畫數據,成為其模型訓練的關鍵壁壘。其中每一條數據都需要具備強動畫制作能力的團隊進行標定與審核的制作,成本高達每秒千元,涵蓋人臉、手勢、身體動作與表情的高質量3D動畫數據,為模型的高質量輸出奠定堅實基礎。
據悉,在核心技術指標上,魔琺星云擁有六大優勢,包括高質量實時自然生成;驅動延遲壓縮至500ms以內;千萬級設備并發的驅動能力;可在百元級芯片上運行的低成本;適配多場景應用需求;完全兼容國產信創芯片體系。
通過構建從實時驅動到內容創作的全鏈路能力體系,星云平臺不僅推動傳統顯示屏向“AI具身智能交互屏”演進,亦可助力人形機器人從執行基礎操作的“藍領”進階為具備交流服務能力的“白領”與智能伙伴。
這一技術突破或將重塑人機交互產業格局,為數字經濟注入新動能。
商業化進程啟動,百家客戶正在測試
商業化方面,柴金祥透露,已有上百家企業客戶正在測試,部分已經付費,展現出強烈的市場興趣與商業化潛力。其中,顯示器制造商率先看到了機會。
“在顯示器行業競爭飽和的當下,通過星云平臺,公司可以在原有的屏幕上給出更多交互方案。”光嶼智聯CEO馮晨在現場分享中表示,“對用戶來說,那將是一種超越預期的震撼體驗。”
據悉,從手機、平板、電腦,到商顯屏幕、電視、車載大屏,任何屏幕都可以通過魔琺星云升級為能自然交互的具身智能體,從被動信息載體變成主動交流和服務入口。
萬屏時代CEO黃鍇則基于與多家頭部數字人公司合作的經驗進一步表示,目前,頭部公司產品優秀,但整個行業產品質量參差不齊,成本高、服務不穩定,“數字人能力的局限束縛了行業發展,大家都在低水平重復造輪子”。
“魔琺星云的發布將極大拓寬整個顯示器行業的市場邊界。”他認為,未來市場或將從百億市場成長至千億甚至萬億。
魔琺科技相關負責人透露,在教育、客服、法律、銷售、導游等眾多領域,魔琺星云可提供低成本、高效率、規模化的交互式具身智能服務。同時,平臺的能力也將延伸至機器人領域,賦予人形機器人更自然的語音、眼神與手勢交互能力,
目前,開發者、系統集成商及生態伙伴均可基于魔琺星云快速構建各類應用,涵蓋App、小程序、Web端、智能座艙、零售展廳等多種場景。
現場,柴金祥還宣布,魔琺星云將面向全球開發者全面開放,“魔琺星云有這個能力讓每一塊屏幕、每一個應用、每一個終端,都有一個具身3D智能數字人。”
作者:蘇打
編輯:tuya
出品:財經涂鴉(ID:caijingtuya)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.