![]()
摘要:
當 AI 視頻還在卷時長與畫質時,Xmax AI 另辟蹊徑,用毫秒級延遲的實時交互模型 X1,開啟了從「看視頻」到「玩視頻」的交互范式革命。
如果 2024 年我們還在為 Sora 模擬的流體視頻驚嘆,那么在 2026 年的今天,單純的高清視頻已經在光速發展的 AI 世界隨處可見。
當你對著屏幕里的那個 AI 虛擬形象,無論多么逼真,終究只是一段“被播放”的像素。AI 視頻生成實際上仍被禁錮在“預制內容”的舊范式中。而如今打破這層次元壁的,是一家由前華為「天才少年」創立的初創公司——Xmax AI
近日,Xmax AI 正式發布全球首個虛實融合的實時交互視頻生成模型——X1。不同于當前主流文生視頻模型聚焦影視內容生產與工業流程重構,X1 選擇了另一條更為硬核,且鮮有人涉足的征途:實現毫秒級的實時視頻生成和低門檻的手勢交互,并將虛擬內容實時、無縫地融入現實物理空間。
它意味著著 AI 視頻正在從“被動的消費內容”,躍遷為“共創體驗”。我們將可以調動現實與虛擬世界的任何一粒像素。
![]()
手機對準桌面,選取一張滾球獸的照片。下一秒,它就“脫屏而出”,立在你的桌面上東張西望。你伸出手,它先是警惕,隨后親昵地蹭向你的手心;你輕輕一捏,它會給出Q彈的物理反饋;攤開手掌,它甚至能被你穩穩“托”住。
![]()
這就是X1,不需要復雜的Prompt(提示詞),不需要漫長的云端渲染等待,僅憑一個手機攝像頭和最符合直覺的手勢,它就能讓幻想掙脫屏幕,與現實無縫融合。目前,Xmax AI已通過技術演示應用X-cambeta開放了X1模型的能力體驗,并可以通過 TestFlight 下載。
一、 告別“只能看”,AI視頻“人人可玩”
過去一年,全球AI視頻生成領域呈現出爆發式增長態勢。全球AI視頻生成領域呈現出“神仙打架”的繁榮景象。數據顯示,2024年全球相關市場規模已達6.148億美元,Sora、Runway等行業巨頭紛紛在畫質、時長和分辨率上展開激烈角逐。然而,縱觀行業生態整個賽道,大多數技術路線仍聚焦局限于“文生視頻”的單向輸出,主要服務于影視、廣告等專業領域的生產力需求。對于普通用戶而言,復雜的操作流程高昂的操作門檻、漫長的生成等待時間,以及內容本身的缺乏低互動性,使得AI視頻生成始終難以真正融入日常生活。
Xmax AI敏銳地捕捉到了這一行業痛點:AI視頻要真正走向大眾,不僅需要進一步降低門檻,更要從“生成結果”進化為“生成體驗”。為此,Xmax AI選擇了一條截然不同的技術路線:虛實融合 + 實時交互。不僅要生成畫面,還要讓畫面理解現實,并允許用戶用最本能的手勢去參與。
二、Xmax AI四大核心玩法
基于X1模型的實時生成能力,Xmax AI落地了四大核心玩法:
1. 次元互動:打破次元壁的觸摸
任意上傳一張角色圖(動漫IP、寵物照片、毛絨玩具),并通過手機攝像頭對準現實平面,X1模型即可將其實時置入現實場景中。當你撫摸屏幕中的兔子時,X1會實時生成它“轉頭蹭手”的動態響應;當你的手指劃過它的眼睛,還能看到絨毛因觸碰而發生的細微形變。
![]()
2. 世界濾鏡:萬物皆可“風格化”
上傳一張梵高畫作或樂高積木圖,攝像頭所捕捉的現實畫面即可實時全域風格化轉化。這是一整套“世界重繪”系統:當你對著鏡頭揮手、搖頭,畫面中那個變成“樂高人”或“二次元紙片人”的你,會同步保持風格一致性與動作連貫性。
![]()
3. 觸控動圖:指尖輕劃喚醒靜態圖片
上傳一張照片,在觸摸屏上拖拽照片中角色的耳朵,它會跟著搖頭;拖動嘴角,它會露出微笑。你甚至可以上傳自家貓咪的照片,通過觸控讓它揮拳、跳舞。
![]()
4. 表情捕手:社交破冰神器
鏡頭對準朋友,選擇一個“憤怒”或“大笑”的Emoji,AI會瞬間捕捉對方人物特征與神態,實時生成一個神態精準、魔性十足的動態表情包。
![]()
二、 華為“天才少年”領銜,攻克算法與工程的世界難題
在業內人士看來,X-cam看似簡單的“好玩”背后,其實是極高技術門檻的工程化勝利。
為了為了破解“極速響應”與“精準意圖理解”這一世界性難題,解決極致實時性與精準意圖理解的難題,團隊創新了端到端流式重渲染架構,實現了幀級自回歸DiT模型。通過多階段蒸餾壓縮與對抗訓練,擴散采樣速度提升了百倍。同時,團隊構建了統一交互模型架構,融合空間三維關系與屏幕二維操作,使模型能精準解析“捏”、“拖拽”等復雜用戶意圖。針對虛實融合數據稀缺的困境,Xmax.AI還搭建了半自動化合成管線,在筑牢行業技術壁壘的同時,也為我國 AI 視頻生成領域儲備了珍貴的數字資產。建立了堅實的行業壁壘。
硬核技術的突破,源自一支兼具算法與工程能力的硬核團隊。Xmax AI團隊匯聚了來自華為“天才少年”計劃、清華大學 KEG 與 HCI 實驗室、香港科技大學(廣州),以及字節跳動、快手等領軍企業的頂尖人才。
三、 X1:Play the World through AI
對于Xmax AI團隊而言,X1模型和X-cam應用只是一個開始。他們在試圖定義全新的內容交互范式,以及搭建下一代內容交互引擎。正如Xmax AI的Slogan所言:Play the World through AI(用AI玩轉世界)。
技術,終將讓幻想觸手可及。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.