![]()
APPSO 獲悉,階躍星辰近日完成了超 50 億元人民幣 B+ 輪融資,參與機構包括上國投先導基金、國壽股權、浦東創投、徐匯資本、無錫梁溪基金、廈門國貿、華勤技術等產業投資方。騰訊、啟明創投、五源資本等老股東進一步跟投。
值得注意的是,這筆融資超過了月之暗面前不久宣布的 5 億美元 C 輪,刷新了過去 12 個月中國大模型賽道單筆融資的最高紀錄,甚至超過了智譜和 MiniMax 兩家公司 IPO 的募資額。
最近一個月以來 AI 資本新聞此起彼伏:Manus 被 Meta 收購,月之暗面楊植麟高調表示「不缺錢」,智譜和 MiniMax 先后在港敲鐘「上岸」。今天,階躍這筆融資,再次攪動了 AI 賽道躁動的神經。
對比之下,階躍前往的方向略有不同:當其他大模型玩家追尋確定性、抓住窗口期 IPO 上岸的同時,階躍星辰拿著這筆重金。選擇了一條更重、更慢的路:物理世界。
路線沒有對錯,但業內的判斷已經成為共識:大模型競爭的常規賽已經結束。過去兩年比拼的是參數量和 token——但從 2026 年開始,季后賽將圍繞新的核心命題展開:
人工智能如何走出數據中心,進入真實世界,接管更多的物理終端。
![]()
越周期的人與公司
APPSO 認為,在融資之外,更值得關注的是人事變動。
一位來自「上一個 AI 周期」的關鍵人物,正式走到了臺前:千里科技董事長印奇。
印奇早已深度參與階躍星辰的戰略規劃,此次也獲得了一個新身份:階躍星辰董事長,全面負責公司戰略與產業落地,與現有團隊形成正和互補。
在此之前,階躍團隊配置的特點是技術能力強,產業經驗稍弱:
- CEO 姜大昕是前微軟全球副總裁和微軟亞洲互聯網工程院首席科學家,負責過必應搜索的研發,這意味著他不僅懂技術,也有將 AI 產品化落地到全球級大流量產品的經驗,去年他成為了唯一來自中國大模型初創公司的 IEEE Fellow;
- 首席科學家張祥雨是深度學習領域基石論文 ResNet 的四位作者之一,對業界貢獻不言而喻;
- CTO 朱亦博曾任 Google Cloud GPU 產品技術負責人,直接支持 Anthropic,更早之前在字節負責 AI Infra 建設,是國內少數有萬卡集群從零構建實戰經驗的工程師。
這支團隊用兩年的時間殺出了「百模大戰」,躋身中國大模型第一梯隊。今天的階躍,是國內少數幾家仍在堅持預訓練、探索基座模型更高智能上限的初創公司,且擁有類型最全的模型矩陣。
但技術領先不等于商業成功。當大模型競爭更加白熱化的下半場,模型性能已經無法成為市場偏愛的唯一理由。如何讓大模型進入真實應用場景、產生商業價值,成為新的分水嶺。
一家公司想要穿越周期,需要懂得如何穿越周期的人。印奇正是階躍需要的那塊拼圖。
10 多年前「深度神經網絡」還是熱詞,研究者們首次意識到自己的研究和能力對于業界的巨大效用。2011 年,印奇和幾位清華姚班同學共同創辦曠視科技。
在中國 AI 創業者中,印奇是少有的「兩棲物種」。與月暗、智譜等純粹的學術派創始人,以及梁文鋒等量化背景創始人不同,印奇最大的標簽是「落地經驗/能力」。曠視 IoT 業務服務國內超 100 座城市,業務拓展至全球十多個國家地區,AIoT 平臺終端接入規模達到億級。
![]()
印奇
印奇的名字近幾年不常被 AI 圈人士提起,但確實沒多少人比他更懂 AI 下一個周期的核心敘事:
大模型不止于學術論文和榜單排名,它必須進入物理世界,形成閉環。
這也解釋了階躍 all in 拓展模型邊界之外的另一條主線:推動大模型進入手機、汽車等消費終端。數據顯示,階躍已與中國六成頭部智能手機品牌深度合作,模型裝機量突破 4200 萬臺,覆蓋 OPPO、榮耀、中興等品牌,日均服務 2000 萬人次。
在汽車領域,階躍與千里科技、吉利達成深度合作,將端到端語音模型集成到 AgentOS 智能座艙中。吉利銀河 M9 上市 3 個月銷量接近 4 萬輛;按照階躍的規劃,其車載模型今年的裝車量目標在百萬輛級別。
印奇在階躍草創階段就深度參與公司的戰略規劃,陪跑至今。如今印奇的正式加入,意味著他本人長期布局的「AI+終端」戰略,通過階躍得以加速,進入全面執行階段。
其本人旗下業務的組合,難免令人聯想到 Elon Musk 的 xAI 和特斯拉/Optimus 組合:一個提供靈魂,一個構成身體。
聚焦多模態:進入物理世界的唯一門票
為什么「AI+終端」必須押注多模態?
從純技術維度來看,多模態能力是大模型進入物理世界的「感官系統」。如果大模型是一個智能體,文本只是符號邏輯,多模態才真正構成眼睛、耳朵和嘴巴。只有具備多模態能力,AI 才能真正感知并融入人類的真實生活。
進一步看,實現這種感知能力有兩條路徑:一條是行業主流的「外掛」模式,即先進行視覺編碼,再交給語言模型理解。這種方式雖然簡單,但就像給盲人配個解說員,信息在轉化中必然發生損耗、延遲。
而階躍堅持的是「原生多模態」路線,直接從圖文交錯語料出發,進行端到端訓練。這種模式不受拼接架構的局限,實現了更原生、自然的多模態理解和生成,讓 AI 能夠模仿人類的方式,去理解物理世界的因果邏輯。
除了視覺之外,這種「原生性」在階躍的音頻模型上同樣有所體現。比如,最新的 Step-Audio-R1.1 通過 MGRD(模態錨定推理蒸餾)技術,讓模型生成純粹基于升學特征的推理鏈,解決了音頻模型「思考越多錯越多」的問題,生成效果在權威榜單 Artificial Analysis 上取得全球第一的成績。
![]()
目前階躍已經將第二代音頻大模型裝車,當你在車內說「我有點冷」,傳統智能座艙將語音轉文字,識別關鍵詞,再執行預設指令;而新一代座艙能結合語調、情感、環境噪音等信息,推測用戶的真實需求,而非簡單的關鍵詞匹配——比如,當你開著車門說冷,可能只需要關上車門就好。這種對原生多模態的堅持,并非跟風。早在 2023 年成立之初,階躍就確定了語言大模型與多模態大模型同步研發的并行戰略。這條道路沒有捷徑的,而階躍的選擇也為今天「AI+終端」的爆發埋下了伏筆。
從理解世界到主動交互
原生多模態是為了讓大模型「理解世界」,而走向物理世界的下一步需要大模型學會「與世界交互」。
于是階躍在 VLA(視覺-語言-動作)架構上深耕至今。其意義在于,讓 AI 能看、能聽,更能像人一樣,在數字或物理環境中具備決策與執行能力。
為了實現這一理念,階躍推出了業內首款可真正部署的開源 GUI 系列模型 Step-GUI。其中,40 億參數量的端側版本 Step-GUI-Edge 展現出極強的「以小搏大」能力,在主流基準測試中甚至能夠超越 8 倍于其參數規模的模型。這意味著即便在消費級終端的算力受限情況下,大模型也能從容處身其中,變身為具備讀屏和代操作能力的智能 agent。這也意味著所有手機廠商都能基于這套能力,開發類似于豆包手機助手的功能。
這種從感知到動作的進化,已在大規模商業落地中得到了認證。在手機終端上,階躍被認為是最懂 AI 手機的大模型廠商。據 APPSO 了解,目前階躍已于已于國內 60% 頭部手機品牌達成深度合作,覆蓋 OPPO、榮耀、中興等品牌旗艦機型。
![]()
今天,市售手機的 AI 功能早已超出了去年「對話框」的范疇,開始深入到系統層面,比如 OPPO 的「一鍵問屏」、榮耀的「拍照問」、中興的「長輩 AI 助手」等功能——大模型不僅能看懂屏幕、生成內容,還能跨應用完成復雜任務。
IDC 數據顯示,2026 年中國市場 AI 手機滲透率將突破 50%,每兩臺中就有一臺具備系統級的原生 AI 能力。
![]()
對于「大模型競賽進入下一階段」的業界共識,印奇和階躍押注了一條更難但更具確定性的路:AI 必須嵌入物理世界的骨架才能長久生存。
在硅谷的平行世界中,馬斯克整合 xAI 和特斯拉/Optimus,構建從前沿模型到物理終端的完整閉環。這條路需要重資產、重經營,也需要大多數模型公司不具備的產業資源。但在穿越過周期的人看來,這會是通往 AGI 的正解。
階躍不必擁有所有的工廠,但必須深度在場。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.