在多模態落地應用加速的當下,智象未來還潛藏著怎樣的商業潛力?
距離OpenAI發布文生視頻模型Sora已過去近兩年,中美兩地的AIGC企業卻呈現出截然不同的發展狀態:一面是成本居高不下,始終無法鋪開量的Sora2,和留存率幾乎為零的SoraApp;另一面,是扎根在廣闊的應用土壤上,漸入佳境的中國企業,在商業化上迎來全面爆發的局面。
《智能涌現》近日獲悉,專注于視覺多模態的生成式AI創企智象未來2025年的全年營收已過1億元。其C端產品vivago.ai同樣在近期迎來了下載最高峰,其中,1月新增近千萬用戶,在全球100+國家和地區進入Google Play“視頻播放與編輯”類別榜前10,已呈現出巨大的商業發展潛力。
自創辦以來,智象未來先后發布了HiDream-I1圖像生成大模型與HiDream-E1交互編輯模型,并在2025年4月全面開源,開源24小時內即登頂國際權威AI測評榜單Artificial Analysis。
這家從合肥出發的企業,通過自研的超百億參數大模型、全球首創的擴散自回歸架構,在生成質量與效率上找到了完美平衡。現階段,其產品已在文創、影視、廣告等領域廣泛應用。
《智能涌現》獨家獲悉,智象未來融資進程再提速:B輪融資已進入交割階段,下一輪TS已提前落袋,接近公司的核心知情人士透露,兩輪融資均為數億元量級。在AI視覺生成賽道競爭加劇的當下,智象未來憑借硬核技術實力與清晰的商業化路徑,持續獲得頭部資本的重倉布局。
在多模態落地應用加速的當下,智象未來還潛藏著怎樣的商業潛力?
最產業化的科學家,最落地的浪漫
從創立之初,智象未來就找到了一種務實的浪漫。創始人梅濤是加拿大工程院外籍院士,此前曾在微軟任職長達12年。在多媒體分析和計算機視覺領域發表論文300多篇,先后15次榮獲最佳國際論文獎。
但梅濤的經歷又不止于學術。2018年,梅濤加入京東,任京東探索研究院副院長。這段職業,讓他看到了從技術到商業化落地的通路。
在決定創辦智象未來時,梅濤有過清晰的構想。一方面,多模態是實現通用AGI的最可能路徑,這種觀點后來也成為了行業共識。與此同時,在商業化前景上,多模態又比純語言模型有著更為廣闊的空間。“當前全球AIGC收入的50%-60%來自圖片和視頻相關應用,高于純文本模型。2023年我們創業決策時,像Midjourney這樣的多模態公司已通過SaaS工具證明了強大的商業化能力,清晰的驗證了產品的市場契合度。”梅濤曾在2025年中對36氪表示。
而這恰恰是梅濤的主戰場,在計算機視覺(CV)和多模態領域有著深厚的積淀。
不過,對于當時的中國創新企業來說,初入戰場,Sora是擺在面前的一座大山,考慮到其對物理世界的還原程度和實現的驚艷效果,當時業內頗為期待的是,中國創企能否拿出可以與之匹敵的生成結果。
一場競逐就此開啟。在Sora發布后,僅用了半年時間,智象未來就發布自主研發的多模態大模型,2025年4月,智象未來更是一口氣開源了圖像生成大模型HiDream-I1與交互編輯模型HiDream-E1,打通從對話到圖像創作的閉環。HiDream-I1在權威榜單Artificial Analysis中24小時內登頂,成為首個躋身全球第一梯隊的中國自研生成式AI模型,并在圖像質量、語義理解、藝術表現三大維度刷新行業紀錄。
![]()
不過,多位創業者事后都復盤,覺得Sora在架構創新層面反倒有些落后。梅濤當時也感覺,Sora整體功能與預期相近。就在此后半年,隨著智象未來等初創企業的入局,在當前的視頻生成領域,OpenAI已不具備太大優勢。特別是從產品落地角度來看,無論是海外還是國內的其他產品,其實都已經相差無幾。
與此同時,在探索多模態架構范式上,智象未來甚至還走在了前列,公司最早研發了生成和理解雙模型,而后則規劃理解生成一體化,這被看作是通往物理世界的最佳路徑。
智象未來也一直走在突破行業難題的路上。2025年,隨著最新模型的開源以及vivago2.0等產品的發布,梅濤也告訴36氪,DiT(編輯注:Diffusion Transformer)架構利用Transformer的強大能力處理視頻數據,讓AI模型能高效建模時空關系并靈活生成不同分辨率的視頻,這是一個重要的進步。然而,對整個生成式AI領域而言,復雜物理現象的逼真還原仍是懸而未決的難題——飛濺的水珠軌跡、物體碰撞的力學反饋等人類直覺可感的動態細節,仍處于“形似而神不似”的探索階段,在相關場景中仍常出現視覺違和感。
智象未來通過Sparse DiT架構讓模型在生成效果和運行速度之間找到了優異的平衡點。再通過對抗蒸餾技術在增加推理效率的同時,極大地增強了畫面的細節和美感。這最終促成了智象未來旗下HiDream-I1模型的多個創造性成績。
在算法上另辟蹊徑,解決好最后一公里的問題
和大廠卷基模、搞參數的邏輯不同,小廠更講究創新與落地,在梅濤看來,這也是智象未來的價值,解決好AI最后一公里的落地問題。
其曾對36氪表示,“從我們創業第一天起,我們就非常有危機感意識,就想著怎么樣去找PMF。我們在商業化方面走得比較早,也比較快。雖然我們融的錢并不是最多的,但是花的每分錢、招的每個人、我們都是想明白的。”
在成立早期,智象未來就形成了“1+3+N”布局,即一個核心多模態大模型,驅動創作工具平臺、互動營銷內容工具和一站式視頻創作Agent三大產品。截至目前,其服務已覆蓋全球超2000萬個人用戶和超4萬企業用戶。
做好定位之后,核心是怎么做好交付,服務好客戶,讓AI真正產生價值。
梅濤告訴36氪,智象未來有國內最全的多模態版權語料、數十萬小時版權視頻素材以及上萬個授權IP。不僅涵蓋了國內70%影視數據,且已形成上億條AIGC二創素材,目前在影視、文旅、營銷等場景得到廣泛應用。
“在微軟研究院,我們就經常說,從一個技術到一個產品,可能需要一百個工程師;要把產品賣好,可能還需要一百個解決方案專家或BD,可見中間的Gap有多大。當時我就想,我一定要找個地方去把鏈條打通。”
也正是這份從技術到落地的全鏈條能力,讓智象未來自誕生至今一直頗受資本看好。
2024年,智象未來完成數億元A輪融資,由合肥產投集團領投,安徽省人工智能母基金等機構參與。2025年底,京東集團作為戰略投資方對智象未來進行加碼,其背后的物流、零售、健康、工業等龐大業務場景,恰恰是多模態AI技術絕佳的落地試驗田和應用沃土。
隨后,便有知情人士透露,智象未來緊鑼密鼓地啟動了B輪融資的籌備工作,并計劃于2026年初完成交割。
36氪近期了解到,智象未來已順利拿到下一輪TS,其中,老股東持續加持,新股東有產業資本、業務能深度合作的上市公司和知名投資機構,目前B輪融資金額已達到數億元人民幣。
上海敦鴻資產CEO袁國良在評價智象未來時如是表達,“我們堅定看好視頻生成技術作為新一代生產力工具,將全面賦能千行百業。尤其在電商領域,視頻已成為連接商品與消費者的核心媒介,而HiDream已通過產品初步驗證了其在電商場景下的應用價值與商業化潛力,體現了團隊不僅懂技術,更懂行業。同時,我們認為其技術架構與演進方向,具備向更具通用性與認知深度的世界模型拓展的可能性,這是一種底層能力的躍遷。我們期待與團隊共同探索技術與產業融合的長期路徑,助力推動多模態生成成為普適且智能的行業基礎設施。”
![]()
兼具商業化實力與架構創新的最佳標的
2025年是中國多模態生成式AI的爆發元年。隨著AIGC技術的日趨成熟,生產力與創造力顯著提升,驅動應用市場呈爆發式增長態勢。根據IDC數據,全球生成式AI市場規模未來五年復合增長率預計高達63.8%,到2028年將達2842億美元,占AI總投資的35%。而智象未來憑借極強的技術實力與產業化落地思維成為其中的獲益者。公司商業化進程迅速,36氪獲悉,智象未來2025年的全年營收已過億。
在競爭激烈的多模態生成領域能快速實現這樣的成績,得益于智象未來獨特的商業模式思考與強勢的底層創新能力,可以說,智象未來是行業里為數不多的,商業化與技術創新兩手抓的企業。
在智象未來創立的三年時間里,經歷了不同的商業模式。2023年的模式是MaaS,賣模型和API,類似于云計算的PaaS模式。2024年的模式是SaaS,主要賣工具,讓用戶在智象未來的平臺上使用工具生產內容。
現如今,其已升級模式,正式轉變為RaaS,即交付結果、以用戶價值為導向的商業模式,包括工具、內容素材、限額視頻制作/投放只收少量的基礎費用,主要是賺取客戶的GMV提升后的分傭。據梅濤表述,其認為這樣的客戶價值相對清晰,可以基本上實現零風險投入,增量收益共享。
隨著創業漸入佳境,梅濤也表示,其已經找到了商業回報和能力提升的平衡點。一方面是不斷加大水位,做好垂類基礎模型的研究,而一個更強大、方法更先進的底層架構,必定能為模型能力打下更好的基礎。除了閉門自研,智象未來也通過開源擁抱更廣闊的生態,提升成功的可能性。另一方面,依舊是解決最后一公里問題,深入到用戶的實際場景需求里,打通更多垂類數據,如教育、電商和文旅等行業,做精調,真正解決行業問題。
《智能涌現》還了解到,智象未來目前也在研發新一代具備多模態推理驅動和無限記憶的多模態生成架構,將在大幅提升模型推理能力的同時實現更高水平的多任務間橫向scaling up。
現如今,隨著技術、市場和政策層面的共振,行業側也正在意識到,AI視頻不再是極客的玩具,而是能直接產生現金流的生產力工具。去年以來,由AI生成的“貓狗運動會”“刀切玻璃水果”等爆款AIGC視頻走紅社交平臺,也讓越來越多創作者入局,是從頭部玩家到C端普通用戶的共同選擇,最終加速了視頻生成賽道的商業化進程。
據國際調研機構Fortune Business Insights數據,2024年,AI視頻生成的全球規模約6.2億美金,預計在2032年達到25.6億美金,2025—2032年間的復合增速為20%。
現階段,在營銷與特定內容領域AIGC已經是主流選擇,更可觀的暢想是,隨著模型能穩定解決角色一致性和長時序連貫性問題時,AIGC將在影視、游戲等高端應用引爆市場。而當模型突破理解生成一致性的問題,其便真正能認識物理世界,生成更真實可控的內容與細節,屆時,才是視頻生成賽道真正的爆發時刻。在這場競速之中,智象未來已走在了前列。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.