![]()
沉寂許久的螞蟻,正迎來一場爆發式的深水回歸。
2025 年底,螞蟻剛剛在 AI 領域連落兩子。首先是靈光上線,6 天斬獲 200 萬用戶,展露爆款潛質。緊接著,螞蟻阿福開始了地推模式,從單一醫療問答跨向全場景健康陪伴,正式切入健康陪伴大賽道,并迅速殺入國內 AI 應用前五。
數據的高光背后,是螞蟻戰略重心的位移。回看四年前,那是螞蟻最晦暗的時刻。螞蟻集團資深副總裁陳亮曾將那段日子形容為站在燈光照射不到的角”。但場外的蟄伏并非離場,而是在為這一輪 AI 周期積蓄勢能。螞蟻的這股猛勁,更像是一場蓄謀已久的反攻。
就在外界還在消化這些密集動作之際,螞蟻又低調推出了下一張牌:嗚哩。多方信息顯示,這款產品出自螞蟻內部新近整合的 AGI 組織 Inclusion AI,目前處于測試階段。
![]()
阿里嗚哩是什么?
嗚哩將自己定義為AIGC創意生產力平臺,核心面向內容創作者/設計師/營銷人員/普通創意用戶,主打輸入描述—快速生成—多場景落地。它覆蓋的功能包括圖片生成、視頻生成、圖像編輯,以及配套的靈感聯想助手、翻譯、資源庫等輔助能力。
與通義萬相這類偏模型能力展示/體驗中心的產品不同,嗚哩更強調把生成變成可用素材,也就是把用戶最常見的訴求(海報、電商圖、3D 字體、特效圖等)包裝成更接近交付的模板化路徑。
嗚哩背后直接調用了通義千問團隊的多款圖像和視頻相關模型,包含Qwen Image 25.12(圖像生成)、Qwen Image Turbo(極速生成)、Qwen Image 25.11(圖像編輯)等分工明確的模型組合。
它的產品思路不是單一大模型包打天下,而是更像一套創意流水線:同一個任務在不同階段用不同模型接力,優先把體驗做順。
產品地址:https://wuli.art/
![]()
功能拆解:以速度與可控性為核心的AI工具組合1)生成:圖片與視頻的場景化入口
從生成這一層本身來看,嗚哩的產品形態并沒有明顯跳出當前 AIGC 產品的主流范式。空白輸入框、圖片與視頻生成、場景模板、提示詞輔助,這些功能在同類產品中已較為常見,無論是模型廠商自帶的生成工具,還是第三方創意平臺,基本都提供了相似的能力組合。就“生成”這一層的功能堆疊而言,嗚哩并不存在顯著的、肉眼可見的差異化突破。
即便是在模板和聯想助手的設計上,嗚哩采取的也是相對穩妥的產品路線。通過預置結構和自動補全來降低使用門檻,而不是引入全新的交互范式。這種做法的優勢在于學習成本低、上手快,但同時也意味著用戶很難僅憑生成體驗本身,明確區分嗚哩與其他同類產品的差異。對于已經熟悉文生圖或文生視頻工具的用戶來說,嗚哩在操作邏輯上的遷移成本接近于零,但驚喜感也相對有限。
![]()
然而,真正屬于嗚哩的暴力美學隱藏在看不見的技術底層,即對極致速度的近乎偏執的押注。Hugging Face 上發布的Qwen-Image-2512-Turbo-LoRA揭開了謎底:這套方案宣稱在匹配原模型輸出質量的同時,實現了 20 倍以上的生成加速。
這種速度帶來的產品變量是革命性的。在嗚哩,系統可以做到 5 秒內生成 4 張 2K 分辨率大圖。這意味著生成體驗從等待開盲盒變成了高頻盲選。它允許用戶在同一個時間窗口內進行多輪嘗試。在功能高度同質化的賽道上,這種極致的吞吐量本身就是一種核心競爭力。
當然,這種加速路徑也有代價,為了換取穩定與可用,輸出風格會表現得相對保守,更趨向于寫實審美。這對于電商圖、海報、封面等強調“交付率”的商業場景是巨大的加持,但對于追求強個人風格表達的創作者,這種默認路徑未必是第一選擇。
實測下來,整體效果還可以。
![]()
生成文字的部分,會有一部分錯誤,整體ok。
![]()
在視頻生成上,嗚哩將時長嚴格限制在智能生成 5 秒。從底層文檔來看,無論是極速版的萬相 2.2-flash 還是專業版,都整齊劃一地指向了 5 秒這個規格。這種“Flash/Plus”的分層邏輯非常典型:一個版本為速度與成本服務,一個版本為穩定與成功率服務。對于嗚哩這種強調快速出素材的入口來說,5 秒限制反而是工程上最容易做到穩定的邊界條件。
提示詞:生成一段 5 秒 的視頻,全程單一連續鏡頭,不剪切。 第 0–2 秒:一臺銀色筆記本電腦靜置在桌面上,冷色燈光,環境安靜; 第 2–4 秒:屏幕亮起,代碼開始緩慢滾動,光線從冷色過渡到中性; 第 4–5 秒:畫面整體變得略微溫暖,但構圖和鏡頭保持不變。
提示詞:生成一段 5 秒 的視頻。 第 0–3 秒:只展示產品本體,不出現任何文字; 第 3–5 秒:在畫面右下角淡入中文文字‘全天候健康監測’,字體簡潔、白色、小號,不遮擋主體。 文字只能在最后 2 秒出現。
提示詞:生成一段 5 秒 的視頻,一位工程師在夜晚辦公室敲代碼。 屏幕發出冷色光,環境安靜,鏡頭輕微左右平移,寫實風格,整體克制。 主體人物比例自然,動作連貫,畫面穩定,不夸張、不戲劇化。
2)編輯:把生成從一次性抽獎,推向可控迭代
在設計工具里,編輯往往比生成更能決定長期留存。生成能力在行業內已經趨于同質化,用戶換一個入口通常也能得到差不多能看的結果。但一旦進入真實工作流,需求會迅速變成“能不能改得準、改得穩、改完還像原來的那張圖”。電商圖換背景、海報改文案、人物修手、Logo 保持一致,這些任務的共同點是:需要在保留主體的前提下做局部修改,單靠反復重生成很難穩定交付。
嗚哩的編輯并不是簡單套用文生圖能力,而是有專門面向編輯場景的模型底座。Qwen 的Qwen-Image-Edit-2511模型卡明確強調其在進行想象式編輯時盡量保持主體身份與視覺特征,并展示了角色一致性增強的方向。多家科技媒體在報道中也將它定義為專門針對圖像編輯場景優化,目標是在保持原圖主體結構不變的前提下對特定區域做精準修改,并強調指令遵循能力與一致性保持。
實測下來,整體效果處于可用水平。例如在將白色精華產品的背景調整為暖色調時,修改過程較為順暢,結果也能較好地符合預期。
![]()
在添加文字的基本功能上,整體表現較為準確,但在個別情況下仍會出現文字重復或冗余的問題。
![]()
在多次文字調整過程中,修改結果整體仍能按指令正確呈現(雖然還是有一些火星字)。但值得注意的是,原本乳白色的背景在反復編輯后出現了材質變化,逐漸呈現出類似大理石的紋理效果。
![]()
在當前設計下,圖片編輯需要先進入專門的修改模式再進行操作。相比即夢依托上下文直接理解并完成修改的方式,這一流程在操作上略顯繁瑣。
3)其他功能:靈感和知識庫
目前,靈感與知識庫相關功能尚未對外開放。基于現有產品定位,可以推斷其價值并不應停留在“模板集合”層面。如果嗚哩希望向“生產力平臺”演進,資源庫的核心意義在于資產沉淀與復用能力:將用戶生成過的素材、常用風格、品牌色、字體規范以及產品圖參考等內容,轉化為可持續調用的生產資產,用于后續創作與編輯。
競品分析:嗚哩真正的對手是產品范式
競品對比上,嗚哩同時面臨兩類壓力:一類來自即夢這樣的內容生產平臺化路線,另一類來自 Lovart 這樣的設計任務 Agent 化路線。兩者的共同點是,競爭焦點都不在單點生成效果,而在工作流與交付形態。
即夢,長在流量航道上的一站式 AI 片場
即夢最危險的地方在于,它已經完成了從工具到場景的閉環。就在 2025 年 12 月,即夢網頁版完成了一次降維打擊式的升級,正式將定位從生成入口推向了“AI 片場”。這次升級的核心是搭載了基于字節自研 Seedance 1.5 Pro 模型的視頻 3.5 Pro。物口型、樂器演奏甚至是環境音效都能一次性成型,徹底告別了“AI 視頻無聲、后期配音對不上”的尷尬。
對嗚哩而言,即夢的壓力是全方位的。首先是心智占領,作為較早規模化推廣的工具,即夢在創作者認知中已經與“短視頻生產”深度綁定。更關鍵的是場景優勢,即夢背后依托的是字節系生態,抖音和 TikTok 本身就是內容生產與分發的“第一現場”。創作者對快速出素材、試版本、直接投放的需求高度集中,即夢將生成、編輯、畫布、Agent 和素材管理無縫嵌入這條生產線,本質上是在增強既有的創作行為,而非重新教育用戶。
Lovart不是工具對比,而是交付方式的變化
如果說即夢是靠生態贏,那么 Lovart 走的就是“設計 Agent”的路線。
Lovart 并不試圖在生成入口上硬碰硬,它核心敘事不是幫你生圖,而是幫你完成一次設計任務。在這種邏輯下,生成只是手段,交付才是目標。用戶給出的不再是瑣碎的 Prompt,而是一個抽象的需求描述,比如品牌調性或應用場景,系統則圍繞概念、風格、排版和元素進行自動化的方案迭代。
這種 Agent 化路徑的本質是在弱化“素材中轉”的存在感。傳統的 AIGC 工具往往需要用戶生成素材、人工篩選、再倒騰到第三方軟件編輯組合,而 Lovart 試圖把這條鏈路內化為一個連續的自動化流程。對用戶而言,評價標準變了,不再是這張圖好不好看,而是這個需求是否已基本完成,是否可以直接拿去用。這一變化抬高了行業預期,讓單純提供生成和基礎編輯的工具容易被重新定位為“價值鏈的中間環節”,而非終點方案。
嗚哩可能是在替阿里補上“從模型到交付”的最后一公里
我對嗚哩的階段性判斷是:它不是一個孤立的創意工具,而是螞蟻在組織與戰略調整之后,持續把模型能力做成可消費產品的外顯信號。
2025年春節后,螞蟻重新集結資源,成立相對獨立的 AGI 組織 Inclusion AI,并被外界描述為 Research、Engineering、Product 三位一體的組織架構。
這種組織形態在大廠并不常見:研究部門往往負責拓展能力邊界,工程部門關注可用性與穩定性,產品部門負責路徑設計與增長。當三者被強綁定在同一組織內,最直接的結果是模型能力更容易被快速產品化,而不是停留在論文、榜單或內部 demo。Inclusion AI 在 Hugging Face 的組織介紹中也明確表述其為螞蟻集團的 AGI initiative,產出覆蓋 LLM、強化學習及相關系統。
在戰略取舍上,螞蟻表現得異常清醒:暫時放棄爭奪高度擁擠的“通用 AI 助手”入口,優先搶占更細分、強交付的效率工具賽道。
這背后的邏輯并不復雜:通用助手的入口戰已是紅海,頭部玩家依托底座模型的先發優勢,足以把后來者拖入同質化競爭。而效率工具的護城河在于“交付密度”——用戶未必需要一個 AI 每天陪聊,但絕對需要一個工具能幫他節省下半小時的作圖或剪輯時間。
這一路徑已在“靈光”和“阿福”上得到了驗證。它們并不急于講萬能的故事,而是死磕具體能力。比如“靈光”主打 30 秒生成一個小應用。
在這樣的組織與戰略背景下,“嗚哩”就不再只是“又一個 AIGC 產品”,而更像 Inclusion AI 在全模態效率工具這條主線上的自然延伸。它把多模態能力從此前偏重對話與應用生成的形態,進一步推進到視覺創意與設計生產這一更貼近營銷、電商與內容生產的場景中。通過生成、編輯與資源化能力的組合,嗚哩試圖解決的是“普通用戶能否更快、更穩定地完成一次可交付的視覺生產任務”。
從這個角度看,嗚哩的意義不在于單點功能是否領先,而在于它是否真的把阿里系在視覺模型上的積累,推進到了用戶可以反復使用、持續依賴的工作流層面。
歡迎掃碼加群參與討論
我們相信認知能夠跨越階層,
致力于為年輕人提供高質量的科技和財經內容。
稿件經采用可獲邀進入Z Finance內部社群,優秀者將成為簽約作者,00后更有機會成為Z Finance的早期共創成員。
我們正在招募新一期的實習生
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.