昨天,有一個挺有意思的產品開源了。
AI繪圖圈的朋友們肯定都知道這個產品。
![]()
FLUX。
曾經的AI繪圖之王,幾乎取代了曾經SD的生態(tài),成為了最主流的基座模型。
可時過境遷,在如今Nano Banana Pro的轟炸之下,好像已經沒有什么人在乎他們了,也幾乎沒什么熱度。
真的挺慘的。
但是畢竟是AI繪圖圈僅剩不多的火種了,所以我覺得,還是得來聊一聊。。。
這次,發(fā)布了4款基礎模型和1個VAE模型,其中2款是不開源的。
分別是Pro和Flex,這兩個最強大的模型,是閉源的。
![]()
而其中2款模型是開源的,一個dev,目前已經開源了。
![]()
開源鏈接:
https://huggingface.co/black-forest-labs/FLUX.2-dev
然后另一款是klein,一個蒸餾模型,說即將開源。。。
目前整體模型,等liblib接完應該就在liblib上可用,或者也可以去他們官網用,去官網的話記得上魔法。
https://playground.bfl.ai/
![]()
我也做了一些測試,坦誠的講,當我用相同的Prompt,看到他跟Nano Banana Pro的對比,我還是很感慨的。
我直接放一下對比的圖,大家也可以自己感受一下。
先看幾個純粹的生圖效果。
Prompt:人類考古學家在金字塔挖掘現(xiàn)場發(fā)現(xiàn)一個旋轉金屬球的真實手持拍攝,手持紀錄片現(xiàn)實主義,真實手持風格。
![]()
Prompt:一張平平無奇的iPhone照片,無精心構圖和打光,日常快拍,松弛氛圍感亞洲美女,穿著寬松厚毛衣與牛仔闊腿褲,舒適隨性。肩上自然背著一只單肩包,款式簡潔低調,增添生活氣息。她隨意站在街頭或咖啡館門口,身體微微側身或靠在墻邊,姿態(tài)松弛自然。雙手可以插在褲袋里,或一只手輕扶單肩包帶,整體動作不經意。頭發(fā)自然散落,清爽不凌亂,眼神放空或帶著淡淡笑意。環(huán)境為日常街景或室內陽光灑落的空間,光線柔和,畫面像朋友用手機隨手拍下的松弛瞬間。
![]()
Prompt:《龍珠 Z》中的神龍正看著眼前的龍珠,以酷炫的彩色鉛筆風格,動態(tài)多彩的畫面,帶電的陰影。
![]()
還有中文字海報:
動畫電影《天書奇譚》藝術海報,中國山水畫風格,工筆畫細節(jié),高級感,水墨暈染效果,傳統(tǒng)青綠山水色系,連綿起伏的云霧繚繞的青山。山脈呈遞進透視。有紅色的仙鶴群點綴其間,營造出奇幻、磅礴、大氣的意境,柔和而明亮的光線,高細節(jié),電影級品質。主題為手寫藝術字體“天書奇譚”,加入電影海報需要的其他小字以增加質感,全部文字清晰可辨認。
![]()
好壞我就不評價了,大家可以自己對比。
然后就是用嘴改圖的能力。
比如這張圖。
![]()
我得Prompt:
讓左邊的人物cosplay右邊的角色,服飾、妝容、道具和右邊一致。
先看看Nano Banana Pro的。
![]()
整體還不錯對吧,衣服頭發(fā)辮子啥的都很好的還原了金克絲。
再來看Flux.2的。
![]()
說實話,我不知道該如何評價,這都不知道給我干哪來了。
還有這個妹子。
![]()
我想把它變成真人,就用嘴說了一句:
變成真人照片。
這兩效果是這樣的。
![]()
就。。。
但這些,畢竟不是重點。
真正的重點,我覺得還是,世界知識。
大家現(xiàn)在都知道,Nano Banana Pro背后,是Gemini 3 Pro,當今世界幾乎最強的多模態(tài)大模型。
而Flux.2,背后用的,是Mistral-3 24B。
![]()
這個模型吧,我就不評價了。
我放一個我朋友的圖。
![]()
所以,我們來看看,在世界知識上的表現(xiàn)。
比如這個Prompt:制作一份關于海賊王里戰(zhàn)力排名的信息圖。
Nano Banana Pro出來的效果,是這樣的。
![]()
效果非常好對吧,深刻的了解海賊王的知識,雖然我已經有一段時間沒追過海賊王了,有些細節(jié)我沒法判斷是不是對的,但是至少,這一出來,還是很唬人的。
你能明白,對方是懂海賊王的,對吧。
而Flux.2。
![]()
這明顯就不懂海賊王。
還有@卡爾的AI沃茲的一個非常經典的Prompt:
中國動畫中的孫悟空和路飛、漩渦鳴人、炭治郎、御坂美琴、蕾姆、桐谷和人、明日香、草帽喬巴、鹿目圓、阿尼亞·福杰、黑崎一護、艾倫·耶格爾、灰原哀和初音未來和哪吒、李白、唐僧、海綿寶寶、蠟筆小新、迪士尼公主們站在一起,大雜燴式同框,集體大合照;背景是一望無際的草原、藍天與白云,整體明亮清新的動漫風格。
這個基本對不懂世界知識的,就是致命的。
看看卡爾用Nano Banana Pro跑的圖:
![]()
牛逼到爆炸,幾乎全對。
還有一樣是@卡爾的AI沃茲的Prompt:
生成下一張書頁的內容。
![]()
Banana Pro是真的強。
![]()
但是Flux.2呢。
![]()
直接在原圖上變成了一堆亂碼。
一聲長長的嘆息。
從Flux.2其實越來越能看出,現(xiàn)在的一個趨勢。
在大廠反應過來以后,資源的All in下,做模型的小廠、小公司。
開始變得越來越跟不上、越來越掉隊了。
在Google上一周一路狂飆的背后,有人驚喜,有人沉默。
而Flux的工程師們,我想,大概率是后者。
我?guī)缀跄芟胂蟮侥莻€畫面。
在某個燈火通明的辦公室里,一群極度聰明的工程師,可能桌上還堆著喝完的紅牛和咖啡杯。
他們花了無數個日夜,去優(yōu)化FLux的細節(jié),去研究如何讓模型的筆觸更加細膩,他們摳每一個參數,都像是匠人在打磨一件藝術品。
他們堅信,只要把繪圖這件事做到極致,就能贏得用戶的尊重和市場。
然后,他們滿懷期待地準備發(fā)布,這時候,Google發(fā)布了。
Google拿出來的Nano Banana Pro,就像一艘從天而降的青銅時代號,用引力波把他們精心打造的馬車壓得粉碎。
他們突然發(fā)現(xiàn),自己一直在精心磨一把全世界最鋒利的寶劍,可對手直接開著高達來了。
這真的,有一點像,降維打擊。
因為AI生圖,早就不是一個單純的美術問題了。
它已經變成了一個認知問題,一個世界模型的問題。
你的模型不僅要會畫畫,它得先認識這個世界。
它得知道海賊王里四皇是誰,得知道路飛和鳴人是不同動漫里的主角,得知道初音未來是個虛擬偶像,得知道天書奇譚這四個字背后的中式美學意境。
這種知識,不是從幾張圖片里學來的。
是從海量的文本、視頻、代碼、對話里來的,是從一個像Gemini 3 Pro這樣的超級多模態(tài)模型里面來的的。
而支撐這個體系運轉的, 是數據、算力、人才密度。
說白了,就是錢。
是白花花的錢,是成噸成噸的錢。
真的,看著Flux.2生成的那些略顯笨拙的圖,我心里真的沒有過去看到一些跟不上時代的或者抽象產品的嘲笑,只有一種深深的惋惜。
當然了,F(xiàn)lux.2的開源,本身就是一種偉大的姿態(tài)。
對絕大多數中小企業(yè),甚至對我們個人開發(fā)者來說,這絕對是有巨大價值的。
它是火種,是基石,讓我們可以在它的基礎上,去訓練自己的模型,去搭建自己的工作流,去探索AI的可能性。
從這個角度看,他們是英雄。
但這種英雄,卻帶著一種堂吉訶德式的悲壯。
AI時代,真的是最好的時代,也是最壞的時代。
說它好,是因為技術的普及讓每個人都有機會參與其中,創(chuàng)造前所未有的東西。
說它壞,是因為當牌局進入深水區(qū),你會發(fā)現(xiàn),最終能決定勝負的,似乎又回到了那個最古老、最樸素的規(guī)則。
拼資源。
技術理想主義的光芒,在絕對的資源壁壘面前,有的時候,顯得那么脆弱。
當然,那些真正偉大的顛覆時代的創(chuàng)新,都在那個壁壘之下的黑暗里,在慢慢生長。
我只是覺得,這個時代的創(chuàng)業(yè)者,好像比互聯(lián)網時代、還有移動互聯(lián)網時代,難太多了。
我也在創(chuàng)業(yè),那種難,真的感同身受。
但無論怎樣。
也衷心的祝愿所有的創(chuàng)業(yè)者,也祝愿我自己。
不僅是這個時代最勇敢的探路者。
也一定都能,到達那個最遠的彼岸。
風雨同舟。
愿與諸君共勉。
以上,既然看到這里了,如果覺得不錯,隨手點個贊、在看、轉發(fā)三連吧,如果想第一時間收到推送,也可以給我個星標?~謝謝你看我的文章,我們,下次再見。
>/ 作者:卡茲克
>/ 投稿或爆料,請聯(lián)系郵箱:wzglyay@virxact.com
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.