作者 | 小小
出品 | 網易科技
參數依舊華麗,但體驗真的能打嗎?
![]()
在谷歌Nano Banana的步步緊逼下,高傲的OpenAI最終不得不選擇了“自降身價”。新版GPT-Image-1.5的上線,雖然打出了4倍生成極速和“像素級”控制的王炸,更直接祭出了API端降價20%的肉搏戰術,但這一切難掩其防御姿態的倉促。
![]()
輿論場瞬間撕裂。務實派大贊其“畫質出色、控制精準,適用于實際生產”,認為這是工作流的福音;但權威專家卻冷冷地潑下一盆冷水:“在處理復雜視覺內容時,其表現可能仍不及競品Nano Banana Pro。”
也有評論員尖銳地指出:當OpenAI試圖用“軍備競賽”的方式回應競爭,它是否已經忘記了當初那個誓言要造出AGI的初心?當科技巨頭們不再講故事,而是專注于“堆料”和“降價”時,這究竟是技術的進步,還是創新精神的淪陷?
帶著這些疑問,讓我們剝開GPT-Image-1.5華麗的速度外衣,它到底強在哪里?又有哪些“隱形短板”仍舊困擾著這位視覺霸主?
![]()
(GPT-Image-1.5生成效果)
1. 硬核評測:速度狂飆4倍,從“佛系等待”到“實時反饋”
ChatGPT Images這次的產品策略非常清晰:用極致的速度和精準的控制力,直擊專業級用戶對效率與可控性的痛點。
![]()
(圖片由AI生成)
——“極速”能力的質變:創作工作流的福音
如果你是重度創作者或營銷人員,那么GPT-Image-1.5在速度上的進化,無疑將成為你眼中的絕對主角。
官方數據顯示,新模型的生成速度最高直接飆升至原先的4倍!有網友評論稱,這是“自從Nano Banana發布以來,AI圖像生成領域在模型排名上最大的飛躍!”
![]()
在追求實時交互和高效迭代的今天,這種速度的革命性意義在于:
· 并行創作:用戶可以在已有圖像生成的同時,繼續發起新的創作請求,徹底消除“等待時間”。
· 降低試錯成本:以前需要數分鐘的嘗試,現在可以在幾十秒內完成多輪迭代,極大地提高了“試錯效率”。
這種速度的提升,使得圖像生成從“被動等待”轉向了近乎 “實時反饋”,為工作流的整合奠定了堅實的基礎。
——獨立創作空間:用戶體驗的顛覆性重構
為了配合這種高速迭代的需求,OpenAI推出了獨立的Images創作空間,不再讓圖像功能僅僅是聊天窗口中的“附屬功能”。
![]()
(圖片由AI生成)
這個專屬的“創意工作室”內置了多種預設濾鏡、持續更新的流行提示詞趨勢以及創意模板。此外,用戶還可以一次性上傳個人形象(肖像),用于后續重復創作,從而降低了重復描述的成本。正如OpenAI應用負責人菲吉·西莫所說,新界面旨在讓圖像生成過程充滿樂趣,使創意探索變得毫不費力。
![]()
——“精確編輯”的強悍實力:告別整體漂移
在具體的編輯應用場景中,GPT-Image-1.5也有質的飛躍:
![]()
(圖片由AI生成)
· 一致性保持(核心):它能更準確地區分圖像中 “需要改變的部分” 與 “應當保持不變的部分”,并在內部推理中“釘死”關鍵的視覺錨點。例如,你可以給人物換服裝、換發型,而人物的五官、面部特征和光照條件依然紋絲不動,大大提升了“試穿試戴”和“角色一致性”的實用價值。
![]()
· 指令遵循與文本渲染:模型在理解多約束、復雜組合要求時的穩定性有所提升。同時,它在文字渲染方面實現了進一步增強,能夠更清晰地呈現密集文本與小字號內容,被視為圖像模型“邁向實用化”的必要補課。
世界頂尖免疫學家德里亞·烏努特馬茲(Derya Unutmaz)用“驚艷”來形容使用體驗,特別稱贊了ChatGPT Images在指令執行的精準度和圖像編輯的細致程度上的出色表現。
![]()
2. 深度挖掘:光鮮背后的“隱形短板”與行業焦慮
但我們不能只看官方秀出的肌肉。在GPT-Image-1.5耀眼的參數之下,也有一些值得警惕的短板和行業焦慮。
——技術“護城河”的消失與GPT-Image-1.5的定位
這是奧特曼“紅色警報”的核心原因之一。雖然OpenAI宣稱GPT-Image-1.5在一致性方面有所突破,但行業現狀是:差距已經微乎其微。
![]()
(圖片由AI生成)
谷歌Nano Banana Pro在精確編輯、背景移除等方面一直領先。Runway在視頻生成領域甚至反超了Sora。
有網友評論稱,將版本號定為1.5而非2.0,本身就暗示了OpenAI的謹慎態度:這是一次重要迭代而非代際革命。
![]()
曾經,OpenAI領先對手一年甚至兩年;現在,這個領先優勢被壓縮到了幾周甚至幾天。圖像生成的底層范式已經成為行業共識,OpenAI不再擁有獨門秘籍。
——復雜構圖與結構化設計的挑戰
盡管模型在保持核心要素一致性上表現出色,但在面對復雜和結構化任務時,挑戰依然存在。
![]()
(圖片由AI生成)
沃頓商學院教授伊桑·莫利克(Ethan Mollick)認為,在處理復雜視覺內容(如多圖幻燈片、信息圖表等結構化設計)時,ChatGPT Images的表現可能仍不及競品Nano Banana Pro。
![]()
前OpenAI研究員邁爾斯·布倫迪奇(Miles Brundage)則吐槽道,當提示詞過長或過于復雜時,ChatGPT Images可能無法完全理解并協調所有細節,導致輸出結果看起來隨機或不準確。
![]()
這說明,模型在“抽象理解”和“多元素邏輯協調”上,仍未達到完美狀態。
——降本增效:商業突圍的布局
這次升級也是一場精明的商業突圍。
GPT-Image-1.5已通過API形式正式開放,其最大的亮點在于:圖像輸入與輸出的整體成本降低了約20%! API定價為每百萬輸入Token 8美元、每百萬輸出Token 32美元。
![]()
(圖片由AI生成)
這對于預算有限的初創公司和電商企業來說,無疑是極大的利好。Wix、Canva等頭部企業已開始集成該模型。
正如Wix AI研究與數據科學負責人希拉·加特(Hila Gat) 所言,GPT Image 1.5畫質出色、控制精準,能準確執行編輯指令,支持端到端迭代,適用于實際生產。
![]()
3. 結語:視覺時代的“王座守衛戰”與創作自由的未來
GPT-Image-1.5的雙重進化——速度狂飆與精度鎖定——再次向世界證明了 OpenAI在 AI基礎設施上的統治力。它不再滿足于當一個偶爾靈光乍現的“藝術家”,而是立志成為每一個創意工作者案頭的“數字版Photoshop”。
但面對谷歌、Anthropic 等巨頭的步步緊逼,當所有模型都在逼近人類專家的水準時,“第一”的頭銜將變得越來越昂貴、也越來越脆弱。
OpenAI 的真正考驗,不再是能否跑贏對手,而是能否跨越自己設置的“商業化”門檻。
這場圖像能力的升級,本質上是 Open AI 為搶占 B 端市場、為未來高昂的算力支出買單而打出的一張效率牌和成本牌。它為用戶帶來了前所未有的創作自由,但同時也將 AI 競賽推向了新的維度:誰能將頂尖的能力,以最低的成本、最無縫的方式融入到企業和個人的每一個工作流程中,誰才是真正的勝利者。
![]()
(圖片由AI生成)
而對于用戶而言,巨頭們的“軍備競賽”卻是最大的福音。更強的模型、更低的價格、更順手的工具——這就是競爭帶來的紅利。至于 GPT-Image-1.5能否真正終結比賽,答案不在參數表里,而在每一個創作者的鼠標和鍵盤之上。
