最近,美國OpenAI的GPT-Image2.0生圖模型(下文簡稱“GPT-2.0”)橫空出世,在網上有很多人都已經體驗過了。
昨天,我刷到了有人用它畫了“2008年北京奧運會期間的中關村大街”之后,便用豆包也嘗試了一下,結果是顯而易見的,GPT-2.0的內容相對來說更“逼真”一些,豆包和它完全不在一個層級。
![]()
當然,從客觀來說,GPT-2.0的內容也是經不起推敲的,比如海淀區的中關村大街上能看到位于朝陽區的央視大褲衩,且2008年其實還沒有竣工。
但即便有這些硬傷,單純比拼畫面逼真程度、光影質感,美國這款AI生圖模型的硬實力,依舊遠超我們國產的AI。
當時我對比之后,就隨手發了一個“微頭條”。沒想到,短短一天的時間之后,豆包seedream5.0lite生圖模型(我們簡稱“豆包-5.0”)便正式上線APP,我又再次針對它與GPT-2.0進行了一番對比:
![]()
第一題:畫一個3點43分的鐘表。
豆包-5.0畫了很多,完全不符合要求,時間基本都差個一分兩分的,有的干脆就是亂畫。
![]()
![]()
反觀GPT-2.0,精準理解指令,完整、標準的畫出了3點43分的鐘表,指針位置準確,結構合理,輕松完成了基礎要求。
![]()
緊接著,我給出第二題:一個人向前伸出手掌,且只露出四根手指,站在中國大陸十八線城市的公交車站牌前。
豆包-5.0生成的畫面整體中規中矩,公交站牌、路邊廣告牌的大體造型沒有問題,整體場景也不違和。但是關鍵細節出現嚴重錯誤,我明確要求只伸出四根手指,結果全部被它畫成了五根。
![]()
![]()
GPT-2.0精準做到了關鍵要求:人物嚴格只伸出四根手指頭,公交站牌、街邊設施的樣式,也高度貼合國內小城市的樣子。
最讓我震驚的一點是,這款美國AI,特別了解中國本土特色,竟然完美復刻了國內隨處可見的城市牛皮癬:墻面、站牌上密密麻麻印著開鎖、打井、疏通下水道等各類街頭小廣告,把十八線小城最真實的市井細節全部還原。
![]()
![]()
一個海外AI,居然對我們的本土生活細節了解到這種程度,完全超出我的預料,也正因如此,我決定下一道測試題,專門圍繞中國本土特色場景展開:賣保健品的去中國農村推銷,一大群老年人圍觀。
豆包-5.0此次表現的不錯,推銷人員在桌子上擺放了各種各樣的保健品“套餐”,身邊圍著一群老人,而且背景確實是在農村。
![]()
![]()
盡管豆包-5.0已經相當出色了,但GPT-2.0竟然再一次給我帶來了驚喜,它不只是簡單畫出擺攤、老人圍觀的基礎畫面,還自主補充了大量細節:自己設計、編寫了各類保健品的名稱,還標注好了對應的售賣價格。
更牛的是,它精準還原了農村保健品推銷的經典引流手段:免費贈送雞蛋、洗衣粉,完美復刻經典場景。不過,如果你仔細看還是有破綻的,比如桌子前的字,我怎么看都是亂碼。而且反常識的是,他“特惠價”比“市場價”還高,反向促銷啊?那有人買嗎?敢情你這是篩選目標客戶呢,畢竟這樣都愿意花錢的人,確實很適合吃保健品補補。
![]()
![]()
好了,對比結束,正文開始:
通過三組統一標準、統一提示詞的完整實測,我們可以得出結論:現階段,國產AI和美國的相比,依舊存在非常巨大的技術差距,尤其在AI生圖、細節理解、邏輯思考、現實場景還原等方面,我們還有很長的追趕之路。
即使這些真實存在,我依然十分看好國產AI的未來發展,堅定相信國產AI早晚能夠全面崛起、實現反超。
![]()
![]()
首先,以美國為首的一眾西方國家的AI,咱們正常訪問是訪問不了的。拋開大家都心知肚明的大局域網不談。其實,西方多國,同時出臺了大量政策,對我們實時了IP封禁,簡單說,就是他們不讓我們用。
但這種限制,不是企業單方面的選擇,而是國家層面的戰略打壓與技術圍堵。
![]()
回看我們國家幾十年的發展歷程,無數案例早就驗證了一個不變的規律,西方國家越是封鎖我們、卡我們脖子、限制我們的技術發展,從長遠角度來看,反而越能倒逼我們自主研發、突破瓶頸,最終實現彎道超車,甚至領跑全球,例子就太多了,像原子彈、氫彈、載人飛船、空間站、盾構機、飛機、導航、圓珠筆頭等等。
![]()
只要一封鎖,我們被迫自主攻堅,一旦技術徹底突破、就會完成國產化替代。中國依靠完整的工業體系、龐大的人才儲備、超強的量產與迭代能力,突破了一個又一個,每次突破之后,我們不再是追隨者,而是讓等曾經打壓我們的西方國家,再也無法追趕我們的步伐。
![]()
我說到這里后,是不是有人會反駁說,外國封鎖我們之后,也有可能讓我們失去生存壓力,然后就擺爛了。
是的,我也想過這個問題,但這有個條件,便是我們內部已經有了一個撼動不了的龍頭才行。最典型的例子便是,谷歌還在中國的時候,各家搜索引擎都是在卷誰的服務更好。當谷歌退出后,外部壓力瞬間消失,百度作為當之無愧的龍頭,幾乎不需要再去考慮如何留住用戶,畢竟那幾年用戶也沒得選。于是,百度迅速變成了“賣藥”的網站。
![]()
這就揭示了一個殘酷的現實,外部封鎖消除的很可能是那個那個唯一逼你不斷進步的對標和壓力源。活是活下來了,但活得非常不健康。
那么我們的AI領域,現在產生絕對的龍頭了嗎?并沒有!現在正是群雄并起的春秋戰國時代,誰都有機會成為老大,但誰都沒有絕對的統治能力。這個時候大家要做的就是“百家爭鳴”,有人高喊AI得“開源”、有人說得“閉源”、還有人認為得發展“通用人工智能”、也有人說“要發展專用AI”等等。
這些誰對誰錯,并不重要,重要的是大家都在往前探索、發展,假以時日一定會出現AI領域的商鞅、秦皇漢武、唐宗宋祖……
![]()
同時,中國雖然從0到1的本領或許欠缺,但放眼全球,沒有任何一個國家,能比得上我們從1到100的迭代能力。只要有基礎技術作為起點,我們就能快速趕超、全面普及,快速拉平差距。
![]()
反過來再看那些沒有被封鎖、可以免費無門檻使用海外成熟產品的領域,反而徹底失去了自研的動力,長期陷入技術依賴。
就比如電腦操作系統,美國的Windows系統,從來沒有對中國進行限制,人人都可以隨便安裝、隨便使用。長期的便利依賴,直接導致國產系統發展艱難。麒麟系統、統信系統、深度系統,只能依靠政企單位勉強維持,普通民眾、民營企業幾乎不會使用,市場占比極低,已經低到,6年前,我鐵了心去支持國產統信UOS系統,最終還是放棄了。
當時我用另一臺電腦開網店,心說你不就是不支持電腦安裝接收消息的客戶端嗎?我明知道沒有客戶端,不回買家消息,別人就不下單了,我都忍了,畢竟也有不問就買的,跑單的那些,就當是我為國產系統做貢獻了。
結果到了2022年之后,這系統就不聲不響的停更了,在這種情況下,我硬挺著用到2025年。
結果進入2025年后,生意出奇的難做,還被羊毛黨瘋狂僅退款。這樣,我又屢次像官方反饋,能不能支持一下國產系統?每次都沒有任何效果。
我又等了一年,到了今年元旦,我退了一步,換了他們子公司的深度系統,還是國產的。畢竟他們說,支持兼容windows軟件。
結果它們所謂的兼容,實在是太卡了,壓根就不能用。我又忍了一一個多月,到了春節。實在是扛不住了,土都吃不起了,沒辦法,只能換回windows系統,好歹能安客戶端,不至于頻繁跑單。
![]()
還有Adobe系列設計軟件,常年對國內開放使用,沒有任何封鎖限制。國內所有設計師、設計行業長期依賴國外軟件,一旦未來遭遇斷供、版權限制,整個行業都會直接被卡脖子。
![]()
兩種發展現狀對比,道理顯而易見:容易得到的外來技術,只會讓人懶惰、依賴;無路可走的封鎖打壓,才會逼出真正的核心技術與民族潛力。
但我們也必須清醒地看到,即使AI領域真的從春秋戰國,走向了大一統,那我們一定會迎來大清:各家瘋狂內卷,比拼的目的,只為成為唯一的龍頭。
我們已經在微信、美團、滴滴、攜程身上見證過完整的周期——群雄逐鹿、燒錢血拼、寡頭浮現、開始擺爛。
![]()
而到那時,今天被爭搶的用戶,就可能變成被收割的流量;今天日新月異的AI應用,就可能變成坐地起價的超級收費平臺,我們將坐等終結AI的“辛亥革命”。
![]()
但那都是后話,眼前來說,不管我們如何變化,對美國等西方國家來說,一定是對他們不利的,甚至每一次他們對我們的封鎖,最終反噬的都是自己。他們明明看清過無數次歷史結果,為什么不長教訓?
他們的行事邏輯,就和網絡爽文、短劇里面那些鼠目寸光的無腦反派一模一樣,只看眼前利益,完全無視時代大勢和長遠未來?他們都是草臺班子不成?
![]()
其實,根本原因,就是制度的本質不同:西方資本主義國家,政客的核心服務對象,從來不是國家,更不會是老百姓,而是掌控經濟的資本財團。
美國總統任期只最多八年,對于他們來說,這只是一份打工的工作,是依靠金主的扶持上來的,而資本既然會選他,說明他們的關系絕對非同一般,而他要做的便是回饋資本,便是回饋自己。
他們心里很清楚,現在的封鎖和對抗,未來一定會反噬自己的國家,屬于自廢武功。但可以在任期結束直接下臺,爛攤子留給下一屆。
![]()
而我們國家,所有發展規劃、戰略布局,都是立足于全體人民的長遠利益、世代發展。領導班子會更替,但是人民不會變,國家長久發展的目標不會變。
我們絕不會為了眼前的一時便利,犧牲子孫后代的未來。哪怕核心技術研發投入大、周期長、見效慢,只要關乎國家安全、產業自主,就會一代又一代接力,持之以恒的做下去。
![]()
結合這次AI生圖的實測體驗,以及國產大模型的更新速度,我對國產AI的未來充滿十足信心。
我覺得只需要兩三個月的時間,國產模型就能與GPT-2.0的表現能力持平;最遲不會超過半年,基本就能實現反超。而到那個時候,GPT的下一個版本又出來了,我們會發現仍然有差距,但差距在逐漸的縮小。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.