![]()
作者 | 山竹
出品 | 鋅產業(公眾號:xinchanye2021)
經歷了2023年的百模大戰后,2024年,大模型之戰進一步聚焦到了頭部企業。
在上周阿里在北京的大模型主題發布會上,就有阿里云高管在現場指出,截至目前,有競爭力的基礎通用大模型已經收斂到了10個以內。
兩只手就數得過來的對手意味著,那些在資源和技術上占據優勢的頭部玩家,就可以根據對手動態做出針對性策略,今年年初OpenAI對谷歌的精準狙擊就是一個很好的例子。
2024年2月15日,谷歌對外重磅發布了多模態大模型Gemini 1.5 Pro,官方測試結果顯示,這個最高支持100萬tokens的多模態大模型,性能遠超GPT-4 Turbo。
然而,就在同一天,OpenAI發布了文生視頻大模型Sora。
Sora的發布讓全網關注度再次聚焦到了OpenAI這一文生視頻產品上,搶走了本應屬于谷歌的高光時刻,也讓谷歌Gemini 1.5 Pro在大模型發展歷史上的意義再次被低估。
作為本應是大模型領域絕對領導者的谷歌,在召開2024年谷歌I/O大會前夕,全球大模型市場再次暗潮涌動。
阿里云發布通義千問2.5、零一萬物發布千億參數大模型……,更重要的是,OpenAI也再次有了新動作。
01GPT-4o緩解Altman的焦慮
作為硅谷技術團隊創業中為數不多的“商人”CEO,Altman能夠掌舵OpenAI靠的不是技術有多牛或是解決工程化問題的能力有多強,而是他的商業頭腦,因而一直被認為是一位營銷大師。
甚至有業內人士猜測,在OpenAI內部,最終拍板決定一個產品何時發布的,不是技術團隊或產品團隊,而是公關團隊。
無論這樣的猜測準確與否,我們能夠看到的是,在Altman的推動下,OpenAI的ChatGPT、GPT-4、GPTs、Sora等產品的發布,最終都在全球范圍內形成了廣泛的關注。
尤其是在今年年初(北京時間2月16日),已經在生成式AI領域占據絕對優勢的OpenAI,在谷歌多模態大模型Gemini 1.5 Pro發布僅兩個小時后,就對外發布了文生視頻模型Sora,這波操作直接“截獲”了本應屬于谷歌的潑天流量。
![]()
被官方稱作“世界模擬器”的Sora發布有多炸裂?
在Sora發布那兩周里,幾乎所有人都在談論Sora,華大集團CEO尹燁就曾在一篇署名文章中曾引經據典地論證了Sora將人工智能技術提升到了一個更高維度。
不過,對于OpenAI而言,Sora最直接的作用是狙擊了谷歌的Gemini 1.5 Pro,以及隨后發布的Claude 3,這讓OpenAI至今依舊站在AI之巔。
![]()
為什么OpenAI必須是行業第一?
原因在于,生成式AI本質上是靠大算力、大數據、大模型,通過量變實現的質變,在早期商業模式中,OpenAI玩的還是互聯網那套:
通過高增長的用戶量不斷拿到大額融資進行技術研發,再通過快速迭代的技術改善產品體驗來獲得更多用戶、保持業務增長。
作為已經在收斂的基礎大模型領域,已經是行業第一的OpenAI要想繼續拿到巨額融資和高估值,就需要保持自己老大的行業地位,既需要保證用戶量的高增長,也需要保證持續的行業關注度,以換取增長空間。
這是Sora在今年2月面世的一個主要原因,也是這次,在谷歌I/O大會前一天,OpenAI再次放出GPT-4o這個超級大招的一個重要原因。
什么是GPT-4o?
官網給出的解釋是,GPT-4o是一個可以實時對音頻、視覺和文本進行實時推理的(多模態)模型,是邁向更自然的人機交互的一步。
![]()
實際上,早在去年9月,OpenAI就為ChatGPT加入了語音對話和圖像識別功能,前者讓ChatGPT真正成為了手機上的一個對話式APP,后者則讓用戶可以上傳圖片作為輸入數據,并基于圖片進行交互。
然而,在此之前,手機版ChatGPT在與人類交互時有兩個影響用戶體驗的問題:
首先是需要較長的等待時間,ChatGPT需要較長的時間才能給出答案,彼時ChatGPT給出的答案可能已經很不錯了,但交互體驗并不好;
其次是交互模式更多是問答模式,沒有做到自然交互。
GPT-4o解決了這些問題,不僅將延時控制在了320毫秒內(幾乎感覺不到延時),還實現了隨時可打斷的自然交互,甚至能聽懂、看懂人的情緒。
這是語音交互方面帶來的能力,圖像識別方面,這次更是直接從圖像識別和分析升級到了實時視頻解讀和分析,這樣的能力除了為發布會上展示的手機端識別真實世界場景的玩法外,鋅產業認為,更重要的是帶來了兩個變化:
第一,結合文生視頻的Sora,或將帶來真正意義上的“世界模擬器”;
第二,結合人形機器人,將為具身智能帶來一次基礎能力提升。
![]()
而這樣的GPT-4o和此前ChatGPT Plus會員版所有能力,將對所有用戶免費開放使用。
這無疑將為OpenAI帶來新一波用戶增長,也將緩解Altman的用戶增長焦慮。
02搜索引擎,未盡的戰役
在OpenAI正式公布GPT-4升級消息之前,行業中還有一個更重磅的猜測——OpenAI這次會推出SearchGPT來狙擊谷歌。
這一消息一經媒體發布,全球嘩然。
要知道,搜索引擎依然是當下互聯網最主要的基礎設施,作為全球最值錢的公司之一(市值排全球第三),谷歌每年千億美元營收中,超一半來自于搜索引擎廣告。
如果OpenAI瞄準搜索引擎,會不會危及谷歌在搜索引擎領域的江湖地位?
畢竟,網上路透社等權威媒體援引知情人士的消息報道有鼻子有眼,網上甚至還傳出了OpenAI的AI搜索引擎測試界面。
![]()
剛剛過去的那一周,谷歌決策層必然也在焦急地等待著這一消息的官方回應或是產品發布。
后經OpenAI和Altman在Twitter上親自出面澄清:不是GPT-5,也不是搜索引擎,而是ChatGPT和GPT-4的更新。
![]()
有業內人士稱,這是Altman的策略——博取流量為自己產品更新造勢的手段。
實際上,想要直接從搜索引擎上顛覆谷歌,即便是OpenAI,也幾乎是一個不可能完成的任務。
上一個想要借AI狙擊谷歌搜索引擎的,是給OpenAI投了百億美元的微軟。
谷歌一直都是全球搜索引擎領域堪稱壟斷者的存在,即便大多數中國人習慣用百度,但就全球搜索引擎市場份額來看,谷歌占比仍超90%,千年老二的微軟Bing只占據了不到3%的市場份額。
2022年年底,ChatGPT的出現讓微軟嗅到了機會。
作為OpenAI商業化后早期投資者,微軟在2023年初緊急向OpenAI追加了100億美元的投資,成了OpenAI最大的股東。
成為OpenAI最大股東的一個好處是,微軟獲得了OpenAI人工智能產品的優先訪問權。也是基于此,微軟引入ChatGPT的搜索引擎AI Bing在2023年2月8日正式對外發布。
![]()
對于AI Bing,微軟內部極為看重,微軟CEO薩蒂亞·納德拉當時在接受外媒采訪時聲稱,“在AI技術的推動下,微軟的Bing搜索引擎和Edge瀏覽器將有能力挑戰谷歌的領導地位。”
對于這一新生事物,谷歌確實也被嚇到了,就在微軟發布AI Bing前一天,谷歌緊急對外發布了自己的生成式AI聊天機器人Bard,彼時還因上線倉促、體驗糟糕,Bard在互聯網上經歷了一波“差評”。
這是新舊兩代技術在搜索引擎上第一次真正的較量。
然而,從結果來看,事情并沒有向著納德拉想象的方向發展:
Statcounter統計數據顯示,截至今年2月,谷歌全球搜索引擎市場份額為91.6%,同比僅下降了1.75%,微軟Bing市場份額為3.3%,增長了不到1%。
Bing并沒能因為AI起飛,谷歌依舊是搜索引擎市場的霸主。
03谷歌、蘋果必有一戰
和所有新興技術剛出現時一樣,當下大模型的創業者總被問及一個問題:大模型的殺手級應用是什么?
同樣和所有新興技術剛出現時一樣,沒有人能給出一個肯定的答案。
在此之前,我們在消費端看到了AI PC、AI手機這些“舊產品”的升級,也看到了AI PinRabbit R1等“新”硬件的出現,鋅產業對這些產品也出過一些分析文章,目前來看,這些產品依舊沒有跳出現有應用體驗范疇;
在商業市場,我們看到了具身智能、數字員工、虛擬專家等概念的熱議,但這些概念也都還是線性變化,難以形成商業上的階躍體驗。
在和一些互聯網行業從業者聊天過程中,鋅產業發現,不少從業者認為,生成式AI影響的是互聯網的根技術,甚至可以說生成式AI本身就是下一個時代的根技術,帶來的是一次真正的全產業智能化。
以搜索模式為例,AI搜索的工作原理將變為:先搜索,再總結,最后通過智能體進行結果優化。
這樣的AI搜索模式除了會將內容更簡單地呈現給用戶——從「內容排序」到「直給」外,由此帶來的搜索習慣潛移默化的改變,也將使得端側AI變得更重要。
或許也是因為察覺到了端側AI的重要性,也或許是為了與蘋果在大模型上的合作鋪路,OpenAI此次GPT-4o的發布主要也是基于手機進行的演示。
![]()
實際上,此前彭博社就曾援引知情人士消息稱,蘋果正在與谷歌、OpenAI洽談在大模型上進行合作。
在2023年百模大戰中,并沒有蘋果的身影,喜歡做后來者的蘋果,直到今年被曝出解散造車團隊、轉投生成式AI后,蘋果才逐漸放出自己在生成式AI上的相關消息:
先是收購了AI創業公司DarwinAI,又發布了多模態大模型MM1(論文),而蘋果大模型與Siri的結合應用消息也緊隨其后。
![]()
蘋果官方關于生成式AI的技術發布,預計會是今年WWDC的重點,在此之前,OpenAI與谷歌的大模型之爭,也從基礎通用大模型賽場燃燒到了端側AI。
值得注意的是,為了成為蘋果系產品上的默認搜索引擎,谷歌每年都要向蘋果支付百億美元(2022年是200億美元)的合作費用。
而在AI語音助手經過這一波升級后,在接下來從「內容排序」到「內容直給」的搜索習慣轉變下,AI語音助手是否會代替傳統搜索引擎,成為沒有鍵盤的終端產品真正意義上的搜索引擎?
倘若如此,接下來,谷歌在搜索引擎上的對手或將不再是微軟,而是正在悄悄訓練Siri的蘋果。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.