![]()
文|魏琳華
編|王一粟
兩年前,面對(duì)OpenAI的突襲,節(jié)節(jié)敗退的谷歌內(nèi)部拉響了“紅色警報(bào)”。
為了應(yīng)對(duì)這場(chǎng)可能動(dòng)搖到谷歌根本業(yè)務(wù)——搜索的危機(jī),谷歌作出了一個(gè)重大決定:2023年4月,谷歌將兩個(gè)頂尖實(shí)驗(yàn)室Google Brain和DeepMind的成員抽調(diào)出來,組建新團(tuán)隊(duì)Google DeepMind。
新誕生的超級(jí)團(tuán)隊(duì),將他們的賭注押在一個(gè)名為“Gemini”的項(xiàng)目上。
谷歌的命名有兩重意義,它的直譯為“雙子座”,象征著谷歌內(nèi)部?jī)纱箜敿?jí)技術(shù)力量的合體。而在航天史上,Gemini也有著極為重要的意義——它是NASA著名登月計(jì)劃之一“阿波羅計(jì)劃”的關(guān)鍵鋪墊。
“我立刻被這個(gè)名字吸引,因?yàn)橛?xùn)練大型語言模型的巨大努力與發(fā)射火箭的精神產(chǎn)生了某種深刻的共鳴。”談到命名由來,DeepMind副總裁、Gemini聯(lián)合技術(shù)負(fù)責(zé)人Oriol Vinyals說。
然而,現(xiàn)實(shí)的引力比火箭的推力更沉重。
Gemini計(jì)劃剛成形時(shí),是谷歌被質(zhì)疑最猛烈的日子。被對(duì)手OpenAI卡點(diǎn)發(fā)布新模型,屢屢被后者搶走風(fēng)頭、Gemini 1.0的演示視頻翻車、新模型性能優(yōu)勢(shì)不及對(duì)手。樁樁件件,讓谷歌難以擺脫外界質(zhì)疑的聲音。
但科技行業(yè)的魅力在于,只要真的向技術(shù)投入,就總會(huì)有翻身的那一天。
兩年后的今天,當(dāng)Gemini 3橫空出世,多項(xiàng)指標(biāo)超過GPT-5.1,谷歌終于揚(yáng)眉吐氣。
最近,谷歌被曝出正在探索一項(xiàng)名為“moonshot”的登月計(jì)劃,即在太空中建造人工智能數(shù)據(jù)中心,打造一系列配備谷歌人工智能芯片的太陽能衛(wèi)星,這也是該公司為追趕 OpenAI 和其他競(jìng)爭(zhēng)對(duì)手而采取的最新舉措。
谷歌首席執(zhí)行官桑達(dá)爾·皮查伊也在采訪中表示,為登月計(jì)劃感到自豪。
![]()
AI 2.0時(shí)代的落地狂奔中,谷歌的故事是這一代AI公司的最佳縮影。不同于AI 1.0時(shí)代技術(shù)快速觸及天花板,導(dǎo)致后期的比拼淪為卷落地、卷資金的規(guī)模戰(zhàn);AI 2.0時(shí)代的公司們,至今面對(duì)的頭號(hào)任務(wù)依然是卷技術(shù)。
中美模型的競(jìng)爭(zhēng)中,來自中國(guó)的月之暗面(Moonshot AI)很早也提出過自己的“登月計(jì)劃”,如同楊植麟對(duì)公司的命名期待,深耕技術(shù),注重“月球背面的探索”。
11月30日,美國(guó)NBC News報(bào)道,隨著中國(guó)開源生態(tài)的崛起,以Kimi K2 Thinking模型為代表的中國(guó)頂尖模型,性能接近美國(guó)最優(yōu)秀的水平。
![]()
這背后,是沉寂半年、卷土重來的月之暗面,也靠“登月計(jì)劃”打的一場(chǎng)翻身仗。
今年下半年,月之暗面先后拿出了兩個(gè)奠定地位的模型Kimi K2和Kimi K2 Thinking。前者作為非思考模型,在多個(gè)測(cè)試中拿到開源模型的SOTA;后者不僅能力大幅升級(jí),還成為著名AI搜索Perplexity目前唯一接入的國(guó)產(chǎn)模型,同時(shí)被官宣的,正是剛剛屠榜的Gemini3 Pro。而上一個(gè)有此待遇的中國(guó)模型,是風(fēng)光無限的DeepSeekR1。
![]()
在2025年交匯的兩條“登月路線”,再度強(qiáng)調(diào)了技術(shù)紅利對(duì)一家公司的重要性。
沒有永久的王座,AI賽道頻繁上演“逆襲”
科技商業(yè)史的宏大敘事中,從來沒有永久的王座。
在“一天一變”的AI賽道,技術(shù)的迭代速度以周甚至以天為單位計(jì)算,“逆襲”和“被逆襲”的戲碼幾乎每天都在上演。
細(xì)數(shù)三年,我們經(jīng)歷了多個(gè)靠技術(shù)翻盤的時(shí)刻:OpenAI靠ChatGPT超越一眾科技大廠、月之暗面憑借長(zhǎng)文本捧紅AI助手Kimi、再是Claude系列模型反殺OpenAI,靠編程一騎絕塵、DeepSeek出圈、以Kimi K2為代表的國(guó)產(chǎn)模型在海外走紅,最近的Gemini系列翻盤。
舊王推翻新王的故事,正在OpenAI和谷歌的身上輪回。
據(jù)外媒The Information報(bào)道,本周,OpenAI CEO Sam Altman拉響紅色警報(bào)。讓這家AI獨(dú)角獸警戒的對(duì)象,正是三年前對(duì)其同樣啟動(dòng)紅色警報(bào)的谷歌。
對(duì)于谷歌來說,2023到2024年是其最脆弱的時(shí)期。發(fā)布會(huì)上的事實(shí)性錯(cuò)誤曾讓市值一夜蒸發(fā)千億;Gemini早期的演示視頻被指責(zé)夸大宣傳;每一次試圖反擊,似乎都會(huì)被OpenAI更驚艷的產(chǎn)品搶走風(fēng)頭。
復(fù)盤兩年來的努力,Google CEOSundar Pichai一再強(qiáng)調(diào)全棧能力的重要性。
“在這個(gè)過程中,我們大幅加大了基礎(chǔ)設(shè)施投資——數(shù)據(jù)中心、TPU、GPU 等等。接下來,就是如何確保我們能把 Gemini 整合進(jìn)所有的產(chǎn)品里。”Pichai說,“你把框架拉遠(yuǎn)一點(diǎn)看,就會(huì)覺得極度振奮。因?yàn)楫?dāng)你采用全棧方法論時(shí),每一層的創(chuàng)新會(huì)沿著整條鏈路向上傳遞。”
谷歌正式吹響反擊的號(hào)角,始于2025年3月。
彼時(shí),OpenAI慣用一種套路針對(duì)谷歌,即卡中其新模型的發(fā)布時(shí)間,提前一天發(fā)布自家產(chǎn)品。而這一次,谷歌“以其人之道還治其人之身”,把Gemini 2.5 Pro的發(fā)布提前到OpenAI產(chǎn)品發(fā)布的前一天。Gemini 2.5 Pro也不負(fù)眾望,在多項(xiàng)指標(biāo)上超過O3-mini,站上了最強(qiáng)模型的競(jìng)技場(chǎng)。
![]()
隨后,谷歌如同打開了軍火庫,陸續(xù)掏出了驚艷業(yè)界的原生多模態(tài)模型VEO 3、圖片編輯模型Nano Banana,一系列超越同期競(jìng)品表現(xiàn)的產(chǎn)品接踵而至。
最終, Gemini 3 成為那個(gè)引爆 OpenAI 的關(guān)鍵產(chǎn)品。從測(cè)試結(jié)果來看,這個(gè)新模型實(shí)現(xiàn)了對(duì) GPT-5.1 的全面超越,在數(shù)學(xué)競(jìng)賽、推理、多模態(tài)等能力上超越了 Claude Sonnet 4.5 和 GPT-5.1 。
![]()
無獨(dú)有偶,這種劇情,也在月之暗面身上發(fā)生。
半年前,這家公司還處在輿論的風(fēng)暴眼中。盡管Kimi曾憑借長(zhǎng)文本脫穎而出,但隨著DeepSeek橫空出世的推理模型R1靠技術(shù)破圈,一個(gè)問題降臨在所有AI創(chuàng)業(yè)公司身上——“為什么xx沒有成為DeepSeek?”
在此之后,月之暗面沉寂了半年時(shí)間。
看到DeepSeek后,月之暗面創(chuàng)始人楊植麟在內(nèi)部會(huì)議上給出了相當(dāng)激進(jìn)的決策:不再更新 K1系列模型,將公司核心資源押注算法和下一代模型K2的研發(fā)上。
對(duì)比谷歌,作為國(guó)內(nèi)AI創(chuàng)企,月之暗面的處境相當(dāng)嚴(yán)苛。沒有數(shù)十年的數(shù)據(jù)積累,也沒有可以和國(guó)內(nèi)外巨頭抗衡的資源,和海外AI創(chuàng)企動(dòng)輒千億美元的估值相比,月之暗面目前估值還不到40億美元,這不僅是月之暗面一家的問題,更是國(guó)內(nèi)大模型創(chuàng)業(yè)公司的共同困境。
![]()
利用有限的資源,月之暗面在半年后,也打了一個(gè)翻身仗。
先是今年7月Kimi K2模型發(fā)布,它是當(dāng)時(shí)開源模型中少數(shù)能達(dá)到萬億參數(shù)的大模型,作為非思考模型,它在多項(xiàng)指標(biāo)上拿下開源模型梯隊(duì)的SOTA。
上個(gè)月,Kimi K2 Thinking模型正式上線時(shí),在HLE、推理、Agent等維度上超越閉源模型GPT-5和Claude Sonnet 4.5,重新回到全球開源模型的榜首。
![]()
“這是另一個(gè)DeepSeek時(shí)刻嗎?”Kimi K2 Thinking模型發(fā)布后,Hugging Face 聯(lián)合創(chuàng)始人Thomas Wolf在X上這樣評(píng)價(jià)。
模型背后,也看到月之暗面在基礎(chǔ)技術(shù)上的追求。
比如全球首次在萬億級(jí)別的模型預(yù)訓(xùn)練中采用二階優(yōu)化器 Muon,官方表示,Kimi K2提升了訓(xùn)練穩(wěn)定性和Token使用效率,在完成15.5T token平穩(wěn)訓(xùn)練的同時(shí),全程無Loss Spike(損失激增);推出下一代 Kimi Delta Attention 架構(gòu),通過混合線性注意力機(jī)制幫助提升模型的推理效果的同時(shí),還能降低幾倍的推理成本。
“你可能會(huì)認(rèn)為我們選擇Muon只是運(yùn)氣好,但是選擇的背后是,有幾十個(gè)優(yōu)化器和架構(gòu)沒有通過考驗(yàn)。”在月之暗面發(fā)起的AMA(Ask Me Everything)活動(dòng)上,團(tuán)隊(duì)給出了這樣的回答。
谷歌和月之暗面,也只是AI進(jìn)化的縮影。如今,AI行業(yè)遠(yuǎn)遠(yuǎn)未到逆襲的終點(diǎn)。
“當(dāng)前環(huán)境是史上最激烈的競(jìng)爭(zhēng),唯一真正重要的是進(jìn)步速度。”DeepMind CEO Demis Hassabis說。
AI 2.0時(shí)代,技術(shù)紅利依然是關(guān)鍵
“逆襲”還是“被逆襲”,AI 2.0時(shí)代,大模型公司們的“長(zhǎng)跑考試”還在繼續(xù),技術(shù)依然是引領(lǐng)企業(yè)的引擎。
這與上一輪AI浪潮有著本質(zhì)的區(qū)別。回望2016年,當(dāng)AlphaGo點(diǎn)燃AI 1.0時(shí)代時(shí),技術(shù)泛化問題難以解決的情況下,行業(yè)快速觸摸到了天花板。
以計(jì)算機(jī)視覺(CV)來說,當(dāng)時(shí)業(yè)內(nèi)面對(duì)的問題更加棘手,比如性能非常依賴大規(guī)模標(biāo)注數(shù)據(jù)、技術(shù)泛化性差、實(shí)時(shí)處理的延遲問題等等。在技術(shù)瓶頸的情況下,拼資源、拼生態(tài)成了創(chuàng)業(yè)公司競(jìng)爭(zhēng)的關(guān)鍵。
但AI 2.0時(shí)代完全不同。在生成式AI時(shí)代行業(yè)距離天花板尚且遙遠(yuǎn),整個(gè)領(lǐng)域還有大量未解的問題。
在大語言模型領(lǐng)域,Scaling Law(規(guī)模定律)的放緩問題沒有得到有效解決;再看多模態(tài)大模型,包括自回歸和離散兩條技術(shù)路線還在探索中,沒有確切的答案;視頻生成的時(shí)長(zhǎng)、一致性、物理規(guī)律的學(xué)習(xí),還有提升空間;Agent的落地,更是卡在模型泛化能力的瓶頸上。
在這個(gè)階段,如果一家公司過早放棄作為基座的模型能力提升。“地基”不穩(wěn)的情況下,很容易被后起之秀彎道超車。
2025年,回歸技術(shù)更是成為AI行業(yè)的關(guān)鍵詞。
可以看到,無論是大廠還是小廠,都在招兵買馬,集中資源攻克模型SOTA。
不僅僅是谷歌和月之暗面,最近,國(guó)內(nèi)包括字節(jié)跳動(dòng)、百度等大廠都在進(jìn)行組織架構(gòu)調(diào)整,核心邏輯是提升大模型研發(fā)的優(yōu)先級(jí)。
上月末,百度TPG組織架構(gòu)大調(diào)整,文心業(yè)務(wù)拆分為基礎(chǔ)模型和應(yīng)用模型部門,負(fù)責(zé)人直接向百度CEO李彥宏匯報(bào);今年4月,字節(jié)AI Lab整體并入Seed團(tuán)隊(duì),整合AI研發(fā)力量。
對(duì)技術(shù)的投入,永遠(yuǎn)是留在第一梯隊(duì)的關(guān)鍵砝碼。谷歌的路徑已經(jīng)給出了最好的示范。在Gemini 2.5 Pro的逆襲之后,同樣隸屬于Gemini家族的圖像編輯模型Nano Banana(Gemini 2.5 Flash)也快速走紅。可以說,沒有強(qiáng)大的、通用的Gemini基座在語言和視覺理解上的突破,谷歌難以在短時(shí)間內(nèi)拿出一個(gè)同樣具備競(jìng)爭(zhēng)力的圖像模型。
當(dāng)基礎(chǔ)模型的研發(fā)取得突破,在這個(gè)基座上,公司們能夠靠“舉一反三”,在更多領(lǐng)域拿下優(yōu)勢(shì)。
此前,月之暗面團(tuán)隊(duì)在海外社交媒體上做AMA分享時(shí),雖然沒有具體預(yù)告K3模型的發(fā)布時(shí)間,但表示該模型有望用上他們研發(fā)的KDA(Kernel-Attention Dual Architecture)架構(gòu)。有接近月之暗面的人士對(duì)光錐智能表示,萬億參數(shù)可以為后續(xù)的推理模型打下扎實(shí)地基,K2的多模態(tài)已經(jīng)在路上。
無論規(guī)模、體量,包括模型的性能,兩家同樣有著登月追求的公司都存在客觀差距,如同中美競(jìng)賽中那道逐漸縮小的鴻溝,東西方的技術(shù)和開閉源之爭(zhēng)正等待著下一個(gè)奇點(diǎn)的降臨
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.