網易首頁 > 網易號 > 正文申請入駐

中美大模型“登月路”：谷歌與月之暗面的這一年

2025-12-05 18:12:05　來源: 光錐智能

北京舉報

分享至

文｜魏琳華

編｜王一粟

兩年前，面對OpenAI的突襲，節節敗退的谷歌內部拉響了“紅色警報”。

為了應對這場可能動搖到谷歌根本業務——搜索的危機，谷歌作出了一個重大決定：2023年4月，谷歌將兩個頂尖實驗室Google Brain和DeepMind的成員抽調出來，組建新團隊Google DeepMind。

新誕生的超級團隊，將他們的賭注押在一個名為“Gemini”的項目上。

谷歌的命名有兩重意義，它的直譯為“雙子座”，象征著谷歌內部兩大頂級技術力量的合體。而在航天史上，Gemini也有著極為重要的意義——它是NASA著名登月計劃之一“阿波羅計劃”的關鍵鋪墊。

“我立刻被這個名字吸引，因為訓練大型語言模型的巨大努力與發射火箭的精神產生了某種深刻的共鳴。”談到命名由來，DeepMind副總裁、Gemini聯合技術負責人Oriol Vinyals說。

然而，現實的引力比火箭的推力更沉重。

Gemini計劃剛成形時，是谷歌被質疑最猛烈的日子。被對手OpenAI卡點發布新模型，屢屢被后者搶走風頭、Gemini 1.0的演示視頻翻車、新模型性能優勢不及對手。樁樁件件，讓谷歌難以擺脫外界質疑的聲音。

但科技行業的魅力在于，只要真的向技術投入，就總會有翻身的那一天。

兩年后的今天，當Gemini 3橫空出世，多項指標超過GPT-5.1，谷歌終于揚眉吐氣。

最近，谷歌被曝出正在探索一項名為“moonshot”的登月計劃，即在太空中建造人工智能數據中心，打造一系列配備谷歌人工智能芯片的太陽能衛星，這也是該公司為追趕 OpenAI 和其他競爭對手而采取的最新舉措。

谷歌首席執行官桑達爾·皮查伊也在采訪中表示，為登月計劃感到自豪。

AI 2.0時代的落地狂奔中，谷歌的故事是這一代AI公司的最佳縮影。不同于AI 1.0時代技術快速觸及天花板，導致后期的比拼淪為卷落地、卷資金的規模戰；AI 2.0時代的公司們，至今面對的頭號任務依然是卷技術。

中美模型的競爭中，來自中國的月之暗面（Moonshot AI）很早也提出過自己的“登月計劃”，如同楊植麟對公司的命名期待，深耕技術，注重“月球背面的探索”。

11月30日，美國NBC News報道，隨著中國開源生態的崛起，以Kimi K2 Thinking模型為代表的中國頂尖模型，性能接近美國最優秀的水平。

這背后，是沉寂半年、卷土重來的月之暗面，也靠“登月計劃”打的一場翻身仗。

今年下半年，月之暗面先后拿出了兩個奠定地位的模型Kimi K2和Kimi K2 Thinking。前者作為非思考模型，在多個測試中拿到開源模型的SOTA；后者不僅能力大幅升級，還成為著名AI搜索Perplexity目前唯一接入的國產模型，同時被官宣的，正是剛剛屠榜的Gemini3 Pro。而上一個有此待遇的中國模型，是風光無限的DeepSeekR1。

在2025年交匯的兩條“登月路線”，再度強調了技術紅利對一家公司的重要性。

沒有永久的王座，AI賽道頻繁上演“逆襲”

科技商業史的宏大敘事中，從來沒有永久的王座。

在“一天一變”的AI賽道，技術的迭代速度以周甚至以天為單位計算，“逆襲”和“被逆襲”的戲碼幾乎每天都在上演。

細數三年，我們經歷了多個靠技術翻盤的時刻：OpenAI靠ChatGPT超越一眾科技大廠、月之暗面憑借長文本捧紅AI助手Kimi、再是Claude系列模型反殺OpenAI，靠編程一騎絕塵、DeepSeek出圈、以Kimi K2為代表的國產模型在海外走紅，最近的Gemini系列翻盤。

舊王推翻新王的故事，正在OpenAI和谷歌的身上輪回。

據外媒The Information報道，本周，OpenAI CEO Sam Altman拉響紅色警報。讓這家AI獨角獸警戒的對象，正是三年前對其同樣啟動紅色警報的谷歌。

對于谷歌來說，2023到2024年是其最脆弱的時期。發布會上的事實性錯誤曾讓市值一夜蒸發千億；Gemini早期的演示視頻被指責夸大宣傳；每一次試圖反擊，似乎都會被OpenAI更驚艷的產品搶走風頭。

復盤兩年來的努力，Google CEOSundar Pichai一再強調全棧能力的重要性。

“在這個過程中，我們大幅加大了基礎設施投資——數據中心、TPU、GPU 等等。接下來，就是如何確保我們能把 Gemini 整合進所有的產品里。”Pichai說，“你把框架拉遠一點看，就會覺得極度振奮。因為當你采用全棧方法論時，每一層的創新會沿著整條鏈路向上傳遞。”

谷歌正式吹響反擊的號角，始于2025年3月。

彼時，OpenAI慣用一種套路針對谷歌，即卡中其新模型的發布時間，提前一天發布自家產品。而這一次，谷歌“以其人之道還治其人之身”，把Gemini 2.5 Pro的發布提前到OpenAI產品發布的前一天。Gemini 2.5 Pro也不負眾望，在多項指標上超過O3-mini，站上了最強模型的競技場。

隨后，谷歌如同打開了軍火庫，陸續掏出了驚艷業界的原生多模態模型VEO 3、圖片編輯模型Nano Banana，一系列超越同期競品表現的產品接踵而至。

最終， Gemini 3 成為那個引爆 OpenAI 的關鍵產品。從測試結果來看，這個新模型實現了對 GPT-5.1 的全面超越，在數學競賽、推理、多模態等能力上超越了 Claude Sonnet 4.5 和 GPT-5.1 。

無獨有偶，這種劇情，也在月之暗面身上發生。

半年前，這家公司還處在輿論的風暴眼中。盡管Kimi曾憑借長文本脫穎而出，但隨著DeepSeek橫空出世的推理模型R1靠技術破圈，一個問題降臨在所有AI創業公司身上——“為什么xx沒有成為DeepSeek？”

在此之后，月之暗面沉寂了半年時間。

看到DeepSeek后，月之暗面創始人楊植麟在內部會議上給出了相當激進的決策：不再更新 K1系列模型，將公司核心資源押注算法和下一代模型K2的研發上。

對比谷歌，作為國內AI創企，月之暗面的處境相當嚴苛。沒有數十年的數據積累，也沒有可以和國內外巨頭抗衡的資源，和海外AI創企動輒千億美元的估值相比，月之暗面目前估值還不到40億美元，這不僅是月之暗面一家的問題，更是國內大模型創業公司的共同困境。

利用有限的資源，月之暗面在半年后，也打了一個翻身仗。

先是今年7月Kimi K2模型發布，它是當時開源模型中少數能達到萬億參數的大模型，作為非思考模型，它在多項指標上拿下開源模型梯隊的SOTA。

上個月，Kimi K2 Thinking模型正式上線時，在HLE、推理、Agent等維度上超越閉源模型GPT-5和Claude Sonnet 4.5，重新回到全球開源模型的榜首。

“這是另一個DeepSeek時刻嗎？”Kimi K2 Thinking模型發布后，Hugging Face 聯合創始人Thomas Wolf在X上這樣評價。

模型背后，也看到月之暗面在基礎技術上的追求。

比如全球首次在萬億級別的模型預訓練中采用二階優化器 Muon，官方表示，Kimi K2提升了訓練穩定性和Token使用效率，在完成15.5T token平穩訓練的同時，全程無Loss Spike（損失激增）；推出下一代 Kimi Delta Attention 架構，通過混合線性注意力機制幫助提升模型的推理效果的同時，還能降低幾倍的推理成本。

“你可能會認為我們選擇Muon只是運氣好，但是選擇的背后是，有幾十個優化器和架構沒有通過考驗。”在月之暗面發起的AMA（Ask Me Everything）活動上，團隊給出了這樣的回答。

谷歌和月之暗面，也只是AI進化的縮影。如今，AI行業遠遠未到逆襲的終點。

“當前環境是史上最激烈的競爭，唯一真正重要的是進步速度。”DeepMind CEO Demis Hassabis說。

AI 2.0時代，技術紅利依然是關鍵

“逆襲”還是“被逆襲”，AI 2.0時代，大模型公司們的“長跑考試”還在繼續，技術依然是引領企業的引擎。

這與上一輪AI浪潮有著本質的區別。回望2016年，當AlphaGo點燃AI 1.0時代時，技術泛化問題難以解決的情況下，行業快速觸摸到了天花板。

以計算機視覺（CV）來說，當時業內面對的問題更加棘手，比如性能非常依賴大規模標注數據、技術泛化性差、實時處理的延遲問題等等。在技術瓶頸的情況下，拼資源、拼生態成了創業公司競爭的關鍵。

但AI 2.0時代完全不同。在生成式AI時代行業距離天花板尚且遙遠，整個領域還有大量未解的問題。

在大語言模型領域，Scaling Law（規模定律）的放緩問題沒有得到有效解決；再看多模態大模型，包括自回歸和離散兩條技術路線還在探索中，沒有確切的答案；視頻生成的時長、一致性、物理規律的學習，還有提升空間；Agent的落地，更是卡在模型泛化能力的瓶頸上。

在這個階段，如果一家公司過早放棄作為基座的模型能力提升。“地基”不穩的情況下，很容易被后起之秀彎道超車。

2025年，回歸技術更是成為AI行業的關鍵詞。

可以看到，無論是大廠還是小廠，都在招兵買馬，集中資源攻克模型SOTA。

不僅僅是谷歌和月之暗面，最近，國內包括字節跳動、百度等大廠都在進行組織架構調整，核心邏輯是提升大模型研發的優先級。

上月末，百度TPG組織架構大調整，文心業務拆分為基礎模型和應用模型部門，負責人直接向百度CEO李彥宏匯報；今年4月，字節AI Lab整體并入Seed團隊，整合AI研發力量。

對技術的投入，永遠是留在第一梯隊的關鍵砝碼。谷歌的路徑已經給出了最好的示范。在Gemini 2.5 Pro的逆襲之后，同樣隸屬于Gemini家族的圖像編輯模型Nano Banana（Gemini 2.5 Flash）也快速走紅。可以說，沒有強大的、通用的Gemini基座在語言和視覺理解上的突破，谷歌難以在短時間內拿出一個同樣具備競爭力的圖像模型。

當基礎模型的研發取得突破，在這個基座上，公司們能夠靠“舉一反三”，在更多領域拿下優勢。

此前，月之暗面團隊在海外社交媒體上做AMA分享時，雖然沒有具體預告K3模型的發布時間，但表示該模型有望用上他們研發的KDA（Kernel-Attention Dual Architecture）架構。有接近月之暗面的人士對光錐智能表示，萬億參數可以為后續的推理模型打下扎實地基，K2的多模態已經在路上。

無論規模、體量，包括模型的性能，兩家同樣有著登月追求的公司都存在客觀差距，如同中美競賽中那道逐漸縮小的鴻溝，東西方的技術和開閉源之爭正等待著下一個奇點的降臨

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.