網易首頁 > 網易號 > 正文申請入駐

比國產AI還卷：谷歌Gemma 4以小博大，端側模型迎來分水嶺

2026-04-03 22:11:34　來源: 雷科技

廣東舉報

分享至

發布才幾個小時，Gemma 4 就已經把開發者社區的情緒拉滿了。

北京時間 4 月 3 日凌晨，Google 推出了新一代開源模型 Gemma 4，包括 E2B、E4B、26B（MoE）、31B 「一門四杰」，其中 E2B、E4B 兩個較小模型直接可以在手機、樹莓派等設備上部署運行，26B、31B 兩個較大模型也只需要一張消費級顯卡就能跑起來。

不同于閉源的 Gemini 大模型走的是「力大磚飛」，Google 在 Gemma 開源模型的思路上一直是「小而精」。

但 Gemma 4 給人的第一印象還是有點不按劇本來。參數規模沒有膨脹，結構也談不上顛覆，可是在一系列 benchmark 里，Gemma 4 卻能逼近甚至超越更大一檔規模的模型。26B、31B 版本在 AI 競技場（人工對話打分）已經比肩一眾國產開源模型，甚至超越了 685B 的 DeepSeek V3.2 以及 397B 的 Qwen 3.5。

比國產模型還卷了。

過去在這個戰場上，Qwen 幾乎就是「小而精」模型的代名詞，但 Gemma 4 這次的進步確實太大了。不只是在 AI 競技場這種偏「AI 聊天」的真實場景測試中有驚艷的表現，Gemma 4 還是少有從一開始就面向本地 Agent 工作流設計的模型，也支持多模態。

這么小規模的模型下，Gemma 4 卻做到了超預期的性能和能力，也難怪 AI 研究工程師 Sebastian Raschka 在 X 上說，「Gemma 4 是一個巨大的跨越?！?/strong>

但很多人忽略的一個關鍵，還在于開源協議的切換。這次 Google 終于想通了，放棄了自家糟糕透頂的 Gemma 開源協議，Gemma 4 全系換上了主流的 Apache 2.0 協議，從個人到企業都可以放心商用、再分發。

開源 AI 模型的格局，又要再變一次？

免費、無 API，大模型不大但好用

先從 26B 和 31B 這兩個模型說起。

按照過去兩年的直覺，這個參數規模幾乎不在第一梯隊。開源世界里，動輒就是百億、千億，甚至像 DeepSeek V3.2 這種 600B+ 級別的模型，才有資格談「對標閉源」。但 Gemma 4 的這兩個模型，上來就把這套邏輯打亂了。

26B 和 31B 的表現，不只是「能打」，而是已經開始穩定貼近甚至超過更大體量的模型。Google DeepMind 創始人兼 CEO Demis Hassabis就說得很直白，Gemma 4 就是「同級別（參數規模）最好的開源模型」。

需要一提的是，Gemma 4（26B）采用的是 MoE 架構，總參數 26B，但實際激活規模要小得多。這種設計帶來的直接結果不是紙面參數的好看，而是一個更現實的變化：在很多任務里，它用小模型的成本，打出了接近更大模型的效果。

圖片來源：英偉達

事實上，Gemma 4 的優勢，不在絕對能力，而在「智能密度」，或者說是每個參數的效率最大化。

26B 和 31B 就是最直觀的例子，在實際測試里就能感受到這種密度和效率。在一些開發者的早期測試中，它反而比更大的模型更「好用」，因為它不只是能做，還能穩定、快速地做。

簡言之，能夠承擔更復雜的任務和更好的表現。

Gemma 4 推出后，X 上就有獨立開發者就在 RTX 5090 上本地部署了 31B，不僅能快速完成代碼生成、多模態理解任務，整體表現已經相當可用。至于 Gemma 4（26B），在 Mac mini（M4 16GB）上就能很好地部署運行。

更重要的是，Hacker New 社區還有人指出，測試將 Gemma 4 接進 code-agent harness（30K+ 上下文）的表現很好，明顯快于 Qwen 同級模型。

免費、無需 API。Gemma 4 的 26B 和 31B，并不是最強的開源模型，但已經足夠強，同時又足夠「輕」，甚至可以真正在本地做事，用極低的使用成本在本地處理一系列低復雜度的 Agent 任務。

這也是為什么很多開發者在討論 Gemma 4 時，很少再糾結它和 GPT、Claude 的差距，而是開始討論另一件事，這樣體量的模型，能不能成為本地 Agent 的核心。因為一旦這個問題的答案變成「可以」，那整個開源模型的價值，就不再只是替代 API，而是開始接管一部分真實的工作流。

接下來一段時間，相信這也是 Gemma 4 的重點。

聯手高通、聯發科，小模型引發本地 Agent 浪潮？

但這一代 Gemma 4，不只看 26B、31B，把視角往下拉到 E2B、E4B，會發現 Google 還想更進一步把端側 AI 塞進手機等邊緣設備。

先說一點。這兩個模型不是可以在端側跑，而是從一開始就是為端側設計的。Google 在官方描述里就強調，E2B 和 E4B 的目標是「重新定義端側實用性」，優先考慮的是低延遲、多模態和系統級集成，而不是參數規模。這句話背后其實很明確，它們不是縮小版的大模型，而是另一類產品。

這類產品最關鍵的一點，是把「本地 AI」從概念變成了一個可以落地的工程路徑。E2B 在量化之后可以壓到 1.5GB 以內，在樹莓派 5 上也能跑出可用的推理速度，prefill 可以到 100 tokens/s 以上。意味著一個不依賴云、不走 API 的 AI 系統，開始可以在極其有限的硬件上運行。

手機上就能本地部署，圖片來源：Google

更重要的是，這件事并不是 Google 一家在做。為了讓這兩個模型真的跑起來，Google 這次是把整條硬件鏈路一起拉進來了，從 Pixel 團隊，到高通、聯發科，再到 ARM、NVIDIA，都參與了優化。換句話說，這還是一次面向手機和邊緣設備的系統級協同。

這也解釋了為什么 E2B 和 E4B 的意義，和過去的小模型完全不一樣。以前的小模型，本質是「能力不夠，只能在端側跑」?，F在這兩個模型更像是「能力剛好夠，而且專門為端側優化」。它們不僅支持文本，還原生支持圖像、音頻輸入，甚至可以直接參與多步 Agent 工作流，支持 Skiill。

可以安裝 App 使用，圖片來源：Google

真正的變化在這里開始顯現。過去討論手機上的 AI，大多還停留在「調用云端模型」，本地只負責做一些簡單推理。但 Gemma 4 這一步，相當于是把更完整的 AI 能力，直接搬進手機等設備里，甚至是脫離網絡在本地運行 Agent 。

尤其是在豆包手機助手引發云端 AI Agent 的隱私安全顧慮之后，這對手機意味著什么，其實不難想象。

而當模型可以直接運行在 SoC 的 NPU 上，當系統級組件可以調用本地模型完成推理、生成、甚至多步任務執行，AI 也會更進一步變成操作系統的一部分。

所以 E2B 和 E4B 真正讓人興奮的地方，但不是它們的性能，而是讓人看到端側 AI 的潛力還有巨大的挖掘空間。而這條路徑，一旦跑通，影響的就不只是模型本身，而是整個終端生態。

開源 AI 模型，在 Agent 時代重新洗牌

最早，Meta 用 Llama 奠定了開源模型生態的方式，但很快，從 Qwen、DeepSeek 到去年 Kimi、MiniMax 的相繼開源，中國公司已經主導了全球開源 AI 的大模型格局，也在在性能、成本和落地能力上同時逼近甚至反超閉源模型。

也正是在這個背景下，再看 Google 的動作，就不只是一次模型更新了。

Gemma 過去一直處在一個略顯尷尬的位置，名義上開源，但協議并不徹底，企業用起來有顧慮，開發者也很難放心做二次分發和深度定制。這一次，Gemma 4 直接換成 Apache 2.0，本質上是把最后一道門檻拆掉了，從「可以用」變成「可以放心用」。

圖片來源：安卓

這一步的意義，比模型本身更大。因為它等于明確了一件事，Google 不只是要做模型，還要重新進入開源生態。

這也讓它的整體策略變得更清晰了。一邊是 Gemini，繼續對標 GPT 和 Claude，守住能力上限和商業化；另一邊是 Gemma，面向開發者、面向本地部署、面向生態擴展。閉源和開源，不再是取舍，而是分工。

過去幾個月，真正把行業注意力拉走的，是 Agent。無論是 Anthropic 推出的 Claude Code，還是開源社區圍繞 OpenClaw 搭起來的一整套工具鏈，大家討論的焦點已經不再是對話、多模態，而是「干活」。

圖片來源：OpenClaw

在這波變化里，Gemini 的存在感其實不算強。能力依然在第一梯隊，但在開發者心智里，它并沒有成為 Agent 的首選底座。這也是為什么你會看到越來越多開發者開始轉向開源模型，哪怕能力略遜一籌，也更愿意換取可控性和可部署性。

Gemma 4 出現在這個時間點，就顯得很微妙了。

一方面，它補上了 Google 在開源上的短板，尤其是協議問題解決之后，開發者終于可以真正把它當作基礎設施來用。另一方面，它又剛好踩在「本地 Agent」這個新需求上，無論是 26B、31B，還是 E2B、E4B，都在試圖回答同一個問題：能不能把一部分 AI 能力，直接搬到設備上運行。

這未必是最激進的一步，但很可能是最現實的一步。

開源模型的競爭，正在從「誰更強」，變成「誰更能被用起來」。而在這個新的牌桌上，Google 終于重新坐了下來，只是這一次，它不再是發牌的人，而是必須重新爭奪籌碼的玩家。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

/閱讀下一篇/

返回網易首頁下載網易新聞客戶端

相關推薦

熱點推薦

國產大模型：這次劇本不一樣

經濟觀察報 2026-04-04 13:16:04
9 跟貼 9

聯想重新定義“龍蝦”

量子位 2026-04-04 16:11:39
1 跟貼 1

OpenAI沒有護城？AI即興軟件時代來臨，美國再迎「網景詛咒」！

新智元 2026-04-05 12:34:22
2 跟貼 2

OpenAI新模型不是GPTX！全新預訓練“土豆”曝光

量子位 2026-04-05 17:09:09
0 跟貼 0

一夜變天，Anthropic正式封殺OpenClaw！全球開發者24小時血崩

新智元 2026-04-04 10:01:26
16 跟貼 16

GPT-6，曝光了

量子位 2026-04-05 12:49:09
7 跟貼 7

「AI殺死Git」？前GitHub掌門人開啟AI原生操作系統

新智元 2026-04-05 10:43:35
4 跟貼 4

剛剛，Claude 4小時血洗全球最安全系統！人類最后防線失守

新智元 2026-04-05 17:32:16
1 跟貼 1

拒絕智能手機，炮轟ChatGPT，沒有他就沒有今天的互聯網

DeepTech深科技 2025-12-26 18:07:26
35 跟貼 35

Karpathy開源第二大腦方案，有望替代向量數據庫，讓AI永不失憶

DeepTech深科技 2026-04-05 16:24:52
0 跟貼 0

高通萬衛星談終端大模型優勢：個性化與數據推理

量子位 2025-12-11 03:38:41
0 跟貼 0

AI Agent是科技革命中的一次真正的范式轉移

量子位 2026-04-03 22:52:35
0 跟貼 0

卡帕西引爆硅谷！公開「第二大腦」黑科技，1250萬人圍觀

新智元 2026-04-05 15:33:38
1 跟貼 1

一分鐘看懂谷歌 Gemma4 究竟有多強

倪云華洞察 2026-04-03 19:35:56
6 跟貼 6

企業玩不轉龍蝦，是人的思維出錯了

量子位 2026-04-03 16:38:28
1 跟貼 1

美方已救出被擊落F-15E戰機上的第二名飛行員

央視新聞客戶端 2026-04-05 12:17:39
78778 跟貼 78778

使用skill蒸餾自己，才是解放生產力的最佳實踐

人人都是產品經理社區 2026-04-05 10:11:28
22 跟貼 22

花200薅5千算力，Claude冷血斷供“龍蝦”

鈦媒體APP 2026-04-04 18:02:10
3 跟貼 3

「龍蝦之父」吐槽人類互聯網后，終于有人把這當個事兒辦了

機器之心Pro 2026-03-31 11:09:26
0 跟貼 0

為了不跟龍蝦搶電腦用，有人開始造Agent專屬的“三無”硬件

量子位 2026-04-05 10:16:52
3 跟貼 3

谷歌把新功能塞給蘋果CarPlay，安卓車主愣了3秒

薛定諤的BUG 2026-04-03 21:28:18
0 跟貼 0

“同事.skill”出圈玩梗背后藏法律與技術隱患

財聯社 2026-04-05 14:52:12
2 跟貼 2

點不到外賣的加拿大留子，想在歐美復制一個美團

虎嗅APP 2026-04-05 17:00:05
3 跟貼 3

機器人進汽車廠，給波士頓動力，裝上谷歌最強大腦

機器之心Pro 2026-01-06 19:02:05
0 跟貼 0

DeepSeek推理分裂出多重人格，越社交越聰明

量子位 2026-02-04 03:32:03
0 跟貼 0

媒體：4億美元橋梁被炸F-15墜毀沖突代價已遠超預估

中國新聞周刊 2026-04-05 18:06:30
1618 跟貼 1618

NHS花3.3億買的系統，醫生登錄就想吐

野生運營 2026-04-04 00:56:36
0 跟貼 0

這臺咖啡機上線3天做了0杯咖啡，工程師卻說是巨大成功

摸魚算法 2026-04-03 23:13:53
0 跟貼 0

1000美元起售!PS6天價預警分析師直言主機將被終結

游民星空 2026-04-05 23:03:14
1 跟貼 1

風箏-鄭耀先被催婚了！一套邏輯下來，說的徐百川啞口無言

龍耀影視 2026-04-03 09:03:13
3 跟貼 3

索尼CEO放話：PS5既要當玩家天堂也要當發行商首選

游民星空 2026-04-05 21:50:18
1 跟貼 1

Xbox把4款絕版游戲"復活"了3小時，25周年憋了個大招？

碼上閑敘 2026-04-05 21:15:23
0 跟貼 0

Sami用25分鐘給自己做了份"死亡倒計時"：30秒一條命

我是一個粉刷匠2 2026-04-04 13:40:47
0 跟貼 0

徐州“公廁版瑞幸”火出圈，景區工作人員回應：曾是游客服務點而非公廁

現代快報 2026-04-04 15:00:11
1209 跟貼 1209

快訊 | 創造歷史！天津男排，奪冠！

天津廣播 2026-04-05 21:21:07
66 跟貼 66

指尖上的全自動風暴毛瑟M712速射型火力邏輯與機械傳奇

番茄肚腩 2026-04-01 15:28:19
1 跟貼 1

小區樓棟加裝電梯只到1個樓層！這家住戶有實力？真相出人意料，網友：是個省錢思路

重慶晨報 2026-04-05 08:10:00
39 跟貼 39

張雪深夜發視頻回應“一個子兒都沒有”言論：當時說實話想裝一下……政府只需要把舞臺搭好就很棒了

都市快報橙柿互動 2026-04-05 09:20:56
9883 跟貼 9883

確定了！江蘇又有新假期！

泰州微視聽 2026-04-05 19:41:00
31 跟貼 31

伊朗不可能不知道，以色列的四大核心坐標

愛情的滋味我也想嘗嘗 2026-04-05 23:16:46
0 跟貼 0

胖東來再回應“雞蛋被檢出角黃素”
界面新聞
2026-04-05 17:34:08

喬任梁爸爸自曝兒子死因??？
八卦瘋叔
2026-04-05 10:31:47

4-0溫特，孫穎莎為啥贏的這么輕松？前世界冠軍周雨說了大實話！
乒乓樂園
2026-04-06 00:03:58

以色列至今都不敢相信，一場戰爭打掉了自己未來50年的國運
農夫史記
2026-04-04 20:18:25

嚇破膽！金昊行刑前尿濕褲子，記者最新采訪曝光，劉銘瑤并非高攀
壹月情感
2026-04-05 14:19:31

油價要漲破天了!4月5日油價迎來大幅暴漲,調價后全國地區油價價格
沙雕小琳琳
2026-04-05 04:14:48

371：146！歐盟“反”華計劃徹底落空，馮德萊恩被狠狠“打”臉
大衛聊科技
2026-04-05 13:49:29

五星級酒店帶人不登記可以嗎？網友：又是上網漲見識的一天！
深度報
2026-02-22 22:52:56

成都“牽手門”事件女主現今狀況曝光，太慘了......
許三歲
2026-03-17 07:34:05

雷扎伊，身亡
農民日報
2026-04-03 19:45:39

靠墻靜蹲，一個被低估的健身動作！堅持靜蹲的6個好處
增肌減脂
2026-04-04 17:50:08

陜西女警花臥底被揪出，被歹徒折磨7天解救：人都已經垮了
罪案洞察者
2025-03-07 08:59:25

換上王秋明加強中場控制力？球迷：于指下課吧！加強了對方控制力
刀鋒體育
2026-04-06 00:17:57

誰造出了優思益這頭“怪物”？
吳曉波頻道
2026-04-05 08:31:32

豬油再次被關注！醫生發現：高血壓患者常吃豬油，或出現幾種變化
蜉蝣說
2026-02-23 21:23:05

《無限超越班4》首播，看點足，像吐槽大會，很多演員都是犧牲品
馬慶云的影音娛
2026-04-05 10:24:19

中國人口絕不能到億級體量之下
文青大叔說
2026-03-08 09:19:26

《乘風2026》直播無視規則，王濛沉默，節目組擔心退賽嗎？
悅君兮君不知
2026-04-04 23:50:29

于根偉聽勸一半，王秋明換下郭皓后，津門虎中場崩盤，保級掉隊了
替補席看球
2026-04-05 21:51:02

英國遭到拒絕后發出警告，中國若不合作，中企海外資產將被沒收
鐵錘簡科
2026-04-04 15:34:43

2026-04-06 00:47:00

雷科技

專注AI硬科技

36728文章數 811991關注度

往期回顧全部

科技要聞

花200薅5千算力，Claude冷血斷供“龍蝦”

小米、字節“老將”帶隊，Meta秘密布局AI新硬件

“沒中國，美國機器人就動不了”

內存一年漲四倍！國產手機廠商集體漲價

"養蝦"成本暴漲！OpenClaw被Claude踢出包月套餐

頭條要聞

營救細節公布：伊朗搜捕人員距飛行員藏身地不到3公里

媒體：4億美元橋梁被炸F-15墜毀沖突代價已遠超預估

保姆盜竊雇主價值80萬財物低價銷贓獲利19萬被判11年

AI替去世兒子撒了最后一次謊:等我賺到錢就回來孝順你

4比3擊敗松島輝空王楚欽奪得生涯首個世界杯單打冠軍

頭條要聞

營救細節公布：伊朗搜捕人員距飛行員藏身地不到3公里

媒體：4億美元橋梁被炸F-15墜毀沖突代價已遠超預估

保姆盜竊雇主價值80萬財物低價銷贓獲利19萬被判11年

AI替去世兒子撒了最后一次謊:等我賺到錢就回來孝順你

4比3擊敗松島輝空王楚欽奪得生涯首個世界杯單打冠軍

體育要聞

CBA最老球員，身價7500萬美元

歷史第一人！孫穎莎勝王曼昱，獲澳門世界杯三連冠

戰滿7局！王楚欽4-3險勝日本新星，首次加冕世界杯男單冠軍

中國國家隊祝賀王楚欽：那些打碎的夢，親手一片片拼回

王楚欽：我非常慶幸我做到了，我“活到”了最后

娛樂要聞

王燦兮否認婆媳不和曬與杜淳媽合影

新加坡偶遇唐嫣羅晉一家三口，夫妻倆陪女兒游玩

58歲伊能靜攜秦昊回臺北，兩人路邊吃手抓餅

內娛最丑05后，被捧成下一個頂流？

谷愛凌和何超欣穿比基尼度假！谷愛凌馬甲線真美

財經要聞

誰造出了優思益這頭“怪物”？

國內燃油附加費調整 800公里以上收120元

美伊戰火持續中國資產成“避風港”！

入股10年被套知名機構向A股公司索賠4.3億

優思益塌房始末：明星集體道歉背后，假洋牌與代工廠的真相

汽車要聞

家用SUV沒駕駛樂趣?極氪8X第一個不同意

福特智趣烈馬春日禮遇購車即送價值1.2萬舉升車頂

26款升級閃充舒適加倍比亞迪仰望探店實拍

新增車色"東漓灰" 凱迪拉克XT5限時22.99萬起

獵鷹700絲滑超出預期智能大滿貫的星途EX7了解下

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

家居

數碼

手機

本地

公開課

家居要聞

溫馨多元愛的具象化

歲月靜好典雅新章

經典配色晝色銀河

新婚愛巢甜蜜情趣拉滿

數碼要聞

大膽復古美學，海盜船推出原子紫配色K65 PLUS WIRELESS機械鍵盤

OPPO Pad Mini再曝，8.8英寸144Hz 小平板

海盜船推出VANGUARD 96 WIRELESS機械鍵盤，支持三模連接

研華"Wildcat Lake"單板計算機MIO-5356上線，可選酷睿3 305

手機要聞

OPPO Find X9s Pro銀色哈蘇專業增距鏡亮相：觀賽神器顏值拉滿

魏思琪換上新機！REDMI K90至尊版來了小米首款風冷旗艦

榮耀600 Pro國際版真機亮相：橫向Deco+橙色機身果味十足

華為HarmonyOS 6系統新版應用助手將至，6.1眾測用戶可體驗

本地新聞

跟著歌聲游安徽，聽古村回響

從學徒到世界冠軍，為什么說張雪的底氣在重慶？

春日吃花第五期——江西

春日吃花第四期——江浙

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻

為什么人類有不同的膚色？

13個毀掉你生活的不良習慣

李彥宏：百度離破產30天

手機 / 數碼

房產 / 家居

比國產AI還卷：谷歌Gemma 4以小博大，端側模型迎來分水嶺

免費、無 API，大模型不大但好用

聯手高通、聯發科，小模型引發本地 Agent 浪潮？

開源 AI 模型，在 Agent 時代重新洗牌

花200薅5千算力，Claude冷血斷供“龍蝦”

營救細節公布：伊朗搜捕人員距飛行員藏身地不到3公里

營救細節公布：伊朗搜捕人員距飛行員藏身地不到3公里

CBA最老球員，身價7500萬美元

王燦兮否認婆媳不和 曬與杜淳媽合影

誰造出了優思益這頭“怪物”？

家用SUV沒駕駛樂趣?極氪8X第一個不同意

態度原創

溫馨多元 愛的具象化

大膽復古美學，海盜船推出原子紫配色K65 PLUS WIRELESS機械鍵盤

OPPO Find X9s Pro銀色哈蘇專業增距鏡亮相：觀賽神器 顏值拉滿

跟著歌聲游安徽，聽古村回響

比國產AI還卷：谷歌Gemma 4以小博大，端側模型迎來分水嶺

免費、無 API，大模型不大但好用

聯手高通、聯發科，小模型引發本地 Agent 浪潮？

開源 AI 模型，在 Agent 時代重新洗牌

花200薅5千算力，Claude冷血斷供“龍蝦”

CBA最老球員，身價7500萬美元

王燦兮否認婆媳不和曬與杜淳媽合影

誰造出了優思益這頭“怪物”？

溫馨多元愛的具象化

大膽復古美學，海盜船推出原子紫配色K65 PLUS WIRELESS機械鍵盤

OPPO Find X9s Pro銀色哈蘇專業增距鏡亮相：觀賽神器顏值拉滿