谷歌最強開源大模型Gemma 4,支持多模態、離線運行
2026年4月2日凌晨,谷歌DeepMind CEO Demis Hassabis在X上發了四顆鉆石emoji,幾個小時后,謎底揭曉——Gemma 4全系列正式發布。
這次不是常規更新,而是開源大模型格局的徹底重寫。31B Dense版本直接沖到Arena AI排行榜全球第三,用不到十分之一的參數量就能跟400億參數的巨無霸掰手腕。更關鍵的是,谷歌這次徹底放下姿態,全系列采用Apache 2.0開源協議,沒有任何商業限制。
![]()
Gemma 4 是谷歌推出的一款 開源本地大模型,主要用于支持多模態數據處理和離線運行。該模型在人工智能領域具有重要的突破,尤其是在處理多種數據形式(如文本、圖像、視頻和語音)時的能力。它能夠提供一種本地運行的解決方案,無需依賴持續的網絡連接,適用于各種智能化應用場景。
一、四款模型,覆蓋全場景
Gemma 4不是單一模型,而是一個完整的模型家族,從2B到31B全場景覆蓋:
- E2B(2.3B有效參數)
:專為手機、樹莓派等端側設備設計,內存占用可壓至1.5GB以下,完全離線運行
- E4B(4.5B有效參數)
:端側旗艦,支持多模態輸入,AIME 2026數學測試達42.5%
- 26B MoE
:混合專家架構,總參數260億,推理時僅激活38億參數,速度接近4B模型
- 31B Dense
:旗艦版本,Arena AI排名全球第三,單張H100即可運行
![]()
二、小模型打出大牌面
Gemma 4最讓人震驚的,不是它有多大,而是它有多小卻能打多強。
在Arena AI開源排行榜上,31B Dense沖到全球第三,Elo評分1452。排在前面的GLM-5和Kimi K2.5,參數量分別是它的20倍和30倍。谷歌把這叫做"每參數智能"——用更少的參數,達到更高的性能。
數學推理方面,AIME 2026成績從上一代的21.2%躍升至89.2%,提升幅度高達68個百分點。這一成績已經接近甚至超越部分閉源商業模型。
![]()
三、Apache 2.0協議
如果說性能是驚喜,那許可證的變化才是真正的重磅炸彈。
此前Gemma前三代產品用的都是谷歌自定義的開源協議,不僅有諸多商用限制,谷歌還能單方面修改規則。這次,Gemma 4全系列采用Apache 2.0許可證,意味著:
? 可自由用于商業用途
? 可修改、分發、二次開發
? 專利授權明確,降低法律風險
? 與現有開源生態無縫兼容
Hugging Face聯合創始人Clément Delangue評價:"這是開源AI領域的一個重大里程碑。"
四、核心技術亮點 1. 多模態能力
Gemma 4全系支持圖像和視頻輸入,E2B和E4B還額外支持原生音頻輸入,內置約3億參數的音頻編碼器。這意味著開發者可以用Gemma 4構建真正的多模態AI應用。
2. Agent原生支持
Gemma 4原生支持函數調用(Function Calling)和結構化JSON輸出,內置System Prompt支持,可作為Agent的核心大腦,自主規劃多步驟任務、調用外部工具。
3. 思考模式
所有Gemma 4模型均支持可開關的思考模式(Thinking Mode)。開啟后,模型會先輸出內部推理過程,再給出最終答案,適合復雜問題求解。
4. 超長上下文
31B和26B版本支持256K的超長上下文窗口,在同參數級別開源模型中屬于頂級配置,可處理長文檔、代碼庫分析等復雜任務。
五、部署教程 方式一:Ollama(最簡單)
安裝ollama,進入 https://ollama.com/ 先下載ollama。
1# 安裝Ollama(官網下載)
2# 運行不同版本:
3
4ollama run gemma4
5
6
7ollama run gemma4:e2b # 2B端側版
8ollama run gemma4:e4b # 4B端側版
9ollama run gemma4:26b # 26B MoE版
10ollama run gemma4:31b # 31B旗艦版
方式二:llama.cpp
1# macOS安裝
2brew install llama.cpp --HEAD
3
4# 運行
5llama-server -hf ggml-org/gemma-4-26B-A4B-it-GGUF:Q4_K_M
方式三:Mac用戶(MLX)
1# 安裝
2uv pip install-U mlx-vlm
3
4# 運行(帶TurboQuant優化)
5uv run mlx_vlm.generate --model google/gemma-4-31b-it --kv-bits 3.5
硬件要求參考- E2B/E4B
:8GB內存即可,手機、樹莓派都能跑
- 26B MoE
:推薦16GB+顯存,消費級GPU工作站
- 31B Dense
:推薦24GB+顯存,單張H100或RTX 4090
Gemma 4標志著谷歌在開源AI領域的戰略轉向:從"提供替代品"到"爭奪基礎設施層"。Apache 2.0許可證、原生Agent支持、多模態覆蓋的組合,使其成為2026年最值得關注的開源模型發布之一。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.