2026年4月2日,谷歌發(fā)布Gemma 4系列開源大模型,這是其Gemma家族迄今規(guī)模最大、能力最強(qiáng)的一次升級(jí)。此次發(fā)布的四款模型覆蓋從智能手機(jī)到工作站的全部硬件場(chǎng)景,且首次全面采用Apache 2.0商業(yè)友好許可證。這一授權(quán)轉(zhuǎn)變,被業(yè)界視為谷歌在開源AI競(jìng)爭(zhēng)中戰(zhàn)略姿態(tài)的根本性轉(zhuǎn)向。
![]()
授權(quán)壁壘被打破
技術(shù)規(guī)格之外,Gemma 4最值得關(guān)注的變化,是許可證的徹底開放。
此前歷代Gemma模型均受谷歌自有專有許可證約束,開發(fā)者在商業(yè)使用上受到諸多限制。而Gemma 4此次全系采用Apache 2.0許可證發(fā)布,開發(fā)者對(duì)數(shù)據(jù)、基礎(chǔ)設(shè)施和模型本身均享有完整控制權(quán)。
這一變化的背后,是來(lái)自開發(fā)者社區(qū)的壓力長(zhǎng)期積累的結(jié)果。谷歌表示,自第一代Gemma發(fā)布以來(lái),開發(fā)者已累計(jì)下載超過(guò)4億次,并在此基礎(chǔ)上衍生出超過(guò)10萬(wàn)個(gè)變體,形成了一個(gè)龐大的"Gemmaverse"生態(tài)。授權(quán)的開放,意味著谷歌選擇以生態(tài)換影響力,而非以授權(quán)鎖定用戶。
![]()
四款型號(hào),打穿全部硬件層級(jí)
Gemma 4提供四種規(guī)格:E2B、E4B、26B A4B(混合專家架構(gòu))和31B(稠密架構(gòu)),可在高端手機(jī)、筆記本、個(gè)人工作站到服務(wù)器等不同環(huán)境中部署。
![]()
其中小型號(hào)的技術(shù)路線尤為激進(jìn)。移動(dòng)端兩款型號(hào)E2B與E4B比上代快4倍,電池消耗減少約60%,可在手機(jī)、樹莓派以及英偉達(dá)Jetson Orin Nano上完全離線運(yùn)行,實(shí)現(xiàn)近乎零延遲推理。
大型號(hào)則直指旗艦基準(zhǔn)。31B稠密模型在Arena AI全球開放模型排行榜中位列第3,26B MoE模型排名第6。谷歌稱,Gemma 4的綜合表現(xiàn)超過(guò)體量達(dá)其20倍的競(jìng)爭(zhēng)模型。
關(guān)鍵基準(zhǔn)數(shù)據(jù)方面,在2026年AIME數(shù)學(xué)競(jìng)賽題集上,31B模型得分89.2%;在競(jìng)爭(zhēng)性編程基準(zhǔn)LiveCodeBench v6上得分80.0%;在科學(xué)推理基準(zhǔn)GPQA Diamond上得分84.3%。相比之下,上代旗艦Gemma 3 27B在同樣三項(xiàng)指標(biāo)上分別僅為20.8%、29.1%和42.4%,提升幅度顯著。
多模態(tài)能力全面覆蓋,邊緣設(shè)備率先支持音頻
全系四款模型均支持文本和圖像輸入,其中小型號(hào)E2B和E4B額外支持音頻輸入;所有模型支持視頻理解能力,可通過(guò)分析幀序列處理視頻內(nèi)容;上下文窗口方面,小型號(hào)為128K tokens,大型號(hào)擴(kuò)展至256K tokens。
![]()
多語(yǔ)言支持達(dá)到140余種語(yǔ)言,原生具備函數(shù)調(diào)用能力,支持原生系統(tǒng)提示詞,為智能體工作流提供結(jié)構(gòu)化工具使用基礎(chǔ)。
![]()
谷歌Pixel團(tuán)隊(duì)首次深度介入,移動(dòng)端野心浮出水面
值得注意的是,此次Gemma 4是谷歌與其Pixel團(tuán)隊(duì)以及高通、聯(lián)發(fā)科等移動(dòng)芯片巨頭聯(lián)合開發(fā)的成果,首批支持設(shè)備涵蓋最新一代專用AI加速器硬件。
更具戰(zhàn)略意味的是,Gemma 4被明確定位為下一代Gemini Nano的基礎(chǔ)模型:開發(fā)者今天為Gemma 4編寫的代碼,屆時(shí)將自動(dòng)兼容Gemini Nano 4設(shè)備,無(wú)需重寫。這實(shí)質(zhì)上是谷歌以開源模型鎖定Android應(yīng)用生態(tài)、提前布局端側(cè)AI場(chǎng)景的戰(zhàn)略部署。
![]()
產(chǎn)業(yè)背景:開源大模型的競(jìng)爭(zhēng)已經(jīng)進(jìn)入?yún)?shù)效率時(shí)代
Gemma 4的發(fā)布,是近半年來(lái)開源AI模型競(jìng)賽提速的縮影。此前Meta的Llama系列、阿里的Qwen系列均在積極追趕閉源模型的性能上限。Gemma 4基于谷歌Gemini 3同等底層研究和技術(shù)構(gòu)建,這意味著谷歌在閉源旗艦與開源系列之間的技術(shù)代差正在收窄。
谷歌同步在Kaggle上發(fā)起"Gemma 4 Good Challenge"公益應(yīng)用挑戰(zhàn)賽,并通過(guò)Vertex AI、Cloud Run、GKE等云服務(wù)提供生產(chǎn)級(jí)部署路徑,試圖將開源社區(qū)熱度轉(zhuǎn)化為商業(yè)云收入。
Gemma 4模型現(xiàn)已在Hugging Face、Kaggle、Ollama及Google AI Studio上線,開發(fā)者可即刻獲取模型權(quán)重與相關(guān)文檔。
![]()
(本文信息來(lái)源:谷歌官方博客、The Decoder、Android Developers Blog)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.