11月19日凌晨,谷歌正式發(fā)布Gemini 3 Pro預(yù)覽版,該模型在LMArena排行榜以1501 Elo登頂,在MathArena Apex測(cè)試中取得23.4%成績(jī),展現(xiàn)頂尖數(shù)學(xué)能力。
Gemini 3 Pro的屏幕理解能力達(dá)到72.7%,這意味著AI能夠像人類一樣"看懂"電腦界面并操作軟件。在"人類最后考試"中獲37.5%分?jǐn)?shù),展現(xiàn)出博士級(jí)推理能力。多模態(tài)理解方面,MMMU-Pro得分81%,Video-MMMU達(dá)87.6%。
測(cè)試顯示,Gemini 3 Pro能夠:
· 將手寫多語(yǔ)言菜譜轉(zhuǎn)化為可分享的電子版
· 分析運(yùn)動(dòng)視頻并生成個(gè)性化訓(xùn)練計(jì)劃
· 30秒內(nèi)生成可運(yùn)行的3D太空游戲
· 將學(xué)術(shù)論文轉(zhuǎn)化為交互式學(xué)習(xí)卡片
OpenAI CEO 山姆奧特曼在X平臺(tái)發(fā)文祝賀:"恭喜谷歌成功推出Gemini 3!看起來(lái)是個(gè)很棒的模型。"馬斯克也轉(zhuǎn)發(fā)相關(guān)推文稱贊"干得不錯(cuò)"。
谷歌同步推出AI開(kāi)發(fā)平臺(tái)Antigravity,集成Gemini 3和專門控制瀏覽器的Gemini 2.5 Computer Use模型。該平臺(tái)支持多個(gè)AI智能體并行工作,自主完成編碼、測(cè)試、驗(yàn)證全流程。
技術(shù)細(xì)節(jié)顯示,Gemini 3 Pro使用谷歌自研TPU訓(xùn)練,支持100萬(wàn)token上下文窗口。其深度思考模式在GPQA Diamond測(cè)試中達(dá)到93.8%,預(yù)計(jì)未來(lái)幾周向Ultra訂閱用戶開(kāi)放。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.