關注CAIE,國內頭部AI人才認證、培訓體系,助你在職場升職加薪。
今天凌晨,谷歌毫無預兆地扔了個重磅炸彈Gemini 3.1 Pro。
這次Gemini 3.1 Pro最核心的性能提升,就是推理能力,也就是智商。
![]()
有個叫ARC-AGI-2的測試,這玩意被稱為AI界的智商檢測器,專門考那種從未見過的邏輯題,防刷題、防作弊,難度極高。
谷歌CEO 劈材哥表示,Gemini 3.1 Pro考了77.1分,而之前的Gemini 3 Pro才考了31.1分,直接提升了2倍,真正博士級AI終于來了。
![]()
可能有朋友會說,測試分數再高有啥用呢?其實不然,這些測試分數背后,反映的就是它處理實際復雜任務的能力。
比如咱們平時整理多份雜亂的數據,需要從中找規律、做總結,以前的AI可能只能給你羅列信息。
現在能直接幫你整合好,甚至幫你分析出關鍵結論。再比如做編程、設計之類的活兒,能更快get到你的需求,少走很多彎路。
除了智商能力,Gemini 3.1 Pro其他測試也相當能打。專業科學知識測試里,它考了94.3分,接近滿分,也就是說不管是科研相關的問題,還是咱們平時遇到的專業知識點,它都能給你講得明明白白。
編程測試里,國際程序設計競賽的題目,它的埃洛評分達到了2887,比上一代高了400多分,相當于一個普通程序員和一個資深程序員的差距,寫代碼的效率和準確率都提升了不少。
還有長文本檢索,平均12.8萬字符的上下文,它能精準找到你要的信息,準確率84.9%,平時看長篇論文、大篇幅資料,用它來檢索重點,能省不少時間。
![]()
聊完理論上的提升,再跟大家說點實際能用得上的場景。
第一個是代碼化動畫制作,平時咱們做個網站、剪個視頻,想要個好看的動畫,要么找現成的素材,要么自己寫復雜的代碼,特別麻煩。
而Gemini 3.1 Pro不一樣,你只要用文字跟它說清楚你想要什么樣的動畫,比如“一個簡約的圓形旋轉動畫,適合放在網站首頁”,它就能直接生成SVG格式的代碼。
這種代碼做出來的動畫,不管放大多少倍都不會模糊,而且文件很小,不會拖慢網站速度。
然后是復雜系統整合,這個可能企業用戶用得多一些。簡單來說,它能把那些復雜的API接口和咱們能看懂的設計界面打通,不用你懂太多專業技術,就能實現復雜的功能。
有一個讓我印象特別深的案例,居然能搞定國際空間站的實時軌道儀表盤。這聽起來挺玄乎,其實就是要從一堆復雜的公共遙測數據流里抓信息,然后變成咱們能看懂的圖表。
以前這可是得把航天數據和編程接口對接得天衣無縫才行,現在模型自己就能推理出來,把復雜的API接口變成了直觀的用戶界面。
這就像是一個不需要培訓就能上手的頂級工程師,直接幫你搞定了最難搞的數據對接工作。
再說說它的交互設計能力,看那個椋鳥群飛的模擬我就驚了。它不僅僅是寫個3D飛行代碼那么簡單,它甚至考慮到了交互性。
你可以用手勢去控制鳥群,而且背景音樂還是根據鳥群飛行的節奏生成的。
這種把視覺、聽覺和控制邏輯一鍋端的創造力,以前得一個團隊配合才能搞定,現在一個人加個AI就能閉環。這種沉浸式的體驗設計,對搞藝術或者做原型的朋友來說,想象力空間太大了。
還有一個特別有意思的功能,讓它讀《呼嘯山莊》,然后做一個個人作品集網站。它沒像以前的AI那樣只會摘抄好詞好句,而是真的讀懂了那種陰郁又熱烈的氣氛,設計出了一個既現代又符合原著靈魂的界面。
這種對抽象意境的理解和落地能力,真的讓人感覺AI開始有了點所謂的藝術直覺。
從現在開始,就能在Google AI Studio、Vertex AI這些平臺上找到預覽版。
咱們普通用戶更簡單,直接去Gemini App或者NotebookLM就能體驗。特別是訂閱了Google AI Pro或者Ultra的高級用戶,額度會更高,玩起來更爽。
想轉型AI,不被時代淘汰
CAIE注冊人工智能工程師認證
崗位能力 × AI工具 ×轉型方向 × 場景落地 = 新AI職業價值
掃碼免費領取《AI工程師入門學習指南》
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.