現(xiàn)在AI屆有兩大羊毛,一個(gè)是Cursor的edu郵箱用戶可以免費(fèi)使用一年,價(jià)值200刀,非常實(shí)用,但是缺點(diǎn)是只有美國的學(xué)生才能享受;另一個(gè)就是Gemini的Pro會(huì)員,只要是學(xué)生就能在認(rèn)證后免費(fèi)用15個(gè)月,親測(cè)老師也行,只要是教育體系里面有官方給的郵箱即可。
Pro訂閱里面包含了2TB的存儲(chǔ)空間,特別是還有Veo3的使用權(quán)限,暫時(shí)一天能生成三次,按照視頻生成的成本,怎么也能算10-15塊錢了。
![]()
根據(jù)Google近一年來的默默發(fā)力,Gemini-2.5-Pro絕對(duì)是世界上最頂級(jí)的那一檔,未來肯定還會(huì)加大力度搞大模型,搞視頻生成模型,所以這15個(gè)月的免費(fèi)羊毛必須得薅。
搜Gemini Student Discount即可
秦始皇看了也都得點(diǎn)贊-由Gemini Veo3生成。
Gemini現(xiàn)在就倆模型,一個(gè)2.5 Flash主打通用任務(wù),快,理解能力還可以,多模態(tài)也沒問題。
2.5-Pro重推理,每一次的推理都會(huì)花更多的token以及更長(zhǎng)的思考時(shí)間,當(dāng)然效果也更好,在今年的高考數(shù)學(xué)測(cè)試也看到了,幾乎都能做對(duì)(前提是你給它足夠精準(zhǔn)的數(shù)學(xué)表達(dá))。
性能來說,我們先不看論文和技術(shù)報(bào)告,先從openrouter看下Gemini-2.5-Pro的關(guān)鍵參數(shù),主要就看紅框里面的這個(gè)。
Context:1.05M
Max Output:66k
![]()
這倆指標(biāo)非常牛逼,context代表了它可以一次對(duì)話處理的內(nèi)容長(zhǎng)度,理論上肯定是越多越好,因?yàn)橛袝r(shí)候真的需要幾篇甚至十幾篇論文扔給AI來讀;Max Output代表了它可以輸出內(nèi)容的最大長(zhǎng)度。
模型性能好,但是輸入輸出長(zhǎng)度太短,這種在應(yīng)用中只能寫寫詩,對(duì)對(duì)對(duì)聯(lián),實(shí)際中作用并不大。
這倆長(zhǎng)度在大模型領(lǐng)域里面都是Top級(jí)別的,這代表了什么,你可以一次性的扔給它一大堆的文檔,word,pdf,excel,txt等,然后它可以一次性給你生成一整篇論文或者報(bào)告。
一般來說,一篇理工類型的英文論文6000字左右,換成token也就8000+,完全在66000之內(nèi),這代表了它不僅可以一次性的給你把草稿潤(rùn)色完,順便還有非常大的余力給你出一份修改記錄。
論文類型
常見字?jǐn)?shù)(英文)
約等于Token數(shù)(英文)
常見字?jǐn)?shù)(中文)
約等于Token數(shù)(中文)
期刊文章(人文社科)
8,000 - 12,000
10,400 - 15,600
8,000 - 12,000
16,000 - 30,000
期刊文章(自然科學(xué))
3,000 - 6,000
3,900 - 7,800
3,000 - 6,000
6,000 - 15,000
碩士學(xué)位論文
20,000 - 80,000
26,000 - 104,000
20,000 - 80,000
40,000 - 200,000
博士學(xué)位論文
80,000+
104,000+
80,000+
200,000+
這在碰到revision的時(shí)候更有用,一次性扔給它修改稿和原稿,讓它一次性的輸出修改記錄,給審稿人的cover letter等一堆東西。
不是說別的模型做不了,而是這種大輸出的模型,做長(zhǎng)上下文的場(chǎng)景時(shí)候就是神器。
技術(shù)報(bào)告中的數(shù)據(jù)略有不同,但不影響,你要有學(xué)生驗(yàn)證,就猛猛的用Pro完事。
![]()
現(xiàn)在的Gemini性價(jià)比,說在世界前三肯定不為過,綜合能力跟OpenAI不相上下,甚至略高也是可以說的。
![]()
最后說一點(diǎn)標(biāo)準(zhǔn)化評(píng)分,在已有的公開數(shù)據(jù)集上,也是那些刷榜的題目上,其實(shí)大多數(shù)的模型做的都不錯(cuò),Gemini也不例外。
![]()
但實(shí)際上是因?yàn)檫@些題公開的時(shí)間很久了,套路都已經(jīng)被學(xué)的差不多了,這幾天紐約大學(xué)的saining xie教授團(tuán)隊(duì)搞了一個(gè)新的測(cè)試集,叫LiveCodeBench Pro,看名字也知道,就是做編程測(cè)試的,分為了三個(gè)檔,簡(jiǎn)單,中級(jí)和困難,簡(jiǎn)單問題那些比較強(qiáng)的模型都做的不錯(cuò),o3-high能做對(duì)87%+的簡(jiǎn)單題,中級(jí)的也有44.9%的正確率,但是難題一道也做不對(duì)(而人類的編程高手完全沒問題)。
而Claude這個(gè)編程為主要賣點(diǎn)的模型,中級(jí)的一道都做不對(duì)。
可以說,現(xiàn)在的模型強(qiáng),得實(shí)際用,數(shù)據(jù)已經(jīng)過擬合了。
地址:https://livecodebenchpro.com/
![]()
Gemini-2.5-Pro,用起來一點(diǎn)兒沒問題,強(qiáng)推。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.