![]()
新智元報道
編輯:犀牛
【新智元導(dǎo)讀】OpenRouter突然上線匿名隱身模型Pony Alpha:幾句簡介、一個藍(lán)色Logo,卻憑離譜的編程、推理與200K上下文體驗(yàn)把外網(wǎng)點(diǎn)燃。更戲劇的是,全球立刻開啟「猜爹大賽」——Claude、DeepSeek、Grok、GLM各派開吵,也讓「匿名盲測式發(fā)布」這種新打法浮出水面。
2月7日深夜,全球最大的模型服務(wù)平臺OpenRouter悄悄上線了一個匿名模型,代號:Pony Alpha。
沒有官宣,沒有發(fā)布會,沒有鋪天蓋地的營銷通稿——只有一個藍(lán)色的Logo、一行簡短的介紹,和一個讓所有試用者集體失語的體驗(yàn)。
然后,整個外網(wǎng)就瘋了。
一匹來歷不明的「黑馬」
事情的起因很簡單。
OpenRouter官方發(fā)了一條推文,語氣云淡風(fēng)輕:「我們上線了一個新的隱身模型Pony Alpha。它是新一代基礎(chǔ)模型,在編程、推理和角色扮演方面表現(xiàn)強(qiáng)勁,并針對Agent工作流做了優(yōu)化,工具調(diào)用準(zhǔn)確率極高。」
![]()
就這么幾句話,連誰做的都沒提。
但問題是——這玩意兒太強(qiáng)了。
有人半夜睡不著,隨手把一段改了一天都沒搞定的屎山代碼扔進(jìn)去,結(jié)果Pony Alpha不僅精準(zhǔn)定位了邏輯漏洞,還順手把后端架構(gòu)重構(gòu)了一遍。
有人用一句話提示詞,讓它生成了一個包含35個全球電臺的收音機(jī)網(wǎng)頁應(yīng)用,動畫UI流暢,代碼超過500行,全部塞在一個文件里。
![]()
還有人讓它一個提示詞做出了一款90年代復(fù)古風(fēng)格的足球小游戲,完成度高到令人懷疑人生。
![]()
用一位網(wǎng)友的話說:「邏輯密度極高,完全沒有幻覺廢話。」
這種體驗(yàn),在當(dāng)前的大模型江湖里,不是隨便哪個選手能給的。
于是,一場全球規(guī)模的「猜爹大賽」正式拉開帷幕。
全網(wǎng)競猜
這匹Pony到底姓什么?
外網(wǎng)技術(shù)圈的偵探本能被瞬間點(diǎn)燃。有人翻模型參數(shù),有人對比輸出風(fēng)格,有人逐字分析回復(fù)中的措辭習(xí)慣,試圖從蛛絲馬跡中還原它的真實(shí)身份。
第一陣營:Claude派。
不少開發(fā)者試用后的第一反應(yīng)是「這體感太像Claude了」。
有人注意到Pony Alpha在光照處理上使用了ACES色調(diào)映射——這恰恰是Claude系列模型的標(biāo)志性偏好。
更有甚者,直接逼問模型「你到底是誰」,結(jié)果Pony Alpha在推理過程中承認(rèn)自己「是Claude,由Anthropic開發(fā)」。
知名開發(fā)者Sami Hindi在X上驚呼:「Pony Alpha is an Anthropic model??」
連ChatGPT都被拉來當(dāng)裁判,給出的判斷是:這大概率是Claude Sonnet 5。
![]()
第二陣營:DeepSeek派。
Replit的CEO Amjad Masad則另有判斷。
他注意到上線時間恰逢中國農(nóng)歷新年前后,推測這可能是DeepSeek的新版本。畢竟DeepSeek-V3此前的表現(xiàn)已經(jīng)讓全球側(cè)目,一個更強(qiáng)的V4版本出現(xiàn)在匿名測試平臺上,邏輯完全說得通。
第三陣營:Grok派。
Abacus.AI的CEO Bindu Reddy則把票投給了xAI。
她的理由是Pony Alpha強(qiáng)調(diào)角色扮演能力,這和Grok系列的定位高度吻合,再加上xAI剛剛并入SpaceX,推出Grok 4.2的時間窗口也對得上。
第四陣營:GLM派。
也許是最具戲劇性的一個猜測。
有人直接問Pony Alpha「你是什么模型」,它回答:「I'm GLM, a large language model developed by Z.ai。」
這個回答讓Reddit上的討論區(qū)瞬間沸騰。
知名博主karminski-牙醫(yī)也公開猜測,Pony Alpha要么是DeepSeek-V4,要么就是GLM的新模型。
![]()
四大陣營各執(zhí)一詞,吵得不可開交。這大概是AI圈今年開年以來最熱鬧的一場辯論。
線索拼圖
200K上下文與馬年的暗示
拋開主觀體感,我們來看看硬參數(shù)能告訴我們什么。
根據(jù)OpenRouter頁面顯示,Pony Alpha支持推理能力,擁有200K的上下文窗口,最大輸出131K token,延遲約6.64秒,吞吐量21tps。
這些數(shù)字本身就很能說明問題——200K的上下文長度,在目前公開的模型中并不多見,恰好與Claude Sonnet系列和部分國產(chǎn)頂級模型的參數(shù)對得上。
但最耐人尋味的,是「Pony」這個名字本身。
2026年,農(nóng)歷馬年。Pony,小馬。如果這是一個來自中國的模型團(tuán)隊(duì)命名的,這個巧思幾乎是明牌。而如果進(jìn)一步聯(lián)想——中國科技圈里,有一位以Pony聞名的人物,雖然他的公司目前并不以大模型聞名,但誰知道呢?正如一位網(wǎng)友的神評論:「看到名字叫Pony……該不會是……騰訊的吧?」
當(dāng)然,這或許只是巧合。但在AI圈,巧合往往是最好的營銷。
匿名測試
一種正在流行的發(fā)布策略
Pony Alpha事件的有趣之處,不僅在于模型本身的實(shí)力,更在于它揭示了一種正在成為主流的模型發(fā)布策略:匿名盲測。
過去,大模型的發(fā)布遵循的是傳統(tǒng)科技公司的路徑——開發(fā)布會、發(fā)論文、上榜單、刷跑分。
但這套玩法正在失效。當(dāng)每家公司都說自己SOTA,當(dāng)每個榜單都被質(zhì)疑「刷分過擬合」,用戶的信任成本越來越高。
匿名盲測提供了一種截然不同的信任建立方式:不告訴你我是誰,你先用,用完了覺得好,再揭曉身份。這本質(zhì)上是把評判權(quán)交還給了用戶,用真實(shí)體驗(yàn)替代了PR話術(shù)。
Pony Alpha的爆火恰恰證明了這一點(diǎn)。
它沒有跑分?jǐn)?shù)據(jù),沒有技術(shù)白皮書,沒有任何品牌背書,僅憑裸體驗(yàn)就在全球開發(fā)者社區(qū)掀起了一場狂歡。
這種用實(shí)力制造懸念的打法,比任何發(fā)布會都高明。
如果是國產(chǎn)
那才是真正的炸裂
回到最核心的問題:Pony Alpha到底是誰?
截至目前,官方?jīng)]有給出任何確認(rèn)。
但綜合各方線索——模型自述為GLM、馬年命名暗示、與中國春節(jié)時間節(jié)點(diǎn)的高度吻合、以及部分網(wǎng)友通過技術(shù)手段發(fā)現(xiàn)的中國模型特征——國產(chǎn)模型的可能性確實(shí)不小。
![]()
如果Pony Alpha最終被證實(shí)是一個來自中國的模型,這件事的意義將遠(yuǎn)超模型本身。
它意味著國產(chǎn)大模型已經(jīng)不再需要通過「對標(biāo)GPT-4、趕超Claude」這種敘事來證明自己,而是可以匿名走上全球舞臺,讓全世界的開發(fā)者在不知情的情況下為之驚嘆。
這才是真正的實(shí)力證明——不靠標(biāo)簽,不靠敘事,只靠體驗(yàn)本身。
正如那位小紅書網(wǎng)友寫的那樣:「有路子野的兄弟知道內(nèi)幕嗎?如果是國產(chǎn)我直接吹爆。」
我想,這也是此刻無數(shù)人心底的聲音。
謎底揭曉的那一天,也許比我們想象的更近。
而不管Pony Alpha最終姓甚名誰,它已經(jīng)用一種最酷的方式證明了一件事:在2026年的AI戰(zhàn)場上,最好的發(fā)布會,就是不開發(fā)布會。
參考資料:
https://openrouter.ai/openrouter/pony-alpha
https://x.com/zakarinoo7/status/2020306074377822703
https://x.com/karminski3/status/2020006334041862296
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.