鷺羽 發自 凹非寺
量子位 | 公眾號 QbitAI
我真栓Q了!圍觀了場狼人殺,看得我汗流浹背……
半小時全程高能,根本停不下來:
天崩開局倒鉤狼悍跳預言家、沖鋒狼死于話多、神職上大分每晚都是平安夜。
結果你跟我說,這些玩家都是AI???
![]()
果然會玩還得看淘寶~最近他們整活的這個AI狼人殺大亂斗WhoisSpy.ai,大模型在里面簡直咔咔亂殺。
D老師、Qwen、Kimi、GLM一個個都化身心機boy推拉博弈,be like:
- 六邊形戰士Kimi:武力值MAX,第六感Next Level。
- 老實人DeepSeek:雖然我只是一介平民,雖然我只會劃水,但我相信跟對人走對路,奧利給!
- 喜劇人Qwen:如果大家都Pick我,那我也要票自己QAQ。
- 通天代GLM:沉默寡言但實力不詳。
![]()
視頻鏈接:https://mp.weixin.qq.com/s/cckQp_UCdwrQk2wEP3Uemg
不過u1s1,雖然這些Agent看似性格迥異,實則一個個都是狼人殺高玩來著。
而且門檻也不高,自己就能手搓一個出來。
是不是有點手癢了?
(咳咳)不賣關子了,這就是我最近刷到的一個AI狼人殺比賽,還是淘寶辦的——首屆「高校生VS開發者對抗賽」。
![]()
展開來說,就是淘寶發了個召集令,廣邀高校學生和AI開發者,帶著自家Agent來真刀實槍碰一場,看看誰的Agent思維更縝密、更會盤邏輯。
至于為什么選擇狼人殺這個場景?
它可不僅僅“好玩”,而且夠“燒腦”——相比于傳統的大模型測評,狼人殺需要更長時間頭腦在線和持續的推理博弈,非常適合擔任天然的Agent試驗場。
![]()
圖片由AI生成
畢竟是騾子是馬,總要拉出來練練,更何況同學們的靈光一現碰撞上成熟的產業經驗,說不定真能產生些奇妙的化學反應?(doge)
所以本次比賽,選手將自動分為高校學生和開發者兩大陣營PK對決,參賽選手可以根據官方提供的開發指南,訓練自己的Agent學習狼人殺知識,一步步培養它化身游戲高玩~
而且門檻低,就算是編程小白也能報名參加吼!
(報名指路官網https://whoisspy.ai)
所以究竟是初出茅廬的高校學子不怕虎,還是手法老道的班味碼農更勝一籌,誰能率先調教出智慧和演技兼備的新任Agent狼王?
搓搓手,我已經迫不及待一決高下了。
![]()
Qwen悍跳賣隊友,Kimi運籌帷幄賽諸葛
言歸正傳,咱先來捋一捋這場比賽背后的競技場平臺WhoisSpy.ai。
畢竟Agent玩狼人殺、玩得比我這個十年老玩家還6這事,我是真有點破防,所以先來康康這到底是個啥?
官方title:全球首個實時對戰、開放可擴展的多智能體游戲平臺。
中譯中一下就是,它能夠讓多個Agent在同一時間、同一空間里打游戲,還能源源不斷地向里面添加新Agent。
![]()
怎么實現的呢?靠大模型的社交推理和博弈能力。
AI將模擬游戲玩家,在多輪心理戰交互后,一層層剝開自己的偽裝,展示自己真實的決策水平。
目前,WhoisSpy.ai支持中英文雙版,不僅能玩「狼人殺」,還有驚險刺激的「誰是臥底」。
![]()
圖片由AI生成
這次的高校生VS開發者對抗賽也是平臺最新推出的重頭戲,玩法很簡單:經典的12人狼王守衛版型,8個好人、4匹狼。
其中好人陣營又分四個神職(預言家、女巫、獵人、守衛)和四個平民,狼人陣營里隱藏著一只狼王。
一旦好人數量減少到比狼人還少,那么狼人獲勝,反過來如果狼全部出局,則好人勝利。
需要注意的是,為了防止AI無限制地嘮下去,規則還做了一丟丟微調:
- 規定Agent每次最多說240個漢字,多了的部分系統直接砍掉,不予顯示。
- 每次發言限時90s,兩次機會,如果兩次都沒有返回正常結果,就自動判定為此輪發言失敗。1小時內失敗次數多的Agent,還會直接被系統清退。
- 每局最長限制到8輪,如果到第八天還有狼人存活,則默認狼人獲勝。
![]()
都說知己知彼,百戰不殆,下面復盤比賽走起~
![]()
前情提要,4號狼王,7號、10號、11號是狼,2號預言家、5號女巫、8號獵人、12號守衛。
第一天:平安夜。
神職身份的5號Kimi率先亮出女巫ID,立馬優先掌握話語權:Follow me!
而K老師也是不負眾望,給出了自己的直覺判斷:先發3號一瓶存疑的銀水,提前預警7和10。(K老師的直覺強得可怕)
![]()
突然被踩中尾巴的7號小狼Qwen,也是迅速反應過來,禍水東引,將矛頭對準了自己的狼隊友。
但這一招也讓它暴露在8號獵人的視線里。
![]()
另一個狼人10號Q老師則迅速悍跳預言家,給7號假發金水。
“無辜躺槍”的4號Qwen狼王此刻仰天長嘯:本是同根生,相煎何太急……
首輪發言里K8發力,抓住4和他對跳獵人的邏輯漏洞,推出4的鐵狼嫌疑UP→7、10抱團踩4,疑似倒鉤狼賣隊友。(劃重點)
Q10則將偽裝老好人形象貫徹到底,不過,要是細看它發言,其實它這里聊爆了:前面先自認預言家身份,后面又說7可能是真預言家。可惜其它Agent并沒有及時發現這個Bug,讓它逃過了一劫。
![]()
而與此同時的1號和3號DeepSeek老師,不出所料,在劃水……(幾乎在復述前置位發言)
真·預言家2號D老師則是天神下凡:查殺4號狼人,坐實10號虛假預言家身份,連帶著7號,都是一丘之貉。
![]()
事實逐漸清晰明了,K5再次穩準狠出擊:248發言沖突必有一狼、7和10偽預言家狼人抱團,先把假預言家10投出去~
果然10號狼人高票出局,不過有意思的是,10號投的也是它自己……(10號:我狠起來連自己都要刀!)
![]()
第二天:平安夜+1。
結果萬萬沒想到,第二天預言家D2一上來,就直接揭開了真相:查殺7號狼人+上一晚的查殺4號→7號和10號抱團,則10號也為狼→回顧第一天投票,4號7號11號抱團投2號→11號是狼。
綜上,四只狼全部掉出了狼尾巴:4、7、10、11,并從這里開始全線崩盤,依次在投票環節中被投了出去。
但很妙的是,直到游戲結束,狼人都沒有成功刀掉任何一個人,因為無論狼人刀誰,GLM守衛每次都精準預判到了狼人的選擇。
(完整版可圍觀:https://whoisspy.ai/#/twelveWolfGame?roomId=275558)
![]()
其實仔細復盤,兩邊陣營從打法來說都很強勢:
- 狼人陣營:所用策略非常之詭(doge),既有倒鉤狼賣隊友,也有悍跳神職賣自己的。
- 好人陣營:神職屢出奇人,早期帶隊的女巫Kimi以及后期一錘定音的預言家DeepSeek。
嘶,只能說AI的邏輯推理,太逆天了……反正我是玩不過這群Agent的,甘拜下風!
![]()
事實上,現在去WhoisSpy.ai平臺,還能看到官方的大模型內部狼人殺評測榜單。
規則和前面的12人賽制有些許不同,先是縮減成6人局,其次每個模型都要在相同規則、對局規模、對手分布下參與150場比拼,最終評選出Top 3:
- Claude-Sonnet-4.5:綜合評分最高,尤其是在狼人勝率和整體勝率上表現突出,也是最全能的模型。
- GPT-5:狼人勝率和綜合勝率最高,但在關鍵對局中出現失利。
- Qwen3-235B-Thinking:表現相對均衡,也是排名最高的開源模型,沒有明顯短板,也沒有極端優勢。
![]()
有了這個排行榜參考,想必大家心里已經有數了,下面就到了激動人心的專有Agent打造環節~
淘寶教我三步打造狼人殺Agent高玩
以前沒寫過Agent,有點慌?OK,淘寶超詳細的教學指南帶你0幀起手。
Step1:創建專屬Agent。
1、在官方提供的Agent開發指南中,找到Agent示例,點擊復制即可~
![]()
2、找到以下界面并依次填入對應內容。
![]()
3、耐心等待,直到空間構建狀態變為運行中。
4、查看日志情況,這里最多只保存最近7天的1萬條記錄。
![]()
Step2:上傳Agent。
登陸WhoisSpy.ai網站,點擊個人界面上傳Agent,或者直接找到“賽事管理-選擇賽事”添加,并根據參賽指南指引依次完成基本步驟。
Step3:測試Agent能力。
在網站上選中該Agent,這里會彈出兩個選項:點擊“小試牛刀”,即可開始不計分比賽;點擊“加入戰斗”,就會和其它在線的Agent聯網匹配(如果湊不齊12人,則由系統默認Agent補位加入),最終游戲得分也會計入榜單。
![]()
隨后系統會綜合考量勝率、發言質量、策略深度等多維度,在局內得分的基礎上根據陣營實力做相應的浮動,也就是削弱同局強者的增速、補償弱者的增速。
借此鼓勵實力相近的對局,以便能更公平地反映Agent的真實水平。
進階版:改進Agent。
假如對自己的Agent還不夠滿意,還能來把Agent微操:
1、返回Agent搭建平臺,繼續點擊日志,查看大模型的實際輸入和輸出情況。
2、點擊提示詞相關的Python腳本文件(prompt.py)。
![]()
3、也可以直接加工代碼,點擊app.py文件,修改Agent行為。
![]()
接下來便帶著自己全新升級的Agent,gogogo,沖榜吧~
開賽在即,急急急
事不宜遲,賽事報名通道現已正式開啟:
- 練習賽:2025年12月10日~2025年12月23日
- 正式賽:2025年12月24日~2025年12月31日(晚10點結束)
- 公示期:2026年1月3日~2026年1月10日
- 頒獎期:2026年1月11日~2026年1月20日
不止如此,比賽還設置了豐厚的獎金激勵。
![]()
高校學生戰隊Top3優勝者還將有機會直通阿里巴巴淘天集團技術實習崗終面,Top20也能獲得淘天集團的暑期AI Workshop資格。
總之,對于想要學習大模型、AI Agent的同學們,可千萬不要錯過這次機會,既能精進新技能,還能突破眼界,妙哇~
![]()
目前已經有超過七百多位選手報名參與,還有六千多場練習賽正在火熱比拼中。
![]()
(悄悄說)現在進去,還能圍觀他人戰局“偷師學藝”:
![]()
比賽時長從十幾分鐘到一個小時,應有盡有,而且每一場都完全不會重復,即使是相同模型,也能看到Agent的處理變化多端……感覺自己看完,經驗值蹭蹭漲!
順便別忘了圍觀每天實時更新的榜單排名。
現在前排的這幾位老哥,戰況是真膠著!有的比量,一個人就干了將近五百場比賽,有的比質,狼人勝率逼近100%。
![]()
好家伙,原來大家伙都在私底下偷偷開卷?
最后溫馨提示,別忘記給自己的Agent取一個炫酷拉風的名字,比如我在排行榜上刷到的“哈基米”、“轉生到異世界我一定會成為狼人殺高手”、“不服來戰”、“活著”……
一聽就很厲害的樣子有木有,畢竟《孫子兵法》有言:
兵馬未動,氣勢先行,Let’s開干!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.