<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      AI狼人殺大決戰!GPT、Qwen、DeepSeek大亂斗,人類高玩汗流浹背

      0
      分享至

      鷺羽 發自 凹非寺
      量子位 | 公眾號 QbitAI

      我真栓Q了!圍觀了場狼人殺,看得我汗流浹背……

      半小時全程高能,根本停不下來:

      天崩開局倒鉤狼悍跳預言家、沖鋒狼死于話多、神職上大分每晚都是平安夜。

      結果你跟我說,這些玩家都是AI???



      果然會玩還得看淘寶~最近他們整活的這個AI狼人殺大亂斗WhoisSpy.ai,大模型在里面簡直咔咔亂殺。

      D老師、Qwen、Kimi、GLM一個個都化身心機boy推拉博弈,be like:

      • 六邊形戰士Kimi:武力值MAX,第六感Next Level。
      • 老實人DeepSeek:雖然我只是一介平民,雖然我只會劃水,但我相信跟對人走對路,奧利給!
      • 喜劇人Qwen:如果大家都Pick我,那我也要票自己QAQ。
      • 通天代GLM:沉默寡言但實力不詳。


      視頻鏈接:https://mp.weixin.qq.com/s/cckQp_UCdwrQk2wEP3Uemg

      不過u1s1,雖然這些Agent看似性格迥異,實則一個個都是狼人殺高玩來著。

      而且門檻也不高,自己就能手搓一個出來。

      是不是有點手癢了?

      (咳咳)不賣關子了,這就是我最近刷到的一個AI狼人殺比賽,還是淘寶辦的——首屆「高校生VS開發者對抗賽」



      展開來說,就是淘寶發了個召集令,廣邀高校學生和AI開發者,帶著自家Agent來真刀實槍碰一場,看看誰的Agent思維更縝密、更會盤邏輯。

      至于為什么選擇狼人殺這個場景?

      它可不僅僅“好玩”,而且夠“燒腦”——相比于傳統的大模型測評,狼人殺需要更長時間頭腦在線和持續的推理博弈,非常適合擔任天然的Agent試驗場。


      圖片由AI生成

      畢竟是騾子是馬,總要拉出來練練,更何況同學們的靈光一現碰撞上成熟的產業經驗,說不定真能產生些奇妙的化學反應?(doge)

      所以本次比賽,選手將自動分為高校學生開發者兩大陣營PK對決,參賽選手可以根據官方提供的開發指南,訓練自己的Agent學習狼人殺知識,一步步培養它化身游戲高玩~

      而且門檻低,就算是編程小白也能報名參加吼!

      (報名指路官網https://whoisspy.ai)

      所以究竟是初出茅廬的高校學子不怕虎,還是手法老道的班味碼農更勝一籌,誰能率先調教出智慧和演技兼備的新任Agent狼王?

      搓搓手,我已經迫不及待一決高下了。



      Qwen悍跳賣隊友,Kimi運籌帷幄賽諸葛

      言歸正傳,咱先來捋一捋這場比賽背后的競技場平臺WhoisSpy.ai

      畢竟Agent玩狼人殺、玩得比我這個十年老玩家還6這事,我是真有點破防,所以先來康康這到底是個啥?

      官方title:全球首個實時對戰、開放可擴展的多智能體游戲平臺。

      中譯中一下就是,它能夠讓多個Agent在同一時間、同一空間里打游戲,還能源源不斷地向里面添加新Agent。



      怎么實現的呢?靠大模型的社交推理和博弈能力。

      AI將模擬游戲玩家,在多輪心理戰交互后,一層層剝開自己的偽裝,展示自己真實的決策水平。

      目前,WhoisSpy.ai支持中英文雙版,不僅能玩「狼人殺」,還有驚險刺激的「誰是臥底」。


      圖片由AI生成

      這次的高校生VS開發者對抗賽也是平臺最新推出的重頭戲,玩法很簡單:經典的12人狼王守衛版型,8個好人、4匹狼。

      其中好人陣營又分四個神職(預言家、女巫、獵人、守衛)和四個平民,狼人陣營里隱藏著一只狼王。

      一旦好人數量減少到比狼人還少,那么狼人獲勝,反過來如果狼全部出局,則好人勝利。

      需要注意的是,為了防止AI無限制地嘮下去,規則還做了一丟丟微調:

      • 規定Agent每次最多說240個漢字,多了的部分系統直接砍掉,不予顯示。
      • 每次發言限時90s,兩次機會,如果兩次都沒有返回正常結果,就自動判定為此輪發言失敗。1小時內失敗次數多的Agent,還會直接被系統清退。
      • 每局最長限制到8輪,如果到第八天還有狼人存活,則默認狼人獲勝。



      都說知己知彼,百戰不殆,下面復盤比賽走起~



      前情提要,4號狼王,7號、10號、11號是狼,2號預言家、5號女巫、8號獵人、12號守衛。

      第一天:平安夜。

      神職身份的5號Kimi率先亮出女巫ID,立馬優先掌握話語權:Follow me!

      而K老師也是不負眾望,給出了自己的直覺判斷:先發3號一瓶存疑的銀水,提前預警7和10。(K老師的直覺強得可怕)



      突然被踩中尾巴的7號小狼Qwen,也是迅速反應過來,禍水東引,將矛頭對準了自己的狼隊友。

      但這一招也讓它暴露在8號獵人的視線里。



      另一個狼人10號Q老師則迅速悍跳預言家,給7號假發金水。

      “無辜躺槍”的4號Qwen狼王此刻仰天長嘯:本是同根生,相煎何太急……

      首輪發言里K8發力,抓住4和他對跳獵人的邏輯漏洞,推出4的鐵狼嫌疑UP→7、10抱團踩4,疑似倒鉤狼賣隊友。(劃重點)

      Q10則將偽裝老好人形象貫徹到底,不過,要是細看它發言,其實它這里聊爆了:前面先自認預言家身份,后面又說7可能是真預言家。可惜其它Agent并沒有及時發現這個Bug,讓它逃過了一劫。



      而與此同時的1號和3號DeepSeek老師,不出所料,在劃水……(幾乎在復述前置位發言)

      真·預言家2號D老師則是天神下凡:查殺4號狼人,坐實10號虛假預言家身份,連帶著7號,都是一丘之貉。



      事實逐漸清晰明了,K5再次穩準狠出擊:248發言沖突必有一狼、7和10偽預言家狼人抱團,先把假預言家10投出去~

      果然10號狼人高票出局,不過有意思的是,10號投的也是它自己……(10號:我狠起來連自己都要刀!)



      第二天:平安夜+1。

      結果萬萬沒想到,第二天預言家D2一上來,就直接揭開了真相:查殺7號狼人+上一晚的查殺4號7號和10號抱團,則10號也為狼→回顧第一天投票,4號7號11號抱團投2號→11號是狼。

      綜上,四只狼全部掉出了狼尾巴:4、7、10、11,并從這里開始全線崩盤,依次在投票環節中被投了出去。

      但很妙的是,直到游戲結束,狼人都沒有成功刀掉任何一個人,因為無論狼人刀誰,GLM守衛每次都精準預判到了狼人的選擇。

      (完整版可圍觀:https://whoisspy.ai/#/twelveWolfGame?roomId=275558)



      其實仔細復盤,兩邊陣營從打法來說都很強勢:

      • 狼人陣營:所用策略非常之詭(doge),既有倒鉤狼賣隊友,也有悍跳神職賣自己的。
      • 好人陣營:神職屢出奇人,早期帶隊的女巫Kimi以及后期一錘定音的預言家DeepSeek。

      嘶,只能說AI的邏輯推理,太逆天了……反正我是玩不過這群Agent的,甘拜下風!



      事實上,現在去WhoisSpy.ai平臺,還能看到官方的大模型內部狼人殺評測榜單

      規則和前面的12人賽制有些許不同,先是縮減成6人局,其次每個模型都要在相同規則、對局規模、對手分布下參與150場比拼,最終評選出Top 3:

      • Claude-Sonnet-4.5:綜合評分最高,尤其是在狼人勝率和整體勝率上表現突出,也是最全能的模型。
      • GPT-5:狼人勝率和綜合勝率最高,但在關鍵對局中出現失利。
      • Qwen3-235B-Thinking:表現相對均衡,也是排名最高的開源模型,沒有明顯短板,也沒有極端優勢。



      有了這個排行榜參考,想必大家心里已經有數了,下面就到了激動人心的專有Agent打造環節~

      淘寶教我三步打造狼人殺Agent高玩

      以前沒寫過Agent,有點慌?OK,淘寶超詳細的教學指南帶你0幀起手

      Step1:創建專屬Agent。

      1、在官方提供的Agent開發指南中,找到Agent示例,點擊復制即可~



      2、找到以下界面并依次填入對應內容。



      3、耐心等待,直到空間構建狀態變為運行中。

      4、查看日志情況,這里最多只保存最近7天的1萬條記錄。



      Step2:上傳Agent。

      登陸WhoisSpy.ai網站,點擊個人界面上傳Agent,或者直接找到“賽事管理-選擇賽事”添加,并根據參賽指南指引依次完成基本步驟。

      Step3:測試Agent能力。

      在網站上選中該Agent,這里會彈出兩個選項:點擊“小試牛刀”,即可開始不計分比賽;點擊“加入戰斗”,就會和其它在線的Agent聯網匹配(如果湊不齊12人,則由系統默認Agent補位加入),最終游戲得分也會計入榜單。



      隨后系統會綜合考量勝率發言質量策略深度等多維度,在局內得分的基礎上根據陣營實力做相應的浮動,也就是削弱同局強者的增速、補償弱者的增速。

      借此鼓勵實力相近的對局,以便能更公平地反映Agent的真實水平。

      進階版:改進Agent。

      假如對自己的Agent還不夠滿意,還能來把Agent微操:

      1、返回Agent搭建平臺,繼續點擊日志,查看大模型的實際輸入和輸出情況。

      2、點擊提示詞相關的Python腳本文件(prompt.py)。



      3、也可以直接加工代碼,點擊app.py文件,修改Agent行為。



      接下來便帶著自己全新升級的Agent,gogogo,沖榜吧~

      開賽在即,急急急

      事不宜遲,賽事報名通道現已正式開啟:

      • 練習賽:2025年12月10日~2025年12月23日
      • 正式賽:2025年12月24日~2025年12月31日(晚10點結束)
      • 公示期:2026年1月3日~2026年1月10日
      • 頒獎期:2026年1月11日~2026年1月20日

      不止如此,比賽還設置了豐厚的獎金激勵。



      高校學生戰隊Top3優勝者還將有機會直通阿里巴巴淘天集團技術實習崗終面,Top20也能獲得淘天集團的暑期AI Workshop資格

      總之,對于想要學習大模型、AI Agent的同學們,可千萬不要錯過這次機會,既能精進新技能,還能突破眼界,妙哇~



      目前已經有超過七百多位選手報名參與,還有六千多場練習賽正在火熱比拼中。



      (悄悄說)現在進去,還能圍觀他人戰局“偷師學藝”:



      比賽時長從十幾分鐘到一個小時,應有盡有,而且每一場都完全不會重復,即使是相同模型,也能看到Agent的處理變化多端……感覺自己看完,經驗值蹭蹭漲!

      順便別忘了圍觀每天實時更新的榜單排名。

      現在前排的這幾位老哥,戰況是真膠著!有的比量,一個人就干了將近五百場比賽,有的比質,狼人勝率逼近100%。



      好家伙,原來大家伙都在私底下偷偷開卷

      最后溫馨提示,別忘記給自己的Agent取一個炫酷拉風的名字,比如我在排行榜上刷到的“哈基米”、“轉生到異世界我一定會成為狼人殺高手”、“不服來戰”、“活著”……

      一聽就很厲害的樣子有木有,畢竟《孫子兵法》有言:

      兵馬未動,氣勢先行,Let’s開干!

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      擺爛3年的馬刺,熬出頭了!現排名西部第二,天賦比雷霆更恐怖

      擺爛3年的馬刺,熬出頭了!現排名西部第二,天賦比雷霆更恐怖

      籃球看比賽
      2025-12-23 12:07:01
      瘋狂!范曾題字“湖平如鏡”:照出徐家“產學研一體化”文物掠奪

      瘋狂!范曾題字“湖平如鏡”:照出徐家“產學研一體化”文物掠奪

      大江看潮
      2025-12-23 09:45:16
      金正恩拒見高市,朝鮮告知全球,給日本換了新名字,使用獨特稱謂

      金正恩拒見高市,朝鮮告知全球,給日本換了新名字,使用獨特稱謂

      萬國明信片
      2025-12-23 14:01:59
      愛馬仕繼承人被騙光千億身家,他犯的這個錯,我們普通人都會遇到

      愛馬仕繼承人被騙光千億身家,他犯的這個錯,我們普通人都會遇到

      阿訊說天下
      2025-12-07 01:13:21
      勸你一句:少吃外面的飯,真的不太干凈!

      勸你一句:少吃外面的飯,真的不太干凈!

      新住家居
      2025-12-01 22:16:53
      佛山南海公示12所民辦園停辦

      佛山南海公示12所民辦園停辦

      南方都市報
      2025-12-23 07:08:21
      三節三雙早早打卡!約基奇又迎4里程碑太輕松 開場花穆雷邪魅一笑

      三節三雙早早打卡!約基奇又迎4里程碑太輕松 開場花穆雷邪魅一笑

      顏小白的籃球夢
      2025-12-23 12:14:25
      F3演唱會出意外!這一次,阿信的意外摔倒,揭開朱孝天僅剩的體面

      F3演唱會出意外!這一次,阿信的意外摔倒,揭開朱孝天僅剩的體面

      青史樓蘭
      2025-12-23 11:00:50
      原子彈炸后百年內寸草不生,今廣島卻住滿了人,說好的百年絕地呢?

      原子彈炸后百年內寸草不生,今廣島卻住滿了人,說好的百年絕地呢?

      歷史回憶室
      2025-12-20 11:14:14
      為何很多女性如此渴望性生活?無非是這4個原因,男性也無需害怕

      為何很多女性如此渴望性生活?無非是這4個原因,男性也無需害怕

      特約前排觀眾
      2025-07-02 07:18:22
      澳門回歸前,富商馬萬祺前來提醒:請向中央反映,澳門必須駐軍

      澳門回歸前,富商馬萬祺前來提醒:請向中央反映,澳門必須駐軍

      壹知眠羊
      2025-12-19 07:17:58
      日本剛宣布干擾衛星技術大突破,南京和舊金山就出問題了,巧合?

      日本剛宣布干擾衛星技術大突破,南京和舊金山就出問題了,巧合?

      青青子衿
      2025-12-22 09:00:57
      舊金山全城癱瘓!Waymo斷電變「廢鐵」,馬斯克純視覺贏麻了

      舊金山全城癱瘓!Waymo斷電變「廢鐵」,馬斯克純視覺贏麻了

      新智元
      2025-12-22 17:36:47
      Here we go!羅馬諾:恩德里克純租借加盟里昂至賽季結束

      Here we go!羅馬諾:恩德里克純租借加盟里昂至賽季結束

      懂球帝
      2025-12-23 02:42:06
      16GB+1TB!新機官宣:12月26日,全新上市

      16GB+1TB!新機官宣:12月26日,全新上市

      科技堡壘
      2025-12-21 11:37:47
      官方披露:華夏銀行原董事長李民吉嚴重違紀違法

      官方披露:華夏銀行原董事長李民吉嚴重違紀違法

      觀察者網
      2025-12-22 22:13:15
      方媛太拼了!產后現身杭州商演撈金,和溫碧霞同框氣質上略占上風

      方媛太拼了!產后現身杭州商演撈金,和溫碧霞同框氣質上略占上風

      娛樂團長
      2025-12-22 20:02:42
      《江南春》的買家終于被扒出來了

      《江南春》的買家終于被扒出來了

      大張的自留地
      2025-12-21 13:52:31
      被兄弟"做局"奪走300億公司,坐牢10年的賭徒CEO出來了

      被兄弟"做局"奪走300億公司,坐牢10年的賭徒CEO出來了

      帥真商業
      2025-12-16 21:08:37
      4億美元成本,《阿凡達3》北美奪冠,悉尼妹甜茶新片均沖進前10了

      4億美元成本,《阿凡達3》北美奪冠,悉尼妹甜茶新片均沖進前10了

      電影票房預告片
      2025-12-22 18:12:41
      2025-12-23 15:43:00
      量子位 incentive-icons
      量子位
      追蹤人工智能動態
      11903文章數 176341關注度
      往期回顧 全部

      游戲要聞

      父子二人設的局?一家子在外吃壽司,卻買了一臺Switch 2回家

      頭條要聞

      一名捐精者的致癌精子"生"下200個孩子 有孩子已去世

      頭條要聞

      一名捐精者的致癌精子"生"下200個孩子 有孩子已去世

      體育要聞

      楊瀚森連續5場DNP!開拓者遭活塞雙殺

      娛樂要聞

      阿信發聲報平安,曬演唱會向F3索吻畫面

      財經要聞

      直播間涉黃?快手:遭到黑灰產攻擊已報警

      科技要聞

      慘烈90分鐘!快手驚魂:遭遇最強黑產攻擊

      汽車要聞

      四款新車集中發布 星途正式走進3.0時代

      態度原創

      健康
      親子
      手機
      房產
      教育

      這些新療法,讓化療不再那么痛苦

      親子要聞

      52歲王小騫淚談早產經歷,孕8個月羊水早破,住院保胎10天剖宮產

      手機要聞

      雷軍詳解小米17 Ultra兩億像素:與相機變焦鏡頭技術原理一脈相承

      房產要聞

      獨家猛料!16.1億,浙江老板搶下雅居樂清水灣261畝重磅宅地!

      教育要聞

      華羅庚競賽題,計算根號6減去根號5的值

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 99久久精品美女高潮喷水| 国产精品18久久久久久麻辣| 欧美成人秋霞久久aa片| 国产sm重味一区二区三区| 亚洲香蕉av一区二区蜜桃| 91人人操| 丰满人妻在线一区二区三区视频53| 亚洲原创无码| 怼嫩草白浆国产一区| 免费无遮挡无码永久视频| 亚洲AV无码成人| 亚洲成人综合导航| 国产日产亚洲系列av| 国产精品成人va在线观看| 久久久久99精品成人片| 黄色综合网| 99精品丰满人妻无码| 鹤峰县| 永久免费mv入口| 亚洲精品成人网| 性色av无码久久一区二区三区| 粗大猛烈进出高潮视频| 真人作爱免费视频| 中文字幕乱码人妻无码偷偷| 亚洲无码色| 日韩一区二区三区日韩精品| 国产精品原创不卡在线| 6699嫩草久久久精品影院| 国产av国片精品有毛| 性中国videossexo另类| 夜夜躁狠狠躁2021| 台湾佬中文娱乐22vvvv| 又粗又大网站| 亚洲日韩第三页| 精品一区二区三人妻视频| 麻豆精品久久久久久久99蜜桃| 亚洲精品之国产av| 亚洲欧洲人妻| 国产精品日本一区二区在线播放 | 蜜桃精品成人影片| 婷婷五月激情综合|