![]()
前微軟工程師正在訓練AI征服1982年的街機游戲《機器人大戰:2084》,這是一款玩家需要控制孤獨的人類對抗無盡機器人大軍的游戲,背景設定為機器人叛亂后的世界。
這個項目充滿了諷刺意味——讓AI設計策略來應對機器人大戰游戲中的瘋狂場面。
前微軟工程師戴夫·普拉默因開發任務管理器和太空彈球游戲而聞名,他此前已經成功訓練AI模型掌握了雅達利1981年的向量射擊游戲《暴風雨》。
這位退休工程師的下一個目標是《機器人大戰》。這款游戲曾讓無數玩家投入大量零花錢,卻很快在復雜的優先級沖突面前敗下陣來——既要拯救人類,又要射擊機器人,還要試圖同時完成兩個任務。游戲采用令人頭疼的雙搖桿控制系統,一個控制方向,另一個控制射擊,面對永無止境的敵人軍團。
普拉默表示:"我們已經教會了一臺機器征服《暴風雨》,這有點像教機器人優雅地擊劍。《機器人大戰》則不同,這是在教它如何在新奧爾良暴亂中打拳突圍。"
盡管這款游戲已有44年歷史(今年3月滿44周年),但《機器人大戰》仍然是一個令人上癮的快速決策和優先級排序練習。正如普拉默所說:"這是一個尖叫的1982年街機柜,試圖在每秒60幀的速度下用一百個同時發生的錯誤決策來殺死你。"
"這是關于實時系統、人類極限以及智能與反射之間差異的殘酷壓縮課程。"
在解釋AI在逐級游戲中面臨的挑戰時,普拉默說,雖然AI不會像人類那樣恐慌,但"掌握《機器人大戰》部分需要戰術,部分需要統計,部分則是在不確定性下進行分診的練習。AI不僅需要躲避,還需要理解什么值得朝著什么方向躲避。"
"我越深入研究《機器人大戰》,越覺得它是商業娛樂產品中最純粹的實時決策壓力測試之一。"
與《暴風雨》項目一樣,普拉默發布了一個實時訓練儀表板,供任何對進展感興趣的人查看。同樣像《暴風雨》一樣,觀看這個過程具有奇特的催眠效果。
普拉默說:"《機器人大戰》是一款老游戲,是的。一款出色的游戲。一款喧鬧的游戲。一款極不公平的游戲。但它也是一個實驗室。這是一個地方,30或40年前關于CPU周期、鏈表、位塊傳輸模式、跳轉表和搖桿人體工程學的設計決策突然重新擺上桌面,因為它們仍然描述著一個具有可測量行為的活躍系統。當你將AI指向它的那一刻,游戲開始重新展現自己。不是作為博物館展品,而是作為一個活躍的對手。"
或者正如任何曾經向街機投幣的人會告訴你的:這是個有點討厭的家伙。也許AI在抵御機器崛起方面會更成功。
Q&A
Q1:戴夫·普拉默是誰?他為什么要訓練AI玩游戲?
A:戴夫·普拉默是前微軟工程師,因開發任務管理器和太空彈球游戲而聞名。他正在訓練AI征服經典街機游戲《機器人大戰:2084》,這是一個有趣的技術挑戰項目。
Q2:《機器人大戰:2084》游戲有什么特殊之處?
A:這是1982年的街機游戲,玩家控制人類對抗機器人大軍。游戲采用雙搖桿控制系統,需要玩家在拯救人類和射擊機器人之間做快速決策,是實時決策和優先級排序的極佳測試。
Q3:為什么說用AI玩《機器人大戰》充滿諷刺意味?
A:因為游戲背景是人類對抗叛亂的機器人,而現在卻讓AI來設計策略征服這款關于"機器人叛亂"的游戲,這種角色反轉具有強烈的諷刺色彩。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.