把AI丟進開放世界游戲,它能活多久?英偉達的答案是:不僅活得下去,還能自己寫攻略。
Voyager這個項目,本質(zhì)上是在Minecraft里養(yǎng)了一個"會記筆記的探險家"。它不像傳統(tǒng)AI那樣靠海量數(shù)據(jù)預訓練,而是邊玩邊學——挖到鉆石就記下來,被苦力怕炸死也記下來,慢慢攢出一套自己的生存手冊。
這套手冊分三層。最底層是"肌肉記憶":怎么合成工作臺、怎么搭柱子躲僵尸,這些基礎(chǔ)操作被寫成可執(zhí)行代碼存進技能庫。中間層是"任務規(guī)劃":發(fā)現(xiàn)鐵礦→做鐵鎬→挖鉆石,把目標拆解成步驟。最上層是"終身學習":遇到?jīng)]見過的地形,自動觸發(fā)探索模式,把新發(fā)現(xiàn)歸檔。
三個庫互相喂數(shù)據(jù)。執(zhí)行庫跑通了新操作,就反饋給任務庫當素材;任務庫驗證了某個策略可行,再往上沉淀到終身學習庫。有點像游戲里的天賦樹,但點數(shù)是AI自己刷的。
實驗跑了7輪,Voyager解鎖的物品數(shù)量是同類AI的5倍以上。更關(guān)鍵的是它"不死板"——同樣的"造房子"指令,第一次用木頭,第二次可能換成石頭,全看當時手里有什么。
研究團隊放出的日志里有個細節(jié):某次AI為了過河,先嘗試游泳被溺死,第二次自動切換成造橋方案。沒人教它"Plan B",這是從失敗記錄里自己長出來的。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.