<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      DeepMind打造多游戲通用智能體SIMA 2,讓AI在虛擬世界中自我訓(xùn)練

      0
      分享至

      《山羊模擬器 3》(Goat Simulator 3)這款以混亂、荒誕著稱的游戲,其物理引擎的不可預(yù)測(cè)性曾讓無(wú)數(shù)玩家啼笑皆非。如今,谷歌成功讓這款游戲成為了他們最新 AI Agent 泛化能力的試驗(yàn)場(chǎng)。

      11 月 13 日,DeepMind 正式發(fā)布 SIMA 2(Scalable Instructable Multiworld Agent,可擴(kuò)展的可指令多世界智能體),這個(gè)集成了 Gemini 大語(yǔ)言模型的新一代智能體,不僅能在《無(wú)人深空》的浩瀚星際中導(dǎo)航,也能在《山羊模擬器 3》的混亂世界里完成任務(wù)。這種跨越虛擬環(huán)境的能力,被 DeepMind 稱為“邁向通用人工智能的重要一步”。

      2024 年 3 月,DeepMind 首次發(fā)布了 SIMA 的初代版本。當(dāng)時(shí)的 SIMA 1 已經(jīng)算是一個(gè)突破——它能夠跨越《無(wú)人深空》《山羊模擬器 3》等八款商業(yè)游戲執(zhí)行基本指令,僅通過(guò)觀察屏幕像素和使用虛擬鍵鼠操作,無(wú)需訪問(wèn)游戲的底層代碼。但其 31% 的復(fù)雜任務(wù)完成率暴露了根本性的瓶頸:這個(gè)系統(tǒng)更像一個(gè)執(zhí)行器而非思考者,面對(duì)“找到營(yíng)火”這樣簡(jiǎn)單的目標(biāo)時(shí),它只能機(jī)械地嘗試各種操作,缺乏真正的理解和規(guī)劃能力。

      SIMA 2 的核心改變是整合了 Gemini 2.5 flash-lite 模型作為推理引擎。Gemini 的語(yǔ)言理解和推理能力與 SIMA 的 embodied skills(具身技能)深度融合,使得 Agent 能夠理解高層目標(biāo)、制定多步計(jì)劃,并在執(zhí)行過(guò)程中與用戶對(duì)話解釋自己的思路。在新的基準(zhǔn)測(cè)試中,SIMA 2 在訓(xùn)練過(guò)的游戲環(huán)境中達(dá)到了 65% 的成功率,幾乎是前代的兩倍,與人類玩家 75% 的基準(zhǔn)線已經(jīng)相當(dāng)接近。

      這種性能提升的背后是架構(gòu)層面的重新設(shè)計(jì)。SIMA 2 的訓(xùn)練數(shù)據(jù)不再完全依賴人類游戲演示錄像,而是混合了人類標(biāo)注和 Gemini 生成的任務(wù)描述。當(dāng)智能體觀察到游戲畫面中的某個(gè)場(chǎng)景時(shí),Gemini 模型會(huì)同時(shí)生成對(duì)該場(chǎng)景的語(yǔ)義理解和可能的行動(dòng)方案。這種訓(xùn)練方式的一個(gè)直接結(jié)果是,SIMA 2 現(xiàn)在能夠用自然語(yǔ)言描述它的意圖和推理過(guò)程。在《無(wú)人深空》的演示中,當(dāng)被要求“前往看起來(lái)像成熟番茄的房子”時(shí),智能體會(huì)明確說(shuō)明:“成熟的番茄是紅色的,所以我應(yīng)該去紅色的房子”——這種顯式推理正是 Gemini 帶來(lái)的質(zhì)變。

      多模態(tài)交互能力也有提升。SIMA 2 可以理解文字、語(yǔ)音、手繪草圖,甚至 emoji。當(dāng)用戶發(fā)送斧頭和樹木的 emoji 時(shí),智能體能理解這意味著“砍樹”。這種能力來(lái)自 Gemini 的多模態(tài)架構(gòu),但關(guān)鍵是 DeepMind 找到了將抽象符號(hào)與游戲動(dòng)作連接的方法,系統(tǒng)理解斧頭是工具、樹木是可交互對(duì)象、兩者組合意味著特定行動(dòng)序列。

      SIMA 2 最重要的創(chuàng)新之一是其自我改進(jìn)機(jī)制。與 SIMA 1 完全依賴人類游戲數(shù)據(jù)不同,SIMA 2 在獲得初始的人類演示基線后,能夠轉(zhuǎn)向自主學(xué)習(xí)。當(dāng)團(tuán)隊(duì)將智能體放入新環(huán)境時(shí),系統(tǒng)會(huì)調(diào)用另一個(gè) Gemini 模型來(lái)生成新任務(wù),并使用單獨(dú)的獎(jiǎng)勵(lì)模型對(duì)智能體的嘗試進(jìn)行評(píng)分。

      通過(guò)這些自生成的經(jīng)驗(yàn)作為訓(xùn)練數(shù)據(jù),智能體能從自己的錯(cuò)誤中學(xué)習(xí),逐步提升性能,本質(zhì)上是在 AI 反饋而非人類反饋的引導(dǎo)下,像人類一樣通過(guò)試錯(cuò)來(lái)教會(huì)自己新行為。這種自我改進(jìn)循環(huán)在與 Genie 3(DeepMind 的世界生成模型)結(jié)合時(shí)能發(fā)揮更大的作用:在 Genie 3 實(shí)時(shí)生成的全新 3D 環(huán)境中,SIMA 2 展現(xiàn)出了前所未有的適應(yīng)能力,能夠在從未見過(guò)的世界中理解用戶指令并采取有意義的行動(dòng)。

      在從未訓(xùn)練過(guò)的 MineDojo(Minecraft 的研究實(shí)現(xiàn)版本)和 ASKA 游戲中,SIMA 2 的成功率相較第一代分別提升了 13% 和 12%。雖然仍然只有不到 15% 的水平,但考慮到智能體此前從未見過(guò)這些游戲的任何畫面或機(jī)制,這個(gè)表現(xiàn)已經(jīng)相對(duì)可觀。


      (來(lái)源:Google)

      更重要的是,它展示了概念遷移的能力——在《無(wú)人深空》中學(xué)到的“采集資源”概念可以遷移到 MineDojo 中的“挖礦”,在《英靈神殿》中學(xué)到的“使用工具”可以應(yīng)用到 ASKA 的“裝備武器”。這種跨環(huán)境的知識(shí)遷移,對(duì)于提升 AI 的真正智能來(lái)說(shuō)至關(guān)重要。

      DeepMind 在游戲 AI 上有長(zhǎng)期積累,從 AlphaGo 到 AlphaStar,每一步都在推進(jìn) AI 的邊界。不過(guò),讓單一系統(tǒng)掌握多種游戲一直是個(gè)難題。紐約大學(xué)的 AI 研究員 Julian Togelius 提到,之前的嘗試效果不太理想,因?yàn)閮H通過(guò)觀看屏幕來(lái)實(shí)時(shí)控制多個(gè)游戲本身就很困難。他特別指出 DeepMind 之前的 GATO 系統(tǒng),當(dāng)時(shí)宣傳力度很大,但實(shí)際上未能在足夠多的虛擬環(huán)境中轉(zhuǎn)移技能。

      現(xiàn)在的問(wèn)題是,SIMA 2 能否避免重蹈覆轍?目前來(lái)看,它仍有幾個(gè)比較明顯的限制。它在需要多步驟和長(zhǎng)時(shí)間的復(fù)雜任務(wù)上仍有困難。為了提高響應(yīng)速度,團(tuán)隊(duì)削減了長(zhǎng)期記憶,它只記得最近的交互。在使用鼠標(biāo)鍵盤方面,它還是遠(yuǎn)不如人類。阿爾伯塔大學(xué)的 Matthew Guzdial 向《麻省理工科技評(píng)論》表示:大多數(shù)游戲的鍵鼠控制很相似,學(xué)會(huì)一個(gè)就學(xué)會(huì)了全部,“如果給它一個(gè)輸入方式怪異的游戲,我認(rèn)為它表現(xiàn)不會(huì)好?!彼€質(zhì)疑這些技能能否遷移到機(jī)器人上——游戲視覺是為人類設(shè)計(jì)的、易于解析,真實(shí)世界的攝像頭輸入要復(fù)雜得多。

      這觸及了具身智能(Embodied AI)領(lǐng)域的核心難題:模擬到現(xiàn)實(shí)的鴻溝(sim-to-real gap)。虛擬環(huán)境提供了安全、可控、低成本的訓(xùn)練場(chǎng)所,但它與現(xiàn)實(shí)世界有本質(zhì)差異。Togelius 對(duì)此持更開放的看法。他認(rèn)為真實(shí)世界既更難也更容易。更難是因?yàn)槲锢斫换サ膹?fù)雜性——你不能按個(gè)鍵就開門。但同時(shí),真實(shí)世界的機(jī)器人清楚知道自己身體的能力邊界,而游戲里每個(gè)虛擬世界的規(guī)則都不同。

      DeepMind 的研究工程師 Frederic Besse 在新聞發(fā)布會(huì)上給出了他們的思路:將機(jī)器人系統(tǒng)分為兩層:上層是 SIMA 2 這樣的“認(rèn)知層”,負(fù)責(zé)理解任務(wù)、推理和規(guī)劃;下層是專門的運(yùn)動(dòng)控制系統(tǒng),負(fù)責(zé)關(guān)節(jié)運(yùn)動(dòng)、力控制等底層執(zhí)行。這種分層架構(gòu)在工業(yè)界已有先例,如 NVIDIA 的 Isaac 機(jī)器人平臺(tái)就采用類似設(shè)計(jì)。理論上,SIMA 2 學(xué)到的“找到紅色物體”“使用工具”“導(dǎo)航到目標(biāo)”等高層技能是跨越虛擬和現(xiàn)實(shí)的,而關(guān)鍵是如何將這些抽象能力映射到物理動(dòng)作上。對(duì)此,我們尚保持謹(jǐn)慎的樂觀。

      但無(wú)論如何,SIMA 2 所展示的研究方向還是非常具有價(jià)值的:用多樣化的虛擬環(huán)境訓(xùn)練、用大語(yǔ)言模型增強(qiáng)推理、用自我改進(jìn)減少對(duì)人類數(shù)據(jù)的依賴。這個(gè)方向的可行性和上限值得期待,但也還需要更多研究來(lái)驗(yàn)證。它是具身 AI 領(lǐng)域的一個(gè)重要節(jié)點(diǎn),但不是終點(diǎn)。虛擬世界與真實(shí)世界之間的鴻溝,在可預(yù)見的未來(lái)仍然存在。

      目前,SIMA 2 僅作為“有限研究預(yù)覽”發(fā)布,只向小范圍的學(xué)術(shù)機(jī)構(gòu)和游戲開發(fā)者開放訪問(wèn)。



      參考資料:

      1.https://deepmind.google/blog/sima-2-an-agent-that-plays-reasons-and-learns-with-you-in-virtual-3d-worlds/

      2.https://www.technologyreview.com/2025/11/13/1127921/google-deepmind-is-using-gemini-to-train-agents-inside-goat-simulator-3/

      運(yùn)營(yíng)/排版:何晨龍

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      湖南煙花店老板放煙花自殺事件后續(xù)來(lái)了:真相大白,令人唏噓

      湖南煙花店老板放煙花自殺事件后續(xù)來(lái)了:真相大白,令人唏噓

      復(fù)轉(zhuǎn)這些年
      2025-12-07 18:02:55
      開始上強(qiáng)度了,就差直接發(fā)射!日本F15被照后,轉(zhuǎn)頭就找美國(guó)哭訴

      開始上強(qiáng)度了,就差直接發(fā)射!日本F15被照后,轉(zhuǎn)頭就找美國(guó)哭訴

      青青子衿
      2025-12-08 02:32:59
      為烏克蘭捐款的明星名人有哪些?

      為烏克蘭捐款的明星名人有哪些?

      難得君
      2025-12-07 00:21:21
      太美了!為馬克龍獻(xiàn)花的川大女孩身份曝光!顏值極高,還是學(xué)霸!

      太美了!為馬克龍獻(xiàn)花的川大女孩身份曝光!顏值極高,還是學(xué)霸!

      鋭娛之樂
      2025-12-07 20:53:34
      華為Mate X7在出廠前經(jīng)歷了什么?來(lái)場(chǎng)深度體檢看看

      華為Mate X7在出廠前經(jīng)歷了什么?來(lái)場(chǎng)深度體檢看看

      極果酷玩
      2025-12-05 12:56:25
      全網(wǎng)封禁后在海外發(fā)聲?陳震的迷之操作,撞上央視的整治槍口

      全網(wǎng)封禁后在海外發(fā)聲?陳震的迷之操作,撞上央視的整治槍口

      雷科技
      2025-12-07 13:15:52
      爆砍29+7+6,詹姆斯打爆喬治!東契奇怒砍3雙,湖人重回西部第2

      爆砍29+7+6,詹姆斯打爆喬治!東契奇怒砍3雙,湖人重回西部第2

      籃球圈里的那些事
      2025-12-08 11:48:12
      15連勝本季最長(zhǎng)!雷霆大勝爵士24戰(zhàn)23勝 亞歷山大缺席雙少50分

      15連勝本季最長(zhǎng)!雷霆大勝爵士24戰(zhàn)23勝 亞歷山大缺席雙少50分

      醉臥浮生
      2025-12-08 11:31:23
      海參崴本該在1995年歸還中國(guó)斯大林親筆簽名同意,后來(lái)為何黃了?

      海參崴本該在1995年歸還中國(guó)斯大林親筆簽名同意,后來(lái)為何黃了?

      霹靂炮
      2025-12-06 21:45:58
      iPhone 17 Pro官方降價(jià)

      iPhone 17 Pro官方降價(jià)

      大象新聞
      2025-12-08 11:30:46
      黃一鳴帶女兒醫(yī)院看病,意外曝光女兒名字,網(wǎng)友:王思聰會(huì)后悔的

      黃一鳴帶女兒醫(yī)院看病,意外曝光女兒名字,網(wǎng)友:王思聰會(huì)后悔的

      小咪侃娛圈
      2025-12-08 09:04:58
      三大賽第三套大滿貫!塞爾比10-8特魯姆普,9年后再奪英錦賽冠軍

      三大賽第三套大滿貫!塞爾比10-8特魯姆普,9年后再奪英錦賽冠軍

      全景體育V
      2025-12-08 07:07:05
      江蘇少婦出軌已婚男同事:高顏值照曝光,少婦一句話爭(zhēng)議大

      江蘇少婦出軌已婚男同事:高顏值照曝光,少婦一句話爭(zhēng)議大

      老貓觀點(diǎn)
      2025-12-08 10:27:14
      要是10年內(nèi)經(jīng)濟(jì)持續(xù)下行,普通老百姓該怎么面對(duì)?

      要是10年內(nèi)經(jīng)濟(jì)持續(xù)下行,普通老百姓該怎么面對(duì)?

      經(jīng)濟(jì)學(xué)教授V
      2025-12-07 18:07:14
      痛心!連霍高速十幾車連撞9死7傷,現(xiàn)場(chǎng)曝光十分慘烈,網(wǎng)友求改名

      痛心!連霍高速十幾車連撞9死7傷,現(xiàn)場(chǎng)曝光十分慘烈,網(wǎng)友求改名

      派大星紀(jì)錄片
      2025-12-07 11:46:14
      越老越妖!詹姆斯末節(jié)13分,助湖人4分險(xiǎn)勝,這一戰(zhàn)我看清6大球星

      越老越妖!詹姆斯末節(jié)13分,助湖人4分險(xiǎn)勝,這一戰(zhàn)我看清6大球星

      籃球看比賽
      2025-12-08 11:47:04
      跟風(fēng)被咀嚼過(guò)的《芳華》,一場(chǎng)庸眾的鬧劇

      跟風(fēng)被咀嚼過(guò)的《芳華》,一場(chǎng)庸眾的鬧劇

      關(guān)爾東
      2025-12-07 12:44:17
      楊瀚森閃耀NBA!絲滑轉(zhuǎn)身暴扣,連得4分!賽后斯普利特作出評(píng)價(jià)

      楊瀚森閃耀NBA!絲滑轉(zhuǎn)身暴扣,連得4分!賽后斯普利特作出評(píng)價(jià)

      球場(chǎng)沒跑道
      2025-12-08 09:50:39
      26歲閔超已任浙江大學(xué)博導(dǎo)

      26歲閔超已任浙江大學(xué)博導(dǎo)

      極目新聞
      2025-12-08 10:18:43
      馬斯克被干懵了:特斯拉全球第4,前3全是中國(guó)車,小米都排第7了

      馬斯克被干懵了:特斯拉全球第4,前3全是中國(guó)車,小米都排第7了

      互聯(lián)網(wǎng).亂侃秀
      2025-12-07 11:37:05
      2025-12-08 12:00:49
      DeepTech深科技 incentive-icons
      DeepTech深科技
      麻省理工科技評(píng)論獨(dú)家合作
      15954文章數(shù) 514349關(guān)注度
      往期回顧 全部

      科技要聞

      萬(wàn)億蘋果,正在經(jīng)歷一場(chǎng)嚴(yán)重的“大失血”

      頭條要聞

      媒體:美國(guó)重返西半球 若從亞太撤離或挑撥中日干一架

      頭條要聞

      媒體:美國(guó)重返西半球 若從亞太撤離或挑撥中日干一架

      體育要聞

      厲害的后衛(wèi)何其多 想想還少了哪一個(gè)

      娛樂要聞

      郭麒麟也救不了的德云社了?

      財(cái)經(jīng)要聞

      養(yǎng)牛場(chǎng)未見一頭牛 每天開采礦石倒賣

      汽車要聞

      挑戰(zhàn)深圳地獄級(jí)路況 魏牌藍(lán)山VLA上車會(huì)思考聽得懂人話

      態(tài)度原創(chuàng)

      數(shù)碼
      旅游
      教育
      房產(chǎn)
      本地

      數(shù)碼要聞

      狼途推出T87系列燈箱三模機(jī)械鍵盤:12000mAh電池,可選8kHz

      旅游要聞

      今起,云南這一知名景區(qū)恢復(fù)開放!

      教育要聞

      當(dāng)你的孩子主動(dòng)給你買東西

      房產(chǎn)要聞

      碧桂園,開始甩賣??诩业?!

      本地新聞

      云游安徽|七千年敘事,第一章寫在蚌埠

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 无码人妻精品一区二区三区9厂 | 99自拍视频| 男同av| 亚州成人视频| 尤物av在线| 亚洲网在线| 成人精诚精品| 超碰狠狠干| 91成人视频在线观看| 无码日韩精品一区二区免费96| 91碰碰| 蜜桃av在线| 在线播放a| 宜昌市| 99精品中文| 狠狠干欧美| 兴化市| 久久伊伊| 尹人成人网| 国产在线精品一区二区高清不卡| 欧美中文字幕精品人妻| 色爱综合网| 亚洲熟妇无码爱v在线观看| 国产成人无码精品亚洲| 国产精品一区二区无线| 午夜天堂av天堂久久久| 蜜臀精品国产高清在线观看| 国产午夜大地久久| 亚洲国产另类久久久精品网站 | 亚洲中文精品久久久久久不卡| 亚洲男人天堂| 另类 专区 欧美 制服丝袜| 亚洲成av人无码免费观看| 最近中文字幕完整版hd| 国产永久免费高清在线观看| 成人国产精品中文字幕| 在线精品自拍亚洲第一区| 久久99精品久久久久久青青| 国产热A欧美热A在线视频| 久久久女人| 日本人妻中文字幕|