在AlphaGo擊敗圍棋冠軍李世石十年后,人工智能再次迎來標志性時刻:一款名為“Ace”的機器人在真實競技中擊敗了人類乒乓球職業運動員。不同于當年發生在棋盤上的對決,這一次AI走入物理世界,在高速、不確定的環境中與人類正面對抗并取得優勢,顯示出感知、決策與執行能力的全面提升。開發這款機器人的索尼公司表示,這是“機器人首次在現實世界中一個廣泛開展的競技體育項目中達到人類專家級水平”。從圍棋到乒乓球,這一跨越不僅體現了技術從虛擬推理向現實互動的躍遷,也意味著AI正逐步逼近甚至重塑人類在復雜運動與技能領域的邊界。
![]()
“Ace”
《自然》雜志4月22日發布的一項最新研究顯示,日本電子巨頭Sony打造的一款名為“Ace”機器人在打乒乓球方面表現得極其嫻熟,甚至對頂尖人類乒乓球選手構成嚴峻挑戰,有時還能戰勝他們。這一成果表明,AI的進步正讓機器人變得更加敏捷。日本職業乒乓球運動員安藤南和曾根翔等人參與了與索尼機器人的對戰。兩名來自日本乒乓球協會的裁判對比賽進行了判定。索尼稱,去年12月,在與Ace對戰的4名高水平選手中,僅有1人未敗給Ace。Ace成功證明了自己是一個強勁的對手。索尼表示,這是“機器人首次在現實世界中一個廣泛開展的競技體育項目中達到人類專家級水平——這是AI和機器人研究的一個長期里程碑”。
![]()
![]()
Ace通過強化學習(Reinforcement Learning)的AI訓練方法學會了如何打乒乓球。“程序員沒有辦法通過手動編程讓機器人學會打乒乓球。它必須從經驗中學習如何打球。”索尼AI研究員彼得·迪爾(Peter Dürr)表示。他是這項發表在《自然》雜志上的研究的共同作者。在實驗中,索尼在東京總部建造了一座奧運規格的乒乓球場,讓職業及其他高水平運動員與機器人在“公平的場地”上對決。迪爾在接受美聯社采訪時表示,一些運動員對Ace的實力感到驚訝。曾參加1992年巴塞羅那奧運會的選手中村錦次郎在觀看Ace打出一記擊球后告訴研究人員:“沒有人能做到這一點,我原以為這是不可能的。”但他補充說,既然機器人已經做到,“這意味著人類也有可能做到”。
讓機器人以瞬時反應速度與熟練人類運動員互動和競爭是一件極其困難的事情。索尼AI總裁邁克爾·施普蘭格(Michael Spranger)表示,研究人員有意避免給予機器人不公平的優勢,使其速度、臂展和表現與每周訓練至少20小時的熟練運動員相當。它在標準尺寸球臺上,按照官方乒乓球規則比賽。“打造一個超越人類的乒乓球機器人其實很容易。”他說,“你可以造一臺機器,把球吸進去,再以遠超人類回擊能力的速度打出去。但這不是我們的目標。我們的目標是實現某種程度的可比性,對人類保持一定程度的公平,并在AI層面、決策和戰術層面,以及某種程度的技術能力上取勝。”
![]()
不過,Ace確實也具備一些“超越人類”的特征,這讓它在乒乓球運動上產生了一定的優勢:研究人員在球場周圍布置了九個攝像頭作為Ace的“眼睛”,這讓Ace擁有通過追蹤乒乓球上標志來測量旋轉的驚人能力。這款定制機器人的手臂擁有8個關節(即運動自由度),可以控制其移動,使其能夠精準定位球拍、執行擊球動作,并快速應對對手的來球。“速度確實是當今機器人技術中的一個核心問題,尤其是在不固定的場景或環境中。”施普蘭格表示,“我們看到很多工廠里的機器人速度非常非常快,但它們只是重復同樣的軌跡。而通過這項技術,我們展示了實際上可以訓練機器人在不斷變化的不確定環境中變得高度適應、具有競爭力且快速。”這意味著“Ace不是僅僅通過擊球速度超過人類來取勝,而是通過真正地‘打比賽’來贏”。
AlphaGo擊敗李世石十年后
2016年,超過2億人觀看了AlphaGo在首爾對陣圍棋世界冠軍李世石的比賽。這場對決因第二局中的“第37手”而被銘記——這一落子極其反常,以至于職業解說最初認為這是失誤。但事實證明它具有決定性意義。大約一百步之后,這枚棋子恰好處在贏棋所需的位置。這一表現展現了驚人的前瞻性,也體現了AI系統不僅能模仿人類專家,還能發現全新的策略。不過,長期以來,AI研究人員一直將國際象棋等棋類游戲作為衡量計算機能力的基準,隨后又擴展到更加開放的電子游戲世界。但將AI從模擬環境帶入物理世界,一直是機器人制造商的“黃金標準”。過去一年標志著“機器人領域某種意義上的ChatGPT時刻”。施普蘭格表示。他指的是出現了新的AI驅動方法,使機器人能夠理解現實環境,并執行諸如后空翻等高強度物理任務。
![]()
事實上,索尼并不是第一個嘗試讓機器人打乒乓球的機構。約翰·比林斯利(John Billingsley)早在1983年就以一篇題為《機器人乒乓球》(Robot Ping-Pong)的論文開創了這一研究領域的先河。比林斯利評價Ace道,成果令人印象深刻,索尼強大的計算機視覺和運動檢測能力,使得只有兩只眼睛的人類幾乎難以匹敵。“我并不想貶低這一成就,但他們是以一種‘人多勢眾’的方式推進任務,并使用了‘大錘式’技術。”這名澳大利亞南昆士蘭大學的退休機電一體化教授在發給美聯社的電子郵件中表示。他用“大錘式”的技術描述用“大力出奇跡”的方式去解決問題,而不是用精細且高效的方法。盡管認為這一技術仍有改進空間,但是施普蘭格稱,這種技術可能在制造業及其他行業中發揮作用,甚至也不難想象,這種高速且高度感知的硬件可能被用于戰爭。
AlphaGO的母公司DeepMind也參與了這一領域的研究。不僅如此,DeepMind還將Alpha系列AI的能力拓展到了生物醫療、數學推理、算法發現、基因組研究、核聚變等多項科學領域,展示了AI幫助人類理解物理世界復雜性的潛力。2020年,DeepMind通過 AlphaFold 2系統終于攻克了蛋白質折疊這一長期難題。這對于理解疾病和開發新藥至關重要。隨后,DeepMind解析了科學界已知的全部2億種蛋白質結構,并通過開源數據庫向全球科學家免費開放。Alpha系列的AlphaProof模型結合語言模型與 AlphaGo的升級版AlphaZero 的強化學習和搜索算法,能夠證明形式化數學命題。同系列的AlphaEvolve模型能夠在程序空間中搜索更高效算法。
![]()
在與AlphaGo對局十年后,李世石故地重游,在當時對局的場館中一場主題為“智能體AI時代”的活動中,他提出了關于AI的新敘事,但是這一次他更強調合作:若當年的對局象征著人與機器的競爭,那么如今AI正演變為能夠理解人類意圖并執行復雜任務的協作伙伴。
圖片來源于網絡
iWeekly獨家稿件,未經許可,請勿轉載
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.