<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      AlphaGo之父出山:另辟蹊徑,繞過大模型探索超級智能

      0
      分享至

      又一位大佬創(chuàng)業(yè)了。

      幾周前,消息確認前谷歌 DeepMind 首席科學家、AlphaGo 核心負責人戴維·席爾瓦(David Silver)正式離職,并在倫敦創(chuàng)立人工智能初創(chuàng)公司"Ineffable Intelligence"。據悉,該公司正在推進一輪規(guī)模達 10 億美元的種子輪融資,目前已接近完成。

      這一融資額度,追平了 OpenAI 前首席科學家伊利亞·蘇茨克維(Ilya Sutskever)2024 年創(chuàng)立 Safe Superintelligence(SSI)時創(chuàng)下的紀錄。


      圖 | 戴維·席爾瓦 (來源:Youtube)

      與當前依賴海量文本預訓練的大模型路徑不同,席爾瓦的新公司明確提出:他們要繞過 LLM 既定范式,回歸強化學習(Reinforcement Learning, RL)本源,構建一個不依賴人類既有知識、能自主探索新知的智能系統。

      作為 DeepMind 聯合創(chuàng)始人德米斯·哈薩比斯(Demis Hassabis)自大學時代的密友與長期合作伙伴,席爾瓦的離開可以說是該公司歷史上最重要的人事變動之一。DeepMind 發(fā)言人在簡短聲明中確認了這一消息:“戴維的貢獻是無價的,我們非常感謝他對 DeepMind 工作所做出的貢獻?!?/p>

      席爾瓦不僅是技術標桿,更是強化學習路線的堅定倡導者。作為圖靈獎得主查理·薩頓(Charlie Sutton)的學生,他的論文被引用量已超過 28 萬次,并于 2019 年獲得 ACM 計算獎。

      他主張回歸強化學習的核心思路。2025 年 4 月,席爾瓦與其導師薩頓共同發(fā)表論文《歡迎來到經驗時代》(Welcome to the Era of Experience),提出新一代 AI 系統應更注重智能體與環(huán)境的交互學習:通過持續(xù)試錯、自我迭代和長期互動積累經驗,而非僅依賴靜態(tài)數據訓練。這一理念,也是 Ineffable Intelligence 的技術基石。


      (來源:arXiv)

      在當前創(chuàng)投環(huán)境下,Ineffable Intelligence 高達 10 億美元的融資目標尤為引人注目。接近交易的投資人分析,資本市場愿意為一家尚未發(fā)布產品的公司開出如此巨額支票,主要基于兩點:一是對席爾瓦個人技術聲望的信任,二是對其所主張的“后大模型時代”技術路線的戰(zhàn)略性押注。

      目前,包括 OpenAI 的 GPT 系列與谷歌的 Gemini 系列在內,主流 AI 模型均建立在“預訓練 + 微調”范式之上。這些模型通過學習互聯網上海量的文本數據,掌握預測下一個詞的統計規(guī)律,從而展現出強大的對話與生成能力。但席爾瓦認為,這一路徑存在本質局限:AI 的能力上限被“人類數據”本身所鎖定。

      席爾瓦曾在私下場合多次表達對當前技術路線的擔憂。他指出,大語言模型在后訓練階段主要依賴“人類反饋強化學習”(RLHF),即通過人類評估員的打分來優(yōu)化模型。這意味著,模型所能達到的最高水平,難以超越人類評估員的認知邊界。

      “我們想要超越人類的認知,為此需要一種不同的方法?!?025 年 4 月,席爾瓦在一檔播客節(jié)目中罕見公開闡述其理念,“這種方法需要 AI 能夠真正自主探索,發(fā)現人類尚不知道的新事物。”

      Ineffable Intelligence 的核心愿景,正是構建一個擺脫人類知識束縛的系統。據熟悉該項目的人士透露,新公司將致力于研發(fā)“能夠持續(xù)學習的超級智能”——它不僅能處理語言,更能通過在模擬環(huán)境中的自我博弈與試錯,從第一性原理出發(fā),推導解決問題的最優(yōu)解。

      席爾瓦的堅持,有扎實的成果支撐。作為 AlphaGo 總設計師,他主導了 2016 年那場轟動全球的人機大戰(zhàn)。在與李世石的第二局比賽中,著名的“第 37 手”曾被所有人類專家判定為失誤,因為它不符合任何已知圍棋定式。然而后續(xù)棋局證明,這正是決定勝負的關鍵一手。席爾瓦將此類現象稱為“不可言說”(Ineffable)的智慧。AI 通過計算,發(fā)現了人類尚未掌握的規(guī)律。這也正是新公司名稱的由來。


      (來源:Google Deepmind)

      此后,席爾瓦團隊開發(fā)的 AlphaZero 與 MuZero 進一步驗證了其理論:AlphaZero 在不依賴任何人類棋譜、僅被告知規(guī)則的前提下,通過自我對弈三天便擊敗 AlphaGo;MuZero 甚至無需知曉規(guī)則,就能在圍棋、國際象棋和 Atari 游戲中自主摸索規(guī)律,達到超人水平。

      這些成果構成了席爾瓦技術路線的基石:在規(guī)則明確、可模擬的系統中,純粹的強化學習完全有能力超越人類智能。他堅信,只要設計出合理的獎勵機制,AI 就能在更復雜的現實任務中復刻 AlphaZero 的成功,無需像大語言模型那樣,通過模仿人類語言來“假裝”思考。

      席爾瓦的創(chuàng)業(yè),也折射出 AI 研究圈正在經歷一場“路線大分流”。

      隨著大語言模型在商業(yè)應用中的普及,越來越多頂尖科學家開始擔憂技術發(fā)展的潛在瓶頸。2024 年,OpenAI 前首席科學家伊利亞·蘇茨克維創(chuàng)辦 Safe Superintelligence(SSI),同樣獲得巨額融資。盡管 SSI 與 Ineffable Intelligence 均以“超級智能”為目標,但側重點有所不同:伊利亞傾向于通過擴大計算規(guī)模與優(yōu)化模型結構實現智能躍遷,席爾瓦則更激進地主張改變學習范式,由“監(jiān)督學習”轉向“強化學習”。

      此外,一些曾參與 AlphaGo、AlphaZero 項目的科學家,近期也離職創(chuàng)辦了 Reflection AI;Meta 的人工智能部門則在圖靈獎得主楊立昆(Yann LeCun)帶領下,重組“超級智能實驗室”,探索不同于 Transformer 架構的新路徑。

      一位行業(yè)觀察家指出:“當前局面頗似 2010 年代初深度學習爆發(fā)前夜。大家意識到,現有 LLM 雖強大,但可能并非通往 AGI 的終極答案。席爾瓦代表最原教旨主義的一派,他認為智能的本質是決策與探索,而非語言預測?!?/p>

      不過,也有批評者指出,強化學習雖在圍棋、游戲等規(guī)則明確的環(huán)境中表現優(yōu)異,但在現實世界這類規(guī)則模糊、反饋稀疏的開放環(huán)境中,其有效性尚未得到充分驗證。大語言模型之所以成功,正因語言本身是人類智慧的高度壓縮。通過學習語言,AI 能以較低成本獲得常識。

      若完全摒棄這一路徑,Ineffable Intelligence 或需構建極其復雜的數字孿生系統,供 AI 進行億萬次試錯訓練,其算力成本將是天文數字。這也正是 10 億美元融資需要解決的首要問題。

      目前,Ineffable Intelligence 已在倫敦設立總部,并啟動全球頂尖強化學習研究員的招募。雖然公司尚未公布具體產品時間表,但這家公司的技術路線與資源投入,或將成為影響 AI 技術演進方向的下一股重要力量。

      1. https://www.ft.com/content/dffe72d0-4064-4412-8ebc-50198a30d40e

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      89年,羅瑞卿次子官至正師級,出差法國為何選擇叛國,成羅家禁忌

      89年,羅瑞卿次子官至正師級,出差法國為何選擇叛國,成羅家禁忌

      抽象派大師
      2026-02-10 12:50:21
      塔利班焚毀500件樂器:音樂導致“道德敗壞”

      塔利班焚毀500件樂器:音樂導致“道德敗壞”

      桂系007
      2026-02-20 10:45:31
      鄭麗文急了,緊急開會提出三點建議,盧秀燕也被連累,江啟臣懸了

      鄭麗文急了,緊急開會提出三點建議,盧秀燕也被連累,江啟臣懸了

      愛看劇的阿峰
      2026-02-20 22:21:07
      隊報:大巴黎向姆巴佩支付了400萬歐元欠款,還剩約200萬

      隊報:大巴黎向姆巴佩支付了400萬歐元欠款,還剩約200萬

      懂球帝
      2026-02-20 17:45:06
      高市早苗個人官網約1000篇“專欄文章”已無法訪問,其記錄了高市在政壇的成長軌跡

      高市早苗個人官網約1000篇“專欄文章”已無法訪問,其記錄了高市在政壇的成長軌跡

      大象新聞
      2026-02-20 13:56:11
      中國馬年第一天,特朗普在“空軍一號”上緊急表態(tài),臺當局天塌了

      中國馬年第一天,特朗普在“空軍一號”上緊急表態(tài),臺當局天塌了

      頭條爆料007
      2026-02-18 09:00:00
      破紀錄?《鏢人》逆跌,票房沖15億,吳京保住了武俠片的遮羞布

      破紀錄?《鏢人》逆跌,票房沖15億,吳京保住了武俠片的遮羞布

      靠譜電影君
      2026-02-19 21:28:54
      馬年首個交易日,港股機器人板塊爆發(fā)!AI應用概念走強,智譜、MiniMax市值雙雙沖破3000億港元

      馬年首個交易日,港股機器人板塊爆發(fā)!AI應用概念走強,智譜、MiniMax市值雙雙沖破3000億港元

      每日經濟新聞
      2026-02-20 16:56:04
      高市挑釁再敲警鐘!中國史上最大誤判之一就是:總習慣性低估日本

      高市挑釁再敲警鐘!中國史上最大誤判之一就是:總習慣性低估日本

      不似少年游
      2026-02-20 07:22:48
      《將門獨后》官宣炸鍋!3萬負評吐槽選角魔改全翻車

      《將門獨后》官宣炸鍋!3萬負評吐槽選角魔改全翻車

      眼底星碎
      2026-02-20 20:48:15
      官方:葡萄牙前國腳安德烈-戈麥斯自由身加盟哥倫布機員

      官方:葡萄牙前國腳安德烈-戈麥斯自由身加盟哥倫布機員

      懂球帝
      2026-02-20 11:07:20
      明年狀元簽誰家之?老鷹18.5%概率領跑超級新人迪班薩預定席位?

      明年狀元簽誰家之?老鷹18.5%概率領跑超級新人迪班薩預定席位?

      大眼瞄世界
      2026-02-20 15:30:57
      河南舅舅躲拜年上熱搜!門口禮品露餡,網友:換我也躲

      河南舅舅躲拜年上熱搜!門口禮品露餡,網友:換我也躲

      健身狂人
      2026-02-20 21:08:27
      王騰解釋為何把小米手機換成iPhone 17:睡眠監(jiān)測適配更好

      王騰解釋為何把小米手機換成iPhone 17:睡眠監(jiān)測適配更好

      識礁Farsight
      2026-02-20 20:55:40
      重磅!烏克蘭外長獲中方邀請將訪華,中烏高層互訪提上日程

      重磅!烏克蘭外長獲中方邀請將訪華,中烏高層互訪提上日程

      老馬拉車莫少裝
      2026-02-20 06:02:36
      別罵哲凱賴什了!阿森納 6700 萬水貨更坑,已成佩佩之后最爛引援

      別罵哲凱賴什了!阿森納 6700 萬水貨更坑,已成佩佩之后最爛引援

      瀾歸序
      2026-02-20 02:22:15
      一針見血!約翰遜炮轟歐洲:別空談,給烏遠程武器才是硬道理

      一針見血!約翰遜炮轟歐洲:別空談,給烏遠程武器才是硬道理

      老馬拉車莫少裝
      2026-02-19 14:10:27
      荷蘭美女奪冠后拉開比賽服的拉鏈:露出內衣品牌 至少入賬690萬元

      荷蘭美女奪冠后拉開比賽服的拉鏈:露出內衣品牌 至少入賬690萬元

      風過鄉(xiāng)
      2026-02-18 08:16:51
      68歲趙本山蹲炕頭吃酸菜燉鵝,那雙掉漆筷子比好多人朋友圈還真實

      68歲趙本山蹲炕頭吃酸菜燉鵝,那雙掉漆筷子比好多人朋友圈還真實

      喜歡歷史的阿繁
      2026-02-17 23:12:52
      如果打開全部閘門,把三峽水庫的水全部放光,需要多久?

      如果打開全部閘門,把三峽水庫的水全部放光,需要多久?

      心中的麥田
      2026-02-19 20:29:21
      2026-02-21 00:20:49
      DeepTech深科技 incentive-icons
      DeepTech深科技
      麻省理工科技評論獨家合作
      16294文章數 514624關注度
      往期回顧 全部

      科技要聞

      莫迪舉手歡呼 兩大AI掌門人卻握拳尷尬對峙

      頭條要聞

      女子下車接電話將900克黃金遺落在動車上 價值約135萬

      頭條要聞

      女子下車接電話將900克黃金遺落在動車上 價值約135萬

      體育要聞

      寧忠?guī)r:我拿過那么多銀牌和銅牌 現在終于贏了

      娛樂要聞

      《將門獨后》開拍,王鶴棣孟子義主演

      財經要聞

      太瘋狂!“顧客不問價直接出手”

      汽車要聞

      比亞迪的“顏值擔當”來了 方程豹首款轎車路跑信息曝光

      態(tài)度原創(chuàng)

      教育
      本地
      家居
      旅游
      軍事航空

      教育要聞

      E是BC的中點,求陰影部分的面積

      本地新聞

      春花齊放2026:《駿馬奔騰迎新歲》

      家居要聞

      本真棲居 愛暖伴流年

      旅游要聞

      來浦東過大年|看美展、逛雅集,來浦東沉浸式過馬年

      軍事要聞

      消息人士透露:美軍赴黃?;顒?解放軍有效應對處置

      無障礙瀏覽 進入關懷版