<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      AlphaGo之父出山:另辟蹊徑,繞過(guò)大模型探索超級(jí)智能

      0
      分享至

      又一位大佬創(chuàng)業(yè)了。

      幾周前,消息確認(rèn)前谷歌 DeepMind 首席科學(xué)家、AlphaGo 核心負(fù)責(zé)人戴維·席爾瓦(David Silver)正式離職,并在倫敦創(chuàng)立人工智能初創(chuàng)公司"Ineffable Intelligence"。據(jù)悉,該公司正在推進(jìn)一輪規(guī)模達(dá) 10 億美元的種子輪融資,目前已接近完成。

      這一融資額度,追平了 OpenAI 前首席科學(xué)家伊利亞·蘇茨克維(Ilya Sutskever)2024 年創(chuàng)立 Safe Superintelligence(SSI)時(shí)創(chuàng)下的紀(jì)錄。


      圖 | 戴維·席爾瓦 (來(lái)源:Youtube)

      與當(dāng)前依賴海量文本預(yù)訓(xùn)練的大模型路徑不同,席爾瓦的新公司明確提出:他們要繞過(guò) LLM 既定范式,回歸強(qiáng)化學(xué)習(xí)(Reinforcement Learning, RL)本源,構(gòu)建一個(gè)不依賴人類既有知識(shí)、能自主探索新知的智能系統(tǒng)。

      作為 DeepMind 聯(lián)合創(chuàng)始人德米斯·哈薩比斯(Demis Hassabis)自大學(xué)時(shí)代的密友與長(zhǎng)期合作伙伴,席爾瓦的離開(kāi)可以說(shuō)是該公司歷史上最重要的人事變動(dòng)之一。DeepMind 發(fā)言人在簡(jiǎn)短聲明中確認(rèn)了這一消息:“戴維的貢獻(xiàn)是無(wú)價(jià)的,我們非常感謝他對(duì) DeepMind 工作所做出的貢獻(xiàn)。”

      席爾瓦不僅是技術(shù)標(biāo)桿,更是強(qiáng)化學(xué)習(xí)路線的堅(jiān)定倡導(dǎo)者。作為圖靈獎(jiǎng)得主查理·薩頓(Charlie Sutton)的學(xué)生,他的論文被引用量已超過(guò) 28 萬(wàn)次,并于 2019 年獲得 ACM 計(jì)算獎(jiǎng)。

      他主張回歸強(qiáng)化學(xué)習(xí)的核心思路。2025 年 4 月,席爾瓦與其導(dǎo)師薩頓共同發(fā)表論文《歡迎來(lái)到經(jīng)驗(yàn)時(shí)代》(Welcome to the Era of Experience),提出新一代 AI 系統(tǒng)應(yīng)更注重智能體與環(huán)境的交互學(xué)習(xí):通過(guò)持續(xù)試錯(cuò)、自我迭代和長(zhǎng)期互動(dòng)積累經(jīng)驗(yàn),而非僅依賴靜態(tài)數(shù)據(jù)訓(xùn)練。這一理念,也是 Ineffable Intelligence 的技術(shù)基石。


      (來(lái)源:arXiv)

      在當(dāng)前創(chuàng)投環(huán)境下,Ineffable Intelligence 高達(dá) 10 億美元的融資目標(biāo)尤為引人注目。接近交易的投資人分析,資本市場(chǎng)愿意為一家尚未發(fā)布產(chǎn)品的公司開(kāi)出如此巨額支票,主要基于兩點(diǎn):一是對(duì)席爾瓦個(gè)人技術(shù)聲望的信任,二是對(duì)其所主張的“后大模型時(shí)代”技術(shù)路線的戰(zhàn)略性押注。

      目前,包括 OpenAI 的 GPT 系列與谷歌的 Gemini 系列在內(nèi),主流 AI 模型均建立在“預(yù)訓(xùn)練 + 微調(diào)”范式之上。這些模型通過(guò)學(xué)習(xí)互聯(lián)網(wǎng)上海量的文本數(shù)據(jù),掌握預(yù)測(cè)下一個(gè)詞的統(tǒng)計(jì)規(guī)律,從而展現(xiàn)出強(qiáng)大的對(duì)話與生成能力。但席爾瓦認(rèn)為,這一路徑存在本質(zhì)局限:AI 的能力上限被“人類數(shù)據(jù)”本身所鎖定。

      席爾瓦曾在私下場(chǎng)合多次表達(dá)對(duì)當(dāng)前技術(shù)路線的擔(dān)憂。他指出,大語(yǔ)言模型在后訓(xùn)練階段主要依賴“人類反饋強(qiáng)化學(xué)習(xí)”(RLHF),即通過(guò)人類評(píng)估員的打分來(lái)優(yōu)化模型。這意味著,模型所能達(dá)到的最高水平,難以超越人類評(píng)估員的認(rèn)知邊界。

      “我們想要超越人類的認(rèn)知,為此需要一種不同的方法?!?025 年 4 月,席爾瓦在一檔播客節(jié)目中罕見(jiàn)公開(kāi)闡述其理念,“這種方法需要 AI 能夠真正自主探索,發(fā)現(xiàn)人類尚不知道的新事物?!?/p>

      Ineffable Intelligence 的核心愿景,正是構(gòu)建一個(gè)擺脫人類知識(shí)束縛的系統(tǒng)。據(jù)熟悉該項(xiàng)目的人士透露,新公司將致力于研發(fā)“能夠持續(xù)學(xué)習(xí)的超級(jí)智能”——它不僅能處理語(yǔ)言,更能通過(guò)在模擬環(huán)境中的自我博弈與試錯(cuò),從第一性原理出發(fā),推導(dǎo)解決問(wèn)題的最優(yōu)解。

      席爾瓦的堅(jiān)持,有扎實(shí)的成果支撐。作為 AlphaGo 總設(shè)計(jì)師,他主導(dǎo)了 2016 年那場(chǎng)轟動(dòng)全球的人機(jī)大戰(zhàn)。在與李世石的第二局比賽中,著名的“第 37 手”曾被所有人類專家判定為失誤,因?yàn)樗环先魏我阎獓宥ㄊ?。然而后續(xù)棋局證明,這正是決定勝負(fù)的關(guān)鍵一手。席爾瓦將此類現(xiàn)象稱為“不可言說(shuō)”(Ineffable)的智慧。AI 通過(guò)計(jì)算,發(fā)現(xiàn)了人類尚未掌握的規(guī)律。這也正是新公司名稱的由來(lái)。


      (來(lái)源:Google Deepmind)

      此后,席爾瓦團(tuán)隊(duì)開(kāi)發(fā)的 AlphaZero 與 MuZero 進(jìn)一步驗(yàn)證了其理論:AlphaZero 在不依賴任何人類棋譜、僅被告知規(guī)則的前提下,通過(guò)自我對(duì)弈三天便擊敗 AlphaGo;MuZero 甚至無(wú)需知曉規(guī)則,就能在圍棋、國(guó)際象棋和 Atari 游戲中自主摸索規(guī)律,達(dá)到超人水平。

      這些成果構(gòu)成了席爾瓦技術(shù)路線的基石:在規(guī)則明確、可模擬的系統(tǒng)中,純粹的強(qiáng)化學(xué)習(xí)完全有能力超越人類智能。他堅(jiān)信,只要設(shè)計(jì)出合理的獎(jiǎng)勵(lì)機(jī)制,AI 就能在更復(fù)雜的現(xiàn)實(shí)任務(wù)中復(fù)刻 AlphaZero 的成功,無(wú)需像大語(yǔ)言模型那樣,通過(guò)模仿人類語(yǔ)言來(lái)“假裝”思考。

      席爾瓦的創(chuàng)業(yè),也折射出 AI 研究圈正在經(jīng)歷一場(chǎng)“路線大分流”。

      隨著大語(yǔ)言模型在商業(yè)應(yīng)用中的普及,越來(lái)越多頂尖科學(xué)家開(kāi)始擔(dān)憂技術(shù)發(fā)展的潛在瓶頸。2024 年,OpenAI 前首席科學(xué)家伊利亞·蘇茨克維創(chuàng)辦 Safe Superintelligence(SSI),同樣獲得巨額融資。盡管 SSI 與 Ineffable Intelligence 均以“超級(jí)智能”為目標(biāo),但側(cè)重點(diǎn)有所不同:伊利亞傾向于通過(guò)擴(kuò)大計(jì)算規(guī)模與優(yōu)化模型結(jié)構(gòu)實(shí)現(xiàn)智能躍遷,席爾瓦則更激進(jìn)地主張改變學(xué)習(xí)范式,由“監(jiān)督學(xué)習(xí)”轉(zhuǎn)向“強(qiáng)化學(xué)習(xí)”。

      此外,一些曾參與 AlphaGo、AlphaZero 項(xiàng)目的科學(xué)家,近期也離職創(chuàng)辦了 Reflection AI;Meta 的人工智能部門(mén)則在圖靈獎(jiǎng)得主楊立昆(Yann LeCun)帶領(lǐng)下,重組“超級(jí)智能實(shí)驗(yàn)室”,探索不同于 Transformer 架構(gòu)的新路徑。

      一位行業(yè)觀察家指出:“當(dāng)前局面頗似 2010 年代初深度學(xué)習(xí)爆發(fā)前夜。大家意識(shí)到,現(xiàn)有 LLM 雖強(qiáng)大,但可能并非通往 AGI 的終極答案。席爾瓦代表最原教旨主義的一派,他認(rèn)為智能的本質(zhì)是決策與探索,而非語(yǔ)言預(yù)測(cè)?!?/p>

      不過(guò),也有批評(píng)者指出,強(qiáng)化學(xué)習(xí)雖在圍棋、游戲等規(guī)則明確的環(huán)境中表現(xiàn)優(yōu)異,但在現(xiàn)實(shí)世界這類規(guī)則模糊、反饋稀疏的開(kāi)放環(huán)境中,其有效性尚未得到充分驗(yàn)證。大語(yǔ)言模型之所以成功,正因語(yǔ)言本身是人類智慧的高度壓縮。通過(guò)學(xué)習(xí)語(yǔ)言,AI 能以較低成本獲得常識(shí)。

      若完全摒棄這一路徑,Ineffable Intelligence 或需構(gòu)建極其復(fù)雜的數(shù)字孿生系統(tǒng),供 AI 進(jìn)行億萬(wàn)次試錯(cuò)訓(xùn)練,其算力成本將是天文數(shù)字。這也正是 10 億美元融資需要解決的首要問(wèn)題。

      目前,Ineffable Intelligence 已在倫敦設(shè)立總部,并啟動(dòng)全球頂尖強(qiáng)化學(xué)習(xí)研究員的招募。雖然公司尚未公布具體產(chǎn)品時(shí)間表,但這家公司的技術(shù)路線與資源投入,或?qū)⒊蔀橛绊?AI 技術(shù)演進(jìn)方向的下一股重要力量。

      1. https://www.ft.com/content/dffe72d0-4064-4412-8ebc-50198a30d40e

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      世界上最燒錢(qián)的十項(xiàng)運(yùn)動(dòng),沒(méi)錢(qián)你真玩不起!

      世界上最燒錢(qián)的十項(xiàng)運(yùn)動(dòng),沒(méi)錢(qián)你真玩不起!

      馬拉松跑步健身
      2026-02-28 11:37:18
      這么看侯佩岑挺慘,還在等周杰倫求復(fù)合呢,周杰倫跑去追田馥甄了

      這么看侯佩岑挺慘,還在等周杰倫求復(fù)合呢,周杰倫跑去追田馥甄了

      一盅情懷
      2026-03-06 16:27:03
      這家船廠宣布:史上最大幅度加薪協(xié)議達(dá)成

      這家船廠宣布:史上最大幅度加薪協(xié)議達(dá)成

      龍de船人
      2026-03-07 20:07:13
      隨著蘭帕德率隊(duì)2-0,萊斯特城1-1,赫爾城1-3,英冠最新積分榜出爐

      隨著蘭帕德率隊(duì)2-0,萊斯特城1-1,赫爾城1-3,英冠最新積分榜出爐

      側(cè)身凌空斬
      2026-03-08 07:03:56
      王曼昱退賽,太原賽8人名單公布,4男4女,陳熠無(wú)緣

      王曼昱退賽,太原賽8人名單公布,4男4女,陳熠無(wú)緣

      東球貓貓
      2026-03-08 10:01:42
      江西母女喝了3瓶牛奶,被老公數(shù)落2小時(shí),眼神太嚇人,網(wǎng)友炸鍋

      江西母女喝了3瓶牛奶,被老公數(shù)落2小時(shí),眼神太嚇人,網(wǎng)友炸鍋

      青梅侃史啊
      2026-03-08 07:18:01
      霍爾木茲海峽如果斷供,中國(guó)的石油能撐多久?我查完數(shù)據(jù)算了一遍

      霍爾木茲海峽如果斷供,中國(guó)的石油能撐多久?我查完數(shù)據(jù)算了一遍

      何毅商業(yè)財(cái)經(jīng)
      2026-03-08 09:07:44
      蘋(píng)果在美升級(jí)地理封鎖:字節(jié)跳動(dòng)中文應(yīng)用遭全面限制,跨區(qū)下載已成歷史

      蘋(píng)果在美升級(jí)地理封鎖:字節(jié)跳動(dòng)中文應(yīng)用遭全面限制,跨區(qū)下載已成歷史

      驅(qū)動(dòng)中國(guó)
      2026-03-06 11:12:05
      美軍或用對(duì)付伊拉克的方法,對(duì)付中國(guó)?一旦開(kāi)戰(zhàn),衛(wèi)星必然不保!

      美軍或用對(duì)付伊拉克的方法,對(duì)付中國(guó)?一旦開(kāi)戰(zhàn),衛(wèi)星必然不保!

      阿籫你好
      2026-03-08 10:28:25
      新加坡急了,外長(zhǎng)幾乎是拍著桌子,讓中國(guó)“尊重”馬六甲的地位。

      新加坡急了,外長(zhǎng)幾乎是拍著桌子,讓中國(guó)“尊重”馬六甲的地位。

      南權(quán)先生
      2026-01-26 15:41:26
      難辨真?zhèn)危_實(shí)有可能,美媒:中國(guó)用殲16的舊雷達(dá)來(lái)升級(jí)殲11B

      難辨真?zhèn)危_實(shí)有可能,美媒:中國(guó)用殲16的舊雷達(dá)來(lái)升級(jí)殲11B

      嘯鷹評(píng)
      2026-03-07 23:24:42
      葛薈婕的男友吳海峰,32歲,廣西農(nóng)村初中學(xué)歷,曾是薇婭公司司機(jī)

      葛薈婕的男友吳海峰,32歲,廣西農(nóng)村初中學(xué)歷,曾是薇婭公司司機(jī)

      靜若梨花
      2026-03-08 11:15:50
      政府工作報(bào)告:加強(qiáng)初婚初育家庭住房保障;落實(shí)職工帶薪錯(cuò)峰休假制度

      政府工作報(bào)告:加強(qiáng)初婚初育家庭住房保障;落實(shí)職工帶薪錯(cuò)峰休假制度

      每日經(jīng)濟(jì)新聞
      2026-03-07 20:19:10
      全國(guó)人大代表、北京協(xié)和醫(yī)院院長(zhǎng)張抒揚(yáng)建議:年輕人,別錯(cuò)過(guò)最佳生育年齡,為人父母的幸福感是無(wú)可替代的

      全國(guó)人大代表、北京協(xié)和醫(yī)院院長(zhǎng)張抒揚(yáng)建議:年輕人,別錯(cuò)過(guò)最佳生育年齡,為人父母的幸福感是無(wú)可替代的

      觀威海
      2026-03-07 12:07:22
      地中海又傳來(lái)一聲巨響,俄6萬(wàn)噸巨輪慘遭擊沉,普京:絕不輕饒!

      地中海又傳來(lái)一聲巨響,俄6萬(wàn)噸巨輪慘遭擊沉,普京:絕不輕饒!

      甜檸聊史
      2026-03-08 01:56:33
      全新一代雷克薩斯ES美國(guó)售價(jià)揭曉:48795美元起,下月登陸國(guó)內(nèi)

      全新一代雷克薩斯ES美國(guó)售價(jià)揭曉:48795美元起,下月登陸國(guó)內(nèi)

      IT之家
      2026-03-06 18:19:38
      朝鮮戰(zhàn)爭(zhēng)期間:美軍原本已接近擊敗中國(guó),卻碰上中國(guó)決死的指揮官

      朝鮮戰(zhàn)爭(zhēng)期間:美軍原本已接近擊敗中國(guó),卻碰上中國(guó)決死的指揮官

      別人都叫我阿腈
      2026-02-13 21:25:33
      中央定調(diào)!15年最低繳費(fèi)成歷史,2030年15年繳費(fèi)還能正常退休嗎?

      中央定調(diào)!15年最低繳費(fèi)成歷史,2030年15年繳費(fèi)還能正常退休嗎?

      另子維愛(ài)讀史
      2026-03-03 21:58:41
      羅永浩怒懟算命大V!稱沒(méi)了膽也不慣著,網(wǎng)友:踢到鋼板了

      羅永浩怒懟算命大V!稱沒(méi)了膽也不慣著,網(wǎng)友:踢到鋼板了

      雷科技
      2026-03-07 23:58:00
      請(qǐng)12人吃飯結(jié)賬變四桌,我悄悄結(jié)賬走人,半小時(shí)飯店來(lái)電:人被扣了,我直接回答:和我沒(méi)關(guān)系

      請(qǐng)12人吃飯結(jié)賬變四桌,我悄悄結(jié)賬走人,半小時(shí)飯店來(lái)電:人被扣了,我直接回答:和我沒(méi)關(guān)系

      奶茶麥子
      2026-03-08 00:01:07
      2026-03-08 12:07:00
      DeepTech深科技 incentive-icons
      DeepTech深科技
      麻省理工科技評(píng)論獨(dú)家合作
      16376文章數(shù) 514725關(guān)注度
      往期回顧 全部

      科技要聞

      OpenClaw最大的推手是閑魚(yú)和小紅書(shū)

      頭條要聞

      伊朗公布行動(dòng)細(xì)節(jié) 有導(dǎo)彈配備集束彈頭均命中目標(biāo)

      頭條要聞

      伊朗公布行動(dòng)細(xì)節(jié) 有導(dǎo)彈配備集束彈頭均命中目標(biāo)

      體育要聞

      大傷后被交易,他說(shuō):22歲的我已經(jīng)死了

      娛樂(lè)要聞

      周迅新戀情曝光,李亞鵬等人已成過(guò)去

      財(cái)經(jīng)要聞

      油價(jià)要失控?

      汽車要聞

      9分鐘充飽 全新騰勢(shì)Z9GT首搭閃充技術(shù)26.98萬(wàn)起

      態(tài)度原創(chuàng)

      本地
      藝術(shù)
      健康
      公開(kāi)課
      軍事航空

      本地新聞

      食味印象|一口入魂!康樂(lè)烤肉串起千年絲路香

      藝術(shù)要聞

      他是二王書(shū)法的化身?米芾的秘密揭曉!

      轉(zhuǎn)頭就暈的耳石癥,能開(kāi)車上班嗎?

      公開(kāi)課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      美第三個(gè)航母打擊群據(jù)稱準(zhǔn)備部署至中東

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版