<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      太瘋了!MIT博士在Transformer里造計算機,攻破LLM終極缺陷

      0
      分享至


      新智元報道

      編輯:KingHZ Aeneas

      【新智元導讀】炸裂!就在剛剛,一位MIT博士,在Transformer里造出個計算機。現在,模型一舉洗刷「9.11與9.9哪個大」的恥辱,幾秒內運行數百萬步程序,世界最難數獨準確率100%!大模型的能力邊界,從此徹底改變。

      就在剛剛,AI圈被一項暴力美學般的突破,徹底震碎了三觀。

      一位MIT博士,在Transformer里,直接造出了個計算機!

      注意,不是外掛插件,不是調用工具(Tool Use),而是通過一種近乎瘋狂的硬編碼方式,將一個WebAssembly (WASM) 解釋器無損地(Losslessly)嵌入到了Transformer模型的權重之中。


      這位博士老哥,是真的把LLM玩出硬件感了

      這意味著,從此LLM不再是靠概率預測下一個智元(Token)的文字游戲機,而是進化成了一臺真正的數字計算機。

      如果你以為,LLM現在還算不清「9.11與9.9哪個大」,現在,你的認知將被徹底粉碎!

      現在,這篇帖子已經在X上熱轉,引來眾多開發者大神的瘋狂點贊。

      可以說,它一舉洗刷了大模型3年以來的「恥辱」。

      「Vibe Coding」之父、大神Karpathy直接驚呼:這項研究太棒了,實在是令人深受啟發!


      LLM終極弱點,被徹底攻破

      作為一種新類型的智能,大模型能解研究級難題,但不借助外部工具,卻幾乎不可能完成兩個數相乘或解個小數獨。

      那么,如何讓LLM本身變得像計算機一樣可靠高效?

      答案是:在Transformer內部實實在在地構建一臺計算機。

      雅典大學副教授、MIT博士Christos Tzamos及其Percepta團隊將任意C代碼轉化為智元(Token),讓模型自己能可靠執行,在幾秒內運行數百萬步。


      鏈接:https://www.percepta.ai/blog/can-llms-be-computers

      通過匈牙利算法,它解決了一個多步優化問題,即求解最小成本完美匹配,運作方式如下。


      在這個過程中,AI并不調用外部工具。

      所有計算都是在Transformer內部以自回歸的方式完成的!

      這里的難點在于,對于任何實際計算來說,LLM的標準注意力機制太慢了。

      為了繞過這一限制,他們發明了一種新的解碼路徑,實現了指數級加速的注意力機制,讓每智元(Token)生成所需的幾乎所有計算量智元(Token),并在CPU上以超過每秒3萬個智元(Token)的速度流式輸出結果。



      要知道MacBook M2 Pro的解碼速度才每秒27個智元(token),每秒33000個智元(Token)堪稱火箭般的速度,讓人難以想象!


      當然,用LLM的計算速度無法與CPU相比,這項研究的關鍵意義在于賦予LLM內在計算能力,真正教會AI算數,讓它更聰明。


      而這項能力與自動研究相結合,未來探索空間更是遠超想象。


      網友贊嘆:這才是真正的原生智能!


      傳統attention

      可以退出歷史舞臺?

      注意,這項工作,并不是讓模型更會算,而是讓模型在內部真正執行程序!

      不靠外掛,不調用Python,所有計算,都發生在Transformer里。

      更離譜的是,這臺「計算機」幾秒就能跑完百萬步的程序。連做最難的數獨,正確率都是100%。


      在3分鐘內,它就實現了100%的精確求解

      這種方法不僅可用于速度,它可以用于執行任意代碼——就像在AI腦子中塞入了一臺電腦。


      按照大V「Rainier」的說法,這個思路有點類似于TI的dsp芯片:ARM負責邏輯思維,dsp專門負責高速數據計算,各取所長。


      這也意味著,一種Hybrid LLM架構的全新范式開始出現,其中神經網絡負責推理和理解,嵌入式解釋器/計算引擎負責高精度計算。

      于是可以同時兼顧推理能力和確定性計算精度,徹底解決「9.11和9.9哪個大」這個問題。

      這個方向走通的話,數值計算、物理模擬、金融建模、密碼學運算,都會發生極大變革。

      傳統Attention太慢,根本不適合做計算,而這項研究,直接引爆了Transformer的范式躍遷!


      AI最大的恥辱,如今被終結了

      三年了。


      三年來,每個頂級AI經歷過同一個社死時刻:當你在臺上信心滿滿地演示大模型的超強推理能力,臺下忽然有人舉手提問:「那請問,9.11和9.9哪個大?」

      模型回答「9.11 > 9.9」,全場哄堂大笑。

      這不是段子,這是真實發生過無數次的事。


      2024年,在記者Matt Barnum測試中,基于ChatGPT的學習輔導工具Khanmigo,有時連算術題的答案都拿不準

      原因不難理解:Transformer本為理解語言設計的,并非為精確計算設計。

      讓大模型做算術,就像讓莎士比亞做會計——他能把財報寫成十四行詩,但數字八成對不上。

      AI行業的補丁方案是「外掛工具」:算不了?那就調Python。


      這相當于給莎士比亞旁邊放了個計算器。雖然能用,但并不優雅,而且每次調用都打斷推理鏈、增加延遲、引入安全風險。

      現在,MIT博士說:別給莎士比亞放計算器了直接讓他天生就會算數

      他們把一臺完整的WebAssembly虛擬機,硬編碼進了Transformer的權重里。

      也就是說,神經網絡的前向傳播過程本身,就等價于執行一臺計算機。

      過去AI的恥辱,如今終結了。

      不過,但就數獨問題而言,這不是LLM第一次突破。

      工程師Aviraj認為Percepta的方法很酷,但他們采取了不同的、更面向具體問題的路徑。

      核心區別在于:不將通用編譯產物(如C->WASM)作為模型的學習目標,而是為特定任務設計一個極簡的、領域專用的指令集(PSVM)。



      不過,這次看看Christos Tzamos團隊如何在Transformer內部跑起來一臺電腦的。

      這個過程的關鍵,就是找到一種方法,來編碼一臺可工作的計算機。

      計算:一條只增不減的軌跡

      要理解Transformer如何在內部執行程序,不妨用一種稍微不同的方式來思考計算。

      想象一個筆記本,計算的每一步都寫在下一行。一旦寫下,前面的行就不能更改;筆記本只會越來越厚。

      這驚人地接近自回歸Transformer的工作方式:提示詞是輸入,生成的智元形成不斷增長的軌跡,每個新智元都是通過注意力機制回看少量位置后產生的。

      比如,給定一個句子,統計其中動詞的數量是奇數還是偶數。每個軌跡智元恰好關注兩個位置:對應的輸入詞(檢查它是否是動詞)和前一個軌跡智元(讀取當前的奇偶狀態)。


      請注意,無論句子有多長,每一步都只需要兩次回看(一次看提示詞,一次看軌跡)。

      這正是其中的核心洞察:許多算法都可以表示成這種只增不減的軌跡,每一步只需讀取少量、固定數量的先前位置。

      那么,計算能否被表示成一條只增不減的軌跡,且每一步只需回看少量次數呢?

      答案是肯定的。

      在Christos Tzamos的系統中,AI模型明確地生成了這樣的軌跡。

      它生成的智元代表了一個虛擬機的動態狀態:指令指針、內存和棧操作、算術運算、控制流以及輸出。

      AI只需通過回看相關的先前步驟,就能重構出當前狀態。

      這幾乎就是圖靈機!


      圖靈機是一種抽象的計算機模型,它通過在一個無限長的紙帶上進行讀寫操作來執行計算。

      但即使Transformer能表示這種執行軌跡,隨著軌跡變長,標準的解碼過程仍然會付出越來越高的成本。

      然而,Christos Tzamos等提出了快速解碼路徑,消除了這一障礙,而二維注意力頭限制,正是實現這一快速路徑的關鍵。


      總的來說,這件事真正有價值的地方,不在于「模型更會算了」,而有些能力,可以直接以「系統」的形式嵌入進去。

      當Transformer內部開始運行真正的程序,LLM就不再只是一個概率模型,而更像一個由推理系統和計算引擎組成的混合體。

      AI,正在變成一整套可以執行、可以組合、可以擴展的系統。

      這,可能就是下一代AI的真正方向。

      參考資料:

      https://x.com/mtrainier2020/status/2033640996337291482

      https://www.percepta.ai/blog/can-llms-be-computers

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      國米這樣的球員真的不必留!藍黑軍團兩次吃虧,不能再重蹈覆轍!

      國米這樣的球員真的不必留!藍黑軍團兩次吃虧,不能再重蹈覆轍!

      肥強侃球
      2026-03-20 22:52:30
      俄羅斯可能在5至7年內建成月球核電站

      俄羅斯可能在5至7年內建成月球核電站

      財聯社
      2026-03-20 20:33:04
      伊朗宣布擊中美軍F-35戰機,美軍承認戰機緊急迫降,事件正在調查中

      伊朗宣布擊中美軍F-35戰機,美軍承認戰機緊急迫降,事件正在調查中

      環球網資訊
      2026-03-21 07:07:29
      方媛這身材,50歲的郭富城怎么頂的住,從每月20萬到黑卡隨便刷!

      方媛這身材,50歲的郭富城怎么頂的住,從每月20萬到黑卡隨便刷!

      一盅情懷
      2026-03-12 18:10:03
      看馬龍,卻被霍家兄弟暖到!霍啟剛滿眼都是晶晶,霍啟山溫柔護嫂

      看馬龍,卻被霍家兄弟暖到!霍啟剛滿眼都是晶晶,霍啟山溫柔護嫂

      觀察鑒娛
      2026-03-21 09:43:27
      上海市中心知名醫院要“沒了”?網友感嘆曾經“早上5點去排隊搶號”;醫生發文“世上再無”,最新情況→

      上海市中心知名醫院要“沒了”?網友感嘆曾經“早上5點去排隊搶號”;醫生發文“世上再無”,最新情況→

      新民晚報
      2026-03-20 19:27:19
      不敢打仗,不想打仗,也打不了仗,革命衛隊軍心散了!

      不敢打仗,不想打仗,也打不了仗,革命衛隊軍心散了!

      知兵
      2026-03-20 23:55:04
      整個明朝幾乎都有倭寇之亂,為何到了清朝,倭寇就消失了?

      整個明朝幾乎都有倭寇之亂,為何到了清朝,倭寇就消失了?

      銘記歷史呀
      2026-03-18 16:14:20
      海南觀光車突發車禍2死5傷:身份披露,畫面流出,事發全過程曝光

      海南觀光車突發車禍2死5傷:身份披露,畫面流出,事發全過程曝光

      博士觀察
      2026-03-21 13:42:18
      東方電氣,斬獲900億訂單!

      東方電氣,斬獲900億訂單!

      投研邦V
      2026-03-20 19:42:59
      梅婷分享在家做芝麻小燒餅,婆媳關系不錯,婆婆做好飯菜送過來

      梅婷分享在家做芝麻小燒餅,婆媳關系不錯,婆婆做好飯菜送過來

      調侃國際觀點
      2026-03-20 22:00:27
      動作明星羅禮士86歲離世,《猛龍過江》與李小龍對戰成經典

      動作明星羅禮士86歲離世,《猛龍過江》與李小龍對戰成經典

      調侃國際觀點
      2026-03-21 12:22:35
      錢再多有什么用?2個女兒慘死 3個兒子反目,千億家產換不來親情

      錢再多有什么用?2個女兒慘死 3個兒子反目,千億家產換不來親情

      睿鑒歷史
      2026-03-19 20:35:03
      伊朗外長:伊朗有意允許與日本相關的船只通行霍爾木茲海峽

      伊朗外長:伊朗有意允許與日本相關的船只通行霍爾木茲海峽

      財聯社
      2026-03-21 10:45:04
      2025年湖北省出生人口下降21%,天門市出生人口逆勢增長

      2025年湖北省出生人口下降21%,天門市出生人口逆勢增長

      何亞福
      2026-03-21 07:17:53
      今早杭州一高層失火,隔壁小區住戶:“當時外面白茫茫一片,火很快撲滅”

      今早杭州一高層失火,隔壁小區住戶:“當時外面白茫茫一片,火很快撲滅”

      都市快報橙柿互動
      2026-03-21 13:16:49
      地球上真的缺油嗎?實際上是多得用不完

      地球上真的缺油嗎?實際上是多得用不完

      比利
      2026-03-18 21:40:05
      蘋果CEO庫克:新款Mac吸引了創紀錄的首購客戶

      蘋果CEO庫克:新款Mac吸引了創紀錄的首購客戶

      第一財經資訊
      2026-03-21 09:00:44
      雷軍稱新一代SU7門把手安全設計100%符合2027年新國標:碰撞后仍可正常解鎖,有應急機械拉手,車內無需解中控鎖即可開門

      雷軍稱新一代SU7門把手安全設計100%符合2027年新國標:碰撞后仍可正常解鎖,有應急機械拉手,車內無需解中控鎖即可開門

      極目新聞
      2026-03-19 20:26:12
      耍大牌?19歲王鈺棟僅答1個問題便扭頭就走!名記:態度決定一切

      耍大牌?19歲王鈺棟僅答1個問題便扭頭就走!名記:態度決定一切

      我愛英超
      2026-03-21 06:21:14
      2026-03-21 15:11:00
      新智元 incentive-icons
      新智元
      AI產業主平臺領航智能+時代
      14772文章數 66703關注度
      往期回顧 全部

      科技要聞

      宇樹招股書拆解,人形機器人出貨量第一!

      頭條要聞

      女子花20萬元租下老宅20年 一家三口從城市搬進鄉村住

      頭條要聞

      女子花20萬元租下老宅20年 一家三口從城市搬進鄉村住

      體育要聞

      誰在決定字母哥未來?

      娛樂要聞

      CMG盛典獲獎名單:章子怡高葉同獲影后

      財經要聞

      通脹警報拉響,加息潮要來了?

      汽車要聞

      小鵬汽車2025年Q4盈利凈賺3.8億 全年營收767億

      態度原創

      手機
      家居
      游戲
      時尚
      本地

      手機要聞

      雙雙破400萬!華為小米組成國產旗艦第一梯隊,競爭已進入白熱化

      家居要聞

      時空交織 空間綺夢

      Take-Two高管認為內存價格不會影響次世代主機發布

      今年春天一定要擁有“這件衣服”,減齡又好看!

      本地新聞

      春色滿城關不住|紹興春日頂流,這片櫻花海藏不住了

      無障礙瀏覽 進入關懷版