<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>

色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3

<legend id="55lbo"><track id="55lbo"></track></legend>

<cite id="55lbo"></cite>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

太瘋了！MIT博士在Transformer里造計算機，攻破LLM終極缺陷

2026-03-21 10:11:31　來源: 新智元

北京舉報

0

分享至

新智元報道

編輯：KingHZ Aeneas

【新智元導讀】炸裂！就在剛剛，一位MIT博士，在Transformer里造出個計算機。現在，模型一舉洗刷「9.11與9.9哪個大」的恥辱，幾秒內運行數百萬步程序，世界最難數獨準確率100%！大模型的能力邊界，從此徹底改變。

就在剛剛，AI圈被一項暴力美學般的突破，徹底震碎了三觀。

一位MIT博士，在Transformer里，直接造出了個計算機！

注意，不是外掛插件，不是調用工具（Tool Use），而是通過一種近乎瘋狂的硬編碼方式，將一個WebAssembly (WASM) 解釋器無損地（Losslessly）嵌入到了Transformer模型的權重之中。

這位博士老哥，是真的把LLM玩出硬件感了

這意味著，從此LLM不再是靠概率預測下一個智元（Token）的文字游戲機，而是進化成了一臺真正的數字計算機。

如果你以為，LLM現在還算不清「9.11與9.9哪個大」，現在，你的認知將被徹底粉碎！

現在，這篇帖子已經在X上熱轉，引來眾多開發者大神的瘋狂點贊。

可以說，它一舉洗刷了大模型3年以來的「恥辱」。

「Vibe Coding」之父、大神Karpathy直接驚呼：這項研究太棒了，實在是令人深受啟發！

LLM終極弱點，被徹底攻破

作為一種新類型的智能，大模型能解研究級難題，但不借助外部工具，卻幾乎不可能完成兩個數相乘或解個小數獨。

那么，如何讓LLM本身變得像計算機一樣可靠高效？

答案是：在Transformer內部實實在在地構建一臺計算機。

雅典大學副教授、MIT博士Christos Tzamos及其Percepta團隊將任意C代碼轉化為智元（Token），讓模型自己能可靠執行，在幾秒內運行數百萬步。

鏈接：https://www.percepta.ai/blog/can-llms-be-computers

通過匈牙利算法，它解決了一個多步優化問題，即求解最小成本完美匹配，運作方式如下。

在這個過程中，AI并不調用外部工具。

所有計算都是在Transformer內部以自回歸的方式完成的！

這里的難點在于，對于任何實際計算來說，LLM的標準注意力機制太慢了。

為了繞過這一限制，他們發明了一種新的解碼路徑，實現了指數級加速的注意力機制，讓每智元（Token）生成所需的幾乎所有計算量智元（Token），并在CPU上以超過每秒3萬個智元（Token）的速度流式輸出結果。

要知道MacBook M2 Pro的解碼速度才每秒27個智元（token），每秒33000個智元（Token）堪稱火箭般的速度，讓人難以想象！

當然，用LLM的計算速度無法與CPU相比，這項研究的關鍵意義在于賦予LLM內在計算能力，真正教會AI算數，讓它更聰明。

而這項能力與自動研究相結合，未來探索空間更是遠超想象。

網友贊嘆：這才是真正的原生智能！

傳統attention

可以退出歷史舞臺？

注意，這項工作，并不是讓模型更會算，而是讓模型在內部真正執行程序！

不靠外掛，不調用Python，所有計算，都發生在Transformer里。

更離譜的是，這臺「計算機」幾秒就能跑完百萬步的程序。連做最難的數獨，正確率都是100%。

在3分鐘內，它就實現了100%的精確求解

這種方法不僅可用于速度，它可以用于執行任意代碼——就像在AI腦子中塞入了一臺電腦。

按照大V「Rainier」的說法，這個思路有點類似于TI的dsp芯片：ARM負責邏輯思維，dsp專門負責高速數據計算，各取所長。

這也意味著，一種Hybrid LLM架構的全新范式開始出現，其中神經網絡負責推理和理解，嵌入式解釋器/計算引擎負責高精度計算。

于是可以同時兼顧推理能力和確定性計算精度，徹底解決「9.11和9.9哪個大」這個問題。

這個方向走通的話，數值計算、物理模擬、金融建模、密碼學運算，都會發生極大變革。

傳統Attention太慢，根本不適合做計算，而這項研究，直接引爆了Transformer的范式躍遷！

AI最大的恥辱，如今被終結了

三年了。

三年來，每個頂級AI經歷過同一個社死時刻：當你在臺上信心滿滿地演示大模型的超強推理能力，臺下忽然有人舉手提問：「那請問，9.11和9.9哪個大？」

模型回答「9.11 > 9.9」，全場哄堂大笑。

這不是段子，這是真實發生過無數次的事。

2024年，在記者Matt Barnum測試中，基于ChatGPT的學習輔導工具Khanmigo，有時連算術題的答案都拿不準

原因不難理解：Transformer本為理解語言設計的，并非為精確計算設計。

讓大模型做算術，就像讓莎士比亞做會計——他能把財報寫成十四行詩，但數字八成對不上。

AI行業的補丁方案是「外掛工具」：算不了？那就調Python。

這相當于給莎士比亞旁邊放了個計算器。雖然能用，但并不優雅，而且每次調用都打斷推理鏈、增加延遲、引入安全風險。

現在，MIT博士說：別給莎士比亞放計算器了，直接讓他天生就會算數！

他們把一臺完整的WebAssembly虛擬機，硬編碼進了Transformer的權重里。

也就是說，神經網絡的前向傳播過程本身，就等價于執行一臺計算機。

過去AI的恥辱，如今終結了。

不過，但就數獨問題而言，這不是LLM第一次突破。

工程師Aviraj認為Percepta的方法很酷，但他們采取了不同的、更面向具體問題的路徑。

核心區別在于：不將通用編譯產物（如C->WASM）作為模型的學習目標，而是為特定任務設計一個極簡的、領域專用的指令集（PSVM）。

不過，這次看看Christos Tzamos團隊如何在Transformer內部跑起來一臺電腦的。

這個過程的關鍵，就是找到一種方法，來編碼一臺可工作的計算機。

計算：一條只增不減的軌跡

要理解Transformer如何在內部執行程序，不妨用一種稍微不同的方式來思考計算。

想象一個筆記本，計算的每一步都寫在下一行。一旦寫下，前面的行就不能更改；筆記本只會越來越厚。

這驚人地接近自回歸Transformer的工作方式：提示詞是輸入，生成的智元形成不斷增長的軌跡，每個新智元都是通過注意力機制回看少量位置后產生的。

比如，給定一個句子，統計其中動詞的數量是奇數還是偶數。每個軌跡智元恰好關注兩個位置：對應的輸入詞（檢查它是否是動詞）和前一個軌跡智元（讀取當前的奇偶狀態）。

請注意，無論句子有多長，每一步都只需要兩次回看（一次看提示詞，一次看軌跡）。

這正是其中的核心洞察：許多算法都可以表示成這種只增不減的軌跡，每一步只需讀取少量、固定數量的先前位置。

那么，計算能否被表示成一條只增不減的軌跡，且每一步只需回看少量次數呢？

答案是肯定的。

在Christos Tzamos的系統中，AI模型明確地生成了這樣的軌跡。

它生成的智元代表了一個虛擬機的動態狀態：指令指針、內存和棧操作、算術運算、控制流以及輸出。

AI只需通過回看相關的先前步驟，就能重構出當前狀態。

這幾乎就是圖靈機！

圖靈機是一種抽象的計算機模型，它通過在一個無限長的紙帶上進行讀寫操作來執行計算。

但即使Transformer能表示這種執行軌跡，隨著軌跡變長，標準的解碼過程仍然會付出越來越高的成本。

然而，Christos Tzamos等提出了快速解碼路徑，消除了這一障礙，而二維注意力頭限制，正是實現這一快速路徑的關鍵。

總的來說，這件事真正有價值的地方，不在于「模型更會算了」，而有些能力，可以直接以「系統」的形式嵌入進去。

當Transformer內部開始運行真正的程序，LLM就不再只是一個概率模型，而更像一個由推理系統和計算引擎組成的混合體。

AI，正在變成一整套可以執行、可以組合、可以擴展的系統。

這，可能就是下一代AI的真正方向。

參考資料：

https://x.com/mtrainier2020/status/2033640996337291482

https://www.percepta.ai/blog/can-llms-be-computers

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

Sakana AI造了個數字生命「培養皿」，AI學會打架、結盟、搶地盤

機器之心Pro 2025-11-05 13:58:14
0 跟貼 0
一文速通「機器人3D場景表示」發展史

機器之心Pro 2026-01-23 13:01:05
0 跟貼 0

AI主權的底層戰爭：全同態加密正在成為新基礎設施

36氪 2026-02-28 17:20:13
0 跟貼 0

DeepSeek最會討好，LLM太懂人情世故了，超人類50%

機器之心Pro 2025-10-27 15:23:21
13 跟貼 13
AI編程元年：初級開發者被「團滅」？

新智元 2026-03-21 12:38:36
1 跟貼 1

從“聰明的廢物”到“數字員工”，智能體落地如何破局

鈦媒體APP 2026-03-19 15:06:34
1 跟貼 1

微軟大刀闊斧重組AI部門

虎嗅APP 2026-03-21 06:00:04
0 跟貼 0
Cursor自研新模型反超 Opus 4.6，主打“價格打一折”，網友群嘲“Kimi 2.5套殼”，馬斯克認證

華爾街見聞官方 2026-03-21 13:35:08
0 跟貼 0

排面拉滿！馬斯克一周兩次點名Kimi，國產AI真的贏麻了

雷科技 2026-03-21 14:54:07
0 跟貼 0
MIT新方法讓兩顆芯片共享唯一“指紋”，重寫硬件安全規則

DeepTech深科技 2026-02-25 17:32:10
0 跟貼 0
科學家研發大模型新框架，助力解決RISC-V軟件生態瓶頸

DeepTech深科技 2025-10-12 19:05:00
1 跟貼 1
對話越疆劉培超：春晚隱藏具身選手，卻是百億市值大玩家

量子位 2026-03-21 10:29:58
0 跟貼 0
阿里、Kimi、螞蟻集體押注，混合注意力從可選項變必答題？

智東西 2026-03-20 19:27:31
0 跟貼 0
奧特曼宣判Transformer死刑！ AGI兩年內降臨，下一代架構已在路上

新智元 2026-03-16 20:33:23
70 跟貼 70
理想汽車2026 GTC發布MindVLA-o1模型，讓車具備理解3D空間能力

IT之家 2026-03-18 22:54:07
1 跟貼 1
冠軍獨享200萬！鵝廠聯手KDD發題，高校博士、頂尖大牛連夜組隊

新智元 2026-03-20 21:25:23
0 跟貼 0
索尼大招來了！PS確認引入幀生成技術官方版更先進

游民星空 2026-03-21 11:04:11
1 跟貼 1
終于有人把計算機二級怎么過線講明白了！！

小戴同學呃 2026-03-19 00:19:06
0 跟貼 0
PS玩家的福音！PS5首席架構師官宣將推出等效幀生成庫技術

宗熙先生 2026-03-21 10:45:01
0 跟貼 0
新華社消息｜四部門印發指引規范平臺企業開展勞動規則和算法協商

新華社 2026-03-20 15:21:09
0 跟貼 0
模型飛機試飛，鏡頭一轉發現事不簡單，美女吃了熊心豹子膽

美妙一籮筐 2026-03-20 11:43:33
0 跟貼 0
山西省冠突施飛刀猛攻柳大華！東方電腦反手一刀

象棋王闖 2026-03-17 14:16:06
0 跟貼 0
“媽，門口要錢，我們就不進去看你了”，游客在壺口瀑布外拍視頻被投訴侵權，山西壺口瀑布景區：事發地是陜西壺口瀑布，我們也是受害者

觀威海 2026-03-18 14:47:02
38938 跟貼 38938
龍蝦硬件能讓電池更健康，支持智能充電器

愛范兒 2026-03-10 04:18:42
0 跟貼 0
13歲小孩哥自己改造電腦，把電腦拆剩下屏幕和重要零件，網友：這動手能力真強

星沙時報 2026-03-20 18:20:49
17 跟貼 17
江蘇省省管領導干部任職前公示

江蘇新聞 2026-03-20 18:08:11
131 跟貼 131
女子演示華為折疊電腦使用方法，男子看完直接愣住

觀象視頻 2026-03-19 16:13:04
0 跟貼 0
漲瘋了有商家暫停接單上海人慌了：最近正是剛需

上觀新聞 2026-03-20 15:10:07
462 跟貼 462
瑞士宣布暫停向美國出口戰爭物資

環球網資訊 2026-03-20 22:23:12
4276 跟貼 4276
想玩機械模型？這個能發動！#金屬拼裝 #V12發動機

制造科技 2026-03-19 23:00:29
0 跟貼 0
全球龍蝦批量黑化！Meta2小時災難擊穿硅谷心臟，OpenClaw反噬來襲

新智元 2026-03-21 10:11:37
8 跟貼 8
上海市中心知名醫院要“沒了”？網友感嘆曾經“早上5點去排隊搶號”；醫生發文“世上再無”，最新情況→

新民晚報 2026-03-20 19:27:19
988 跟貼 988
1101套房只有1人選房，深圳一安居房項目屢戰屢“冷”

南方都市報 2026-03-20 22:14:18
666 跟貼 666
男子講他的手辦模型都是幾十塊買的，于是老婆用豆包詢問價錢，網友：最后豆包還回一句“差不多”

重慶科教融媒體 2026-03-21 12:20:29
0 跟貼 0
上海百年老店官宣閉店！曾經去吃頓飯可要一大早就排長隊，承載了幾代人的記憶，不少阿姨爺叔的“第一次”

上觀新聞 2026-03-18 17:41:49
919 跟貼 919
“你已進入艷遇高發地”，河南項城知名商場內現不雅標語，當地市場監管局回應：商場已自行撤下該廣告牌

哈爾濱日報 2026-03-21 14:17:00
2 跟貼 2
拉里賈尼遇害，光有內鬼還不夠，以色列玩起“算法獵殺”？

谷火平 2026-03-18 18:56:25
0 跟貼 0
1/12價格，性能追平旗艦！ GPT-5.4 mini和nano深夜上線 OpenAI直呼“還有誰”

新智元 2026-03-19 17:05:20
0 跟貼 0
英偉達"確認"DLSS5重繪游戲畫面:這下真要一鍵美顏了

游民星空 2026-03-21 10:22:12
3 跟貼 3
浙江一中學招聘競賽教練，最高200萬元年薪，學校：已有人致電咨詢

大風新聞 2026-03-20 22:27:03
76 跟貼 76

國米這樣的球員真的不必留！藍黑軍團兩次吃虧，不能再重蹈覆轍！

國米這樣的球員真的不必留！藍黑軍團兩次吃虧，不能再重蹈覆轍！

肥強侃球

2026-03-20 22:52:30

俄羅斯可能在5至7年內建成月球核電站

俄羅斯可能在5至7年內建成月球核電站

財聯社

2026-03-20 20:33:04

伊朗宣布擊中美軍F-35戰機，美軍承認戰機緊急迫降，事件正在調查中

伊朗宣布擊中美軍F-35戰機，美軍承認戰機緊急迫降，事件正在調查中

環球網資訊

2026-03-21 07:07:29

方媛這身材，50歲的郭富城怎么頂的住，從每月20萬到黑卡隨便刷！

方媛這身材，50歲的郭富城怎么頂的住，從每月20萬到黑卡隨便刷！

一盅情懷

2026-03-12 18:10:03

看馬龍，卻被霍家兄弟暖到！霍啟剛滿眼都是晶晶，霍啟山溫柔護嫂

看馬龍，卻被霍家兄弟暖到！霍啟剛滿眼都是晶晶，霍啟山溫柔護嫂

觀察鑒娛

2026-03-21 09:43:27

上海市中心知名醫院要“沒了”？網友感嘆曾經“早上5點去排隊搶號”；醫生發文“世上再無”，最新情況→

上海市中心知名醫院要“沒了”？網友感嘆曾經“早上5點去排隊搶號”；醫生發文“世上再無”，最新情況→

新民晚報

2026-03-20 19:27:19

不敢打仗，不想打仗，也打不了仗，革命衛隊軍心散了！

不敢打仗，不想打仗，也打不了仗，革命衛隊軍心散了！

知兵

2026-03-20 23:55:04

整個明朝幾乎都有倭寇之亂，為何到了清朝，倭寇就消失了？

整個明朝幾乎都有倭寇之亂，為何到了清朝，倭寇就消失了？

銘記歷史呀

2026-03-18 16:14:20

海南觀光車突發車禍2死5傷：身份披露，畫面流出，事發全過程曝光

海南觀光車突發車禍2死5傷：身份披露，畫面流出，事發全過程曝光

博士觀察

2026-03-21 13:42:18

東方電氣，斬獲900億訂單！

投研邦V

2026-03-20 19:42:59

梅婷分享在家做芝麻小燒餅，婆媳關系不錯，婆婆做好飯菜送過來

梅婷分享在家做芝麻小燒餅，婆媳關系不錯，婆婆做好飯菜送過來

調侃國際觀點

2026-03-20 22:00:27

動作明星羅禮士86歲離世，《猛龍過江》與李小龍對戰成經典

動作明星羅禮士86歲離世，《猛龍過江》與李小龍對戰成經典

調侃國際觀點

2026-03-21 12:22:35

錢再多有什么用？2個女兒慘死 3個兒子反目，千億家產換不來親情

錢再多有什么用？2個女兒慘死 3個兒子反目，千億家產換不來親情

睿鑒歷史

2026-03-19 20:35:03

伊朗外長：伊朗有意允許與日本相關的船只通行霍爾木茲海峽

伊朗外長：伊朗有意允許與日本相關的船只通行霍爾木茲海峽

財聯社

2026-03-21 10:45:04

2025年湖北省出生人口下降21%，天門市出生人口逆勢增長

2025年湖北省出生人口下降21%，天門市出生人口逆勢增長

何亞福

2026-03-21 07:17:53

今早杭州一高層失火，隔壁小區住戶：“當時外面白茫茫一片，火很快撲滅”

今早杭州一高層失火，隔壁小區住戶：“當時外面白茫茫一片，火很快撲滅”

都市快報橙柿互動

2026-03-21 13:16:49

地球上真的缺油嗎？實際上是多得用不完

地球上真的缺油嗎？實際上是多得用不完

比利

2026-03-18 21:40:05

蘋果CEO庫克：新款Mac吸引了創紀錄的首購客戶

蘋果CEO庫克：新款Mac吸引了創紀錄的首購客戶

第一財經資訊

2026-03-21 09:00:44

雷軍稱新一代SU7門把手安全設計100%符合2027年新國標：碰撞后仍可正常解鎖，有應急機械拉手，車內無需解中控鎖即可開門

雷軍稱新一代SU7門把手安全設計100%符合2027年新國標：碰撞后仍可正常解鎖，有應急機械拉手，車內無需解中控鎖即可開門

極目新聞

2026-03-19 20:26:12

耍大牌？19歲王鈺棟僅答1個問題便扭頭就走！名記：態度決定一切

耍大牌？19歲王鈺棟僅答1個問題便扭頭就走！名記：態度決定一切

我愛英超

2026-03-21 06:21:14

AI產業主平臺領航智能+時代

14772文章數 66703關注度

往期回顧全部

科技要聞

宇樹招股書拆解，人形機器人出貨量第一！

頭條要聞

女子花20萬元租下老宅20年一家三口從城市搬進鄉村住

頭條要聞

女子花20萬元租下老宅20年一家三口從城市搬進鄉村住

體育要聞

誰在決定字母哥未來？

娛樂要聞

CMG盛典獲獎名單：章子怡高葉同獲影后

財經要聞

通脹警報拉響，加息潮要來了？

汽車要聞

小鵬汽車2025年Q4盈利凈賺3.8億全年營收767億

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

手機

家居

游戲

時尚

本地

手機要聞

雙雙破400萬！華為小米組成國產旗艦第一梯隊，競爭已進入白熱化

家居要聞

時空交織空間綺夢

奶棕撞色輕法輕奢風
復古格紋輕法森系風
侘寂美學無用之美

Take-Two高管認為內存價格不會影響次世代主機發布

今年春天一定要擁有“這件衣服”，減齡又好看！

本地新聞

春色滿城關不住｜紹興春日頂流，這片櫻花海藏不住了

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

<sub id="accrz"><p id="accrz"><form id="accrz"></form></p></sub>

<legend id="accrz"></legend>