<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>

色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3

<cite id="tyrqr"></cite>

<s id="tyrqr"></s>

<legend id="tyrqr"></legend>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

太瘋了！MIT博士在Transformer里造計算機，攻破LLM終極缺陷

2026-03-21 10:11:31　來源: 新智元

北京舉報

0

分享至

新智元報道

編輯：KingHZ Aeneas

【新智元導讀】炸裂！就在剛剛，一位MIT博士，在Transformer里造出個計算機。現在，模型一舉洗刷「9.11與9.9哪個大」的恥辱，幾秒內運行數百萬步程序，世界最難數獨準確率100%！大模型的能力邊界，從此徹底改變。

就在剛剛，AI圈被一項暴力美學般的突破，徹底震碎了三觀。

一位MIT博士，在Transformer里，直接造出了個計算機！

注意，不是外掛插件，不是調用工具（Tool Use），而是通過一種近乎瘋狂的硬編碼方式，將一個WebAssembly (WASM) 解釋器無損地（Losslessly）嵌入到了Transformer模型的權重之中。

這位博士老哥，是真的把LLM玩出硬件感了

這意味著，從此LLM不再是靠概率預測下一個智元（Token）的文字游戲機，而是進化成了一臺真正的數字計算機。

如果你以為，LLM現在還算不清「9.11與9.9哪個大」，現在，你的認知將被徹底粉碎！

現在，這篇帖子已經在X上熱轉，引來眾多開發者大神的瘋狂點贊。

可以說，它一舉洗刷了大模型3年以來的「恥辱」。

「Vibe Coding」之父、大神Karpathy直接驚呼：這項研究太棒了，實在是令人深受啟發！

LLM終極弱點，被徹底攻破

作為一種新類型的智能，大模型能解研究級難題，但不借助外部工具，卻幾乎不可能完成兩個數相乘或解個小數獨。

那么，如何讓LLM本身變得像計算機一樣可靠高效？

答案是：在Transformer內部實實在在地構建一臺計算機。

雅典大學副教授、MIT博士Christos Tzamos及其Percepta團隊將任意C代碼轉化為智元（Token），讓模型自己能可靠執行，在幾秒內運行數百萬步。

鏈接：https://www.percepta.ai/blog/can-llms-be-computers

通過匈牙利算法，它解決了一個多步優化問題，即求解最小成本完美匹配，運作方式如下。

在這個過程中，AI并不調用外部工具。

所有計算都是在Transformer內部以自回歸的方式完成的！

這里的難點在于，對于任何實際計算來說，LLM的標準注意力機制太慢了。

為了繞過這一限制，他們發明了一種新的解碼路徑，實現了指數級加速的注意力機制，讓每智元（Token）生成所需的幾乎所有計算量智元（Token），并在CPU上以超過每秒3萬個智元（Token）的速度流式輸出結果。

要知道MacBook M2 Pro的解碼速度才每秒27個智元（token），每秒33000個智元（Token）堪稱火箭般的速度，讓人難以想象！

當然，用LLM的計算速度無法與CPU相比，這項研究的關鍵意義在于賦予LLM內在計算能力，真正教會AI算數，讓它更聰明。

而這項能力與自動研究相結合，未來探索空間更是遠超想象。

網友贊嘆：這才是真正的原生智能！

傳統attention

可以退出歷史舞臺？

注意，這項工作，并不是讓模型更會算，而是讓模型在內部真正執行程序！

不靠外掛，不調用Python，所有計算，都發生在Transformer里。

更離譜的是，這臺「計算機」幾秒就能跑完百萬步的程序。連做最難的數獨，正確率都是100%。

在3分鐘內，它就實現了100%的精確求解

這種方法不僅可用于速度，它可以用于執行任意代碼——就像在AI腦子中塞入了一臺電腦。

按照大V「Rainier」的說法，這個思路有點類似于TI的dsp芯片：ARM負責邏輯思維，dsp專門負責高速數據計算，各取所長。

這也意味著，一種Hybrid LLM架構的全新范式開始出現，其中神經網絡負責推理和理解，嵌入式解釋器/計算引擎負責高精度計算。

于是可以同時兼顧推理能力和確定性計算精度，徹底解決「9.11和9.9哪個大」這個問題。

這個方向走通的話，數值計算、物理模擬、金融建模、密碼學運算，都會發生極大變革。

傳統Attention太慢，根本不適合做計算，而這項研究，直接引爆了Transformer的范式躍遷！

AI最大的恥辱，如今被終結了

三年了。

三年來，每個頂級AI經歷過同一個社死時刻：當你在臺上信心滿滿地演示大模型的超強推理能力，臺下忽然有人舉手提問：「那請問，9.11和9.9哪個大？」

模型回答「9.11 > 9.9」，全場哄堂大笑。

這不是段子，這是真實發生過無數次的事。

2024年，在記者Matt Barnum測試中，基于ChatGPT的學習輔導工具Khanmigo，有時連算術題的答案都拿不準

原因不難理解：Transformer本為理解語言設計的，并非為精確計算設計。

讓大模型做算術，就像讓莎士比亞做會計——他能把財報寫成十四行詩，但數字八成對不上。

AI行業的補丁方案是「外掛工具」：算不了？那就調Python。

這相當于給莎士比亞旁邊放了個計算器。雖然能用，但并不優雅，而且每次調用都打斷推理鏈、增加延遲、引入安全風險。

現在，MIT博士說：別給莎士比亞放計算器了，直接讓他天生就會算數！

他們把一臺完整的WebAssembly虛擬機，硬編碼進了Transformer的權重里。

也就是說，神經網絡的前向傳播過程本身，就等價于執行一臺計算機。

過去AI的恥辱，如今終結了。

不過，但就數獨問題而言，這不是LLM第一次突破。

工程師Aviraj認為Percepta的方法很酷，但他們采取了不同的、更面向具體問題的路徑。

核心區別在于：不將通用編譯產物（如C->WASM）作為模型的學習目標，而是為特定任務設計一個極簡的、領域專用的指令集（PSVM）。

不過，這次看看Christos Tzamos團隊如何在Transformer內部跑起來一臺電腦的。

這個過程的關鍵，就是找到一種方法，來編碼一臺可工作的計算機。

計算：一條只增不減的軌跡

要理解Transformer如何在內部執行程序，不妨用一種稍微不同的方式來思考計算。

想象一個筆記本，計算的每一步都寫在下一行。一旦寫下，前面的行就不能更改；筆記本只會越來越厚。

這驚人地接近自回歸Transformer的工作方式：提示詞是輸入，生成的智元形成不斷增長的軌跡，每個新智元都是通過注意力機制回看少量位置后產生的。

比如，給定一個句子，統計其中動詞的數量是奇數還是偶數。每個軌跡智元恰好關注兩個位置：對應的輸入詞（檢查它是否是動詞）和前一個軌跡智元（讀取當前的奇偶狀態）。

請注意，無論句子有多長，每一步都只需要兩次回看（一次看提示詞，一次看軌跡）。

這正是其中的核心洞察：許多算法都可以表示成這種只增不減的軌跡，每一步只需讀取少量、固定數量的先前位置。

那么，計算能否被表示成一條只增不減的軌跡，且每一步只需回看少量次數呢？

答案是肯定的。

在Christos Tzamos的系統中，AI模型明確地生成了這樣的軌跡。

它生成的智元代表了一個虛擬機的動態狀態：指令指針、內存和棧操作、算術運算、控制流以及輸出。

AI只需通過回看相關的先前步驟，就能重構出當前狀態。

這幾乎就是圖靈機！

圖靈機是一種抽象的計算機模型，它通過在一個無限長的紙帶上進行讀寫操作來執行計算。

但即使Transformer能表示這種執行軌跡，隨著軌跡變長，標準的解碼過程仍然會付出越來越高的成本。

然而，Christos Tzamos等提出了快速解碼路徑，消除了這一障礙，而二維注意力頭限制，正是實現這一快速路徑的關鍵。

總的來說，這件事真正有價值的地方，不在于「模型更會算了」，而有些能力，可以直接以「系統」的形式嵌入進去。

當Transformer內部開始運行真正的程序，LLM就不再只是一個概率模型，而更像一個由推理系統和計算引擎組成的混合體。

AI，正在變成一整套可以執行、可以組合、可以擴展的系統。

這，可能就是下一代AI的真正方向。

參考資料：

https://x.com/mtrainier2020/status/2033640996337291482

https://www.percepta.ai/blog/can-llms-be-computers

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

Sakana AI造了個數字生命「培養皿」，AI學會打架、結盟、搶地盤

機器之心Pro 2025-11-05 13:58:14
0 跟貼 0
AI主權的底層戰爭：全同態加密正在成為新基礎設施

36氪 2026-02-28 17:20:13
0 跟貼 0

DeepSeek最會討好，LLM太懂人情世故了，超人類50%

機器之心Pro 2025-10-27 15:23:21
13 跟貼 13

從“聰明的廢物”到“數字員工”，智能體落地如何破局

鈦媒體APP 2026-03-19 15:06:34
1 跟貼 1
AI取代程序員還遠！新基準BeyondSWE：頂尖模型通過率暴跌至45%

新智元 2026-03-20 21:23:15
1 跟貼 1

微軟大刀闊斧重組AI部門

虎嗅APP 2026-03-21 06:00:04
0 跟貼 0

銷量狂飆、沖刺IPO，AI眼鏡博弈下的新敘事

鈦媒體APP 2026-03-21 09:44:05
0 跟貼 0
MIT新方法讓兩顆芯片共享唯一“指紋”，重寫硬件安全規則

DeepTech深科技 2026-02-25 17:32:10
0 跟貼 0

對話越疆劉培超：春晚隱藏具身選手，卻是百億市值大玩家

量子位 2026-03-21 10:29:58
0 跟貼 0
奧特曼宣判Transformer死刑！ AGI兩年內降臨，下一代架構已在路上

新智元 2026-03-16 20:33:23
71 跟貼 71
冠軍獨享200萬！鵝廠聯手KDD發題，高校博士、頂尖大牛連夜組隊

新智元 2026-03-20 21:25:23
0 跟貼 0
阿里、Kimi、螞蟻集體押注，混合注意力從可選項變必答題？

智東西 2026-03-20 19:27:31
0 跟貼 0
索尼大招來了！PS確認引入幀生成技術官方版更先進

游民星空 2026-03-21 11:04:11
1 跟貼 1
比亞迪獲得發明專利授權：“車輛的輔助定位方法、系統及計算機介質”

證券之星 2026-03-21 03:29:19
0 跟貼 0
終于有人把計算機二級怎么過線講明白了??！

小戴同學呃 2026-03-19 00:19:06
0 跟貼 0
PS玩家的福音！PS5首席架構師官宣將推出等效幀生成庫技術

宗熙先生 2026-03-21 10:45:01
0 跟貼 0
新華社消息｜四部門印發指引規范平臺企業開展勞動規則和算法協商

新華社 2026-03-20 15:21:09
0 跟貼 0
模型飛機試飛，鏡頭一轉發現事不簡單，美女吃了熊心豹子膽

美妙一籮筐 2026-03-20 11:43:33
0 跟貼 0
山西省冠突施飛刀猛攻柳大華！東方電腦反手一刀

象棋王闖 2026-03-17 14:16:06
0 跟貼 0
“媽，門口要錢，我們就不進去看你了”，游客在壺口瀑布外拍視頻被投訴侵權，山西壺口瀑布景區：事發地是陜西壺口瀑布，我們也是受害者

觀威海 2026-03-18 14:47:02
35938 跟貼 35938
龍蝦硬件能讓電池更健康，支持智能充電器

愛范兒 2026-03-10 04:18:42
10 跟貼 10
男子曬出自己的電腦外設，打急眼了還能踩縫紉機，網友：別激動一

萌力暴擊 2026-03-18 13:12:05
1 跟貼 1
13歲小孩哥自己改造電腦，把電腦拆剩下屏幕和重要零件，網友：這動手能力真強

星沙時報 2026-03-20 18:20:49
14 跟貼 14
重慶市市長胡衡華，被查

新京報政事兒 2026-03-20 14:09:55
765 跟貼 765
女子演示華為折疊電腦使用方法，男子看完直接愣住

觀象視頻 2026-03-19 16:13:04
0 跟貼 0
漲瘋了有商家暫停接單上海人慌了：最近正是剛需

上觀新聞 2026-03-20 15:10:07
338 跟貼 338
瑞士宣布暫停向美國出口戰爭物資

環球網資訊 2026-03-20 22:23:12
3262 跟貼 3262
想玩機械模型？這個能發動！#金屬拼裝 #V12發動機

制造科技 2026-03-19 23:00:29
0 跟貼 0
全球龍蝦批量黑化！Meta2小時災難擊穿硅谷心臟，OpenClaw反噬來襲

新智元 2026-03-21 10:11:37
0 跟貼 0
上海市中心知名醫院要“沒了”？網友感嘆曾經“早上5點去排隊搶號”；醫生發文“世上再無”，最新情況→

新民晚報 2026-03-20 19:27:19
875 跟貼 875
1101套房只有1人選房，深圳一安居房項目屢戰屢“冷”

南方都市報 2026-03-20 22:14:18
553 跟貼 553
小米官方澄清：新一代SU7 Max零百加速變慢只因統計法不同

快科技 2026-03-21 00:31:03
12 跟貼 12
拉里賈尼遇害，光有內鬼還不夠，以色列玩起“算法獵殺”？

谷火平 2026-03-18 18:56:25
0 跟貼 0
1/12價格，性能追平旗艦！ GPT-5.4 mini和nano深夜上線 OpenAI直呼“還有誰”

新智元 2026-03-19 17:05:20
0 跟貼 0
雷軍回應新車為何漲價4000元，小米很快要做電腦“龍蝦”

南方都市報 2026-03-21 10:18:09
3 跟貼 3
英偉達"確認"DLSS5重繪游戲畫面:這下真要一鍵美顏了

游民星空 2026-03-21 10:22:12
1 跟貼 1
漲價！浙江姑娘腸子悔青，去年沒下單今年貴5000元！老板：可能還要漲

浙江之聲 2026-03-20 13:26:35
416 跟貼 416
浙江一中學招聘競賽教練，最高200萬元年薪，學校：已有人致電咨詢

大風新聞 2026-03-20 22:27:03
69 跟貼 69
47年一中國教授公開原子彈核心數據，美國審查：他是自己算出來的

鑒史錄 2026-03-21 08:55:03
0 跟貼 0
女子機場豪邁喝酒微醺上飛機：扔了可惜，喝的時候旁邊的人都驚了

星視頻 2026-03-20 12:58:28
140 跟貼 140

馬茂重拾一中原則，中國援建海水淡化廠，高票獲連任

馬茂重拾一中原則，中國援建海水淡化廠，高票獲連任

流年拾光

2026-03-19 17:21:16

上海黃毛爸酒鬼媽輔導作業，開口驚艷全網：真是人不可貌相！

上海黃毛爸酒鬼媽輔導作業，開口驚艷全網：真是人不可貌相！

潮鹿逐夢

2026-03-18 10:40:38

難怪特朗普不想打了，五角大樓公開真實傷亡，美軍終付慘痛的代價

難怪特朗普不想打了，五角大樓公開真實傷亡，美軍終付慘痛的代價

興史興談

2026-03-20 14:33:17

杜塞經理回應樊振東天價年薪！倪夏蓮卻道出轉會真相：并非只為錢！

杜塞經理回應樊振東天價年薪！倪夏蓮卻道出轉會真相：并非只為錢！

好乒乓

2026-03-20 11:44:19

38萬老車主看完新SU7配置單，沉默了……

38萬老車主看完新SU7配置單，沉默了……

道哥說車

2026-03-20 10:17:01

伊朗要復仇，特朗普增兵5000準備入侵本土，地面戰真要來了？

伊朗要復仇，特朗普增兵5000準備入侵本土，地面戰真要來了？

說歷史的老牢

2026-03-20 10:29:50

非法收受巨額財物！朱東亞、張偉被“雙開”

非法收受巨額財物！朱東亞、張偉被“雙開”

中國網

2026-03-20 16:45:04

全球約一半肝癌在中國！再三提醒：家里的5種食物，盡快撤下餐桌

全球約一半肝癌在中國！再三提醒：家里的5種食物，盡快撤下餐桌

DrX說

2026-03-18 14:39:50

深圳市長帶隊赴京當“HR”攬才，王傳福、顏寧現身助陣

深圳市長帶隊赴京當“HR”攬才，王傳福、顏寧現身助陣

南方都市報

2026-03-21 08:42:06

美媒評詹姆斯10大最難破紀錄：43210分僅第七，連續得分上雙第二

美媒評詹姆斯10大最難破紀錄：43210分僅第七，連續得分上雙第二

你的籃球頻道

2026-03-21 08:57:53

搞不懂Skills？看看Claude Code內部工程師們是怎么玩的

搞不懂Skills？看看Claude Code內部工程師們是怎么玩的

機器之心Pro

2026-03-20 14:21:04

破案了！廣東男籃輸球原因已找到，不怪徐杰，輸球全怪此人

破案了！廣東男籃輸球原因已找到，不怪徐杰，輸球全怪此人

畫夕

2026-03-21 11:24:51

芯片專家：中國有1000多臺ASML設備，有的設備竟然不拿來造芯片

芯片專家：中國有1000多臺ASML設備，有的設備竟然不拿來造芯片

逍遙漠

2026-03-21 07:47:46

全球央行超級周落幕！通脹警報拉響，加息潮要來了？

全球央行超級周落幕！通脹警報拉響，加息潮要來了？

第一財經資訊

2026-03-21 08:28:13

馬筱梅稱在臺辦滿月宴，由姥爺包辦，兒子姓氏要商量，張蘭不參加

馬筱梅稱在臺辦滿月宴，由姥爺包辦，兒子姓氏要商量，張蘭不參加

念得小柔

2026-03-20 22:05:12

張子宇為何在世預賽未展現出統治力？無非就是以下三點原因！

張子宇為何在世預賽未展現出統治力？無非就是以下三點原因！

田先生籃球

2026-03-20 11:30:18

帥化民：我特別討厭解放軍的一個叫“遠火”的武器

帥化民：我特別討厭解放軍的一個叫“遠火”的武器

安安說

2026-03-17 11:58:44

伊朗稱擊中美軍F-35戰機釋放何信號，專家分析→

伊朗稱擊中美軍F-35戰機釋放何信號，專家分析→

極目新聞

2026-03-20 17:09:34

從“賞”到“玩”，春日消費何以“繁花”朵朵？

從“賞”到“玩”，春日消費何以“繁花”朵朵？

新華社

2026-03-20 17:24:04

伊朗女足球員回國后控訴：澳大利亞警方施壓，逼迫我們說想留下

伊朗女足球員回國后控訴：澳大利亞警方施壓，逼迫我們說想留下

塵語者

2026-03-20 16:45:13

AI產業主平臺領航智能+時代

14770文章數 66703關注度

往期回顧全部

科技要聞

宇樹招股書拆解，人形機器人出貨量第一！

頭條要聞

環球：對華關系上高市欲表現"弱勢"形象博取美國同情

頭條要聞

環球：對華關系上高市欲表現"弱勢"形象博取美國同情

體育要聞

誰在決定字母哥未來？

娛樂要聞

總臺首屆電影盛典，“沈馬”CP再合體

財經要聞

通脹警報拉響，加息潮要來了？

汽車要聞

小鵬汽車2025年Q4盈利凈賺3.8億全年營收767億

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

數碼

旅游

藝術

時尚

親子

數碼要聞

2025全球手持相機出貨量達1665萬臺大疆份額62.4%

旅游要聞

文商體旅福利加碼，泰州推出春假專屬套餐

藝術要聞

第四屆深圳大芬國際油畫雙年展 | 國際入選油畫選刊（二）

推廣中獎名單-更新至2026年3月4日推廣

親子要聞

這孩子

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

<sub id="wclmp"><i id="wclmp"><optgroup id="wclmp"></optgroup></i></sub>

<blockquote id="wclmp"><i id="wclmp"><video id="wclmp"></video></i></blockquote>