<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      AI大模型學會"自己算數":Percepta團隊在大模型里造出一臺計算機

      0
      分享至


      大語言模型能做奧數題,卻算不對兩位數乘法,這個尷尬局面一直是AI領域公開的秘密。2026年3月,一家名為Percepta的AI公司發布了一項讓業界矚目的研究,他們直接在Transformer的權重里"建造"了一臺計算機,不依賴任何外部工具就能執行任意C語言程序。

      這項工作發布后迅速登上Hacker News首頁,收獲了超過300個贊和130多條評論,連AI領域的標桿人物Karpathy都為其點贊。

      這項研究的核心思路其實不復雜。目前業界讓大模型做精確計算主要有兩條路:一是工具調用,讓模型生成代碼,再交給外部解釋器執行;二是智能體調度,通過外部狀態機把任務拆開,循環調用模型處理。
      但本質上,這兩種方法都相當于給模型裝了一個"外掛",計算并不是模型自己完成的。

      Percepta團隊換了個玩法。他們在Transformer權重中實現了一套RAM計算機和WebAssembly解釋器,任何標準程序代碼都可以編譯成模型能識別的Token指令序列。

      比如計算3加5,模型會先把代碼寫出來,然后切換到快速解碼模式,在Transformer內部一步步執行這個程序,把執行過程逐行輸出為Token流。


      2D注意力頭:關鍵的技術突破

      讓這件事變得真正可行的,是團隊在注意力機制上的創新設計。

      在傳統的Transformer架構中,每生成一個Token都要對整個歷史序列做一次注意力掃描,計算成本隨序列長度線性增長。

      Percepta設計了一種2D注意力頭,把每個歷史Token的Key向量設定為二維的,將注意力查詢問題轉化為計算幾何中的凸包極值查詢。

      借助凸包數據結構,模型在Token生成過程中動態維護歷史Key的凸包,每一步注意力查詢只需要在凸包上進行,把計算復雜度從O(n)降到了O(log n)。

      基于這個原理,團隊開發了HullKVCache緩存系統。在普通CPU上就實現了每秒31037個Token的吞吐量,約9000條指令的序列僅需1.3秒即可完成,效率比傳統KV緩存提高了近200倍。

      更重要的是,這個設計完全基于標準PyTorch Transformer,不需要定制化的內核或稀疏掩碼。

      實際驗證與行業反響

      團隊選了兩個典型的長程精確計算任務來做驗證。

      第一個是10×10最小費用完美匹配問題,模型在內部執行匈牙利算法,全程以自回歸方式生成計算軌跡,CPU上Token生成速度達到每秒33583個。


      第二個是世界上最難的數獨之一,芬蘭數學家Arto Inkala設計的極難數獨。模型內部執行一個完整編譯后的數獨求解器,通過約束傳播和回溯搜索,在3分鐘內實現了100%準確的求解。
      整個計算過程是透明的,每一步的嘗試,驗證、回溯都以可讀日志的形式輸出。

      這項研究引發了不少討論和爭意。支持者認為,它證明了Transformer不僅僅是統計預測器,還可以成為真正的通用計算基底,未來可以作為推理加速的系統原語。

      批評者則指出,博客文章缺少嚴格的基準測試和訓練細節,文本也有過度包裝的嫌疑。

      不過,拋開爭論來看,這項工作確實提供了一個有意思的視角。它表明注意力機制的設計空間遠比我們以為的要大,2D注意力頭這樣看似簡單的修改就能帶來指數級的效率提升。

      領導這項研究的Christos Tzamos是MIT博士,目前擔任雅典大學計算機科學副教授和Percepta的創始研究員,Percepta則是General Catalyst旗下的AI轉型公司,團隊成員來自Meta FAIR,MIT和谷歌等機構。

      這項研究雖然還處于早期階段、距離實際部暑還有距離,但它開辟的方向值得關注:與其給大模型不斷加外掛,不如讓模型本身就具備精確計算的能力。
      這或許是通往更強大AI系統的一條新路徑。

      閱讀最新前沿科技趨勢報告,請訪問21世紀關鍵技術研究院的“未來知識庫”


      未來知識庫是 “21世紀關鍵技術研究院”建 立的在線知識庫平臺,收藏的資料范圍包括人工智能、腦科學、互聯網、超級智能,數智大腦、能源、軍事、經濟、人類風險等等領域的前沿進展與未來趨勢。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。 歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進入。

      截止到2月28日 ”未來知識庫”精選的百部前沿科技趨勢報告

      (加入未來知識庫,全部資料免費閱讀和下載)

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      迪尼:恩佐和庫庫發難的導火索,很可能是因為里斯拿到新合同

      迪尼:恩佐和庫庫發難的導火索,很可能是因為里斯拿到新合同

      懂球帝
      2026-04-04 09:13:24
      30小時大火后,百億航母成廢鐵,福建艦成全球唯一

      30小時大火后,百億航母成廢鐵,福建艦成全球唯一

      究竟誰主沉浮
      2026-04-03 04:31:31
      俄羅斯給川普劃了紅線:倘若普京成為下一個馬杜羅,俄軍直接劫獄

      俄羅斯給川普劃了紅線:倘若普京成為下一個馬杜羅,俄軍直接劫獄

      賤議你讀史
      2026-04-04 14:37:16
      陳幸同1比4不敵申裕斌,王楚欽擊敗達科,都很有把握

      陳幸同1比4不敵申裕斌,王楚欽擊敗達科,都很有把握

      子水體娛
      2026-04-04 18:06:43
      出大事了,伊朗導彈精準斬首!11國對美國發出通牒,特朗普變臉

      出大事了,伊朗導彈精準斬首!11國對美國發出通牒,特朗普變臉

      古史青云啊
      2026-04-04 12:16:45
      伊朗公布擊中美軍A10攻擊機視頻!2架黑鷹直升機搜救F15時被擊中,“機身冒出黑煙”!伊朗懸賞追捕美飛行員:看到他們就開槍

      伊朗公布擊中美軍A10攻擊機視頻!2架黑鷹直升機搜救F15時被擊中,“機身冒出黑煙”!伊朗懸賞追捕美飛行員:看到他們就開槍

      每日經濟新聞
      2026-04-04 08:59:10
      3輪0勝距蓉城11分!國安球迷怒斥:5人不配上場,裁判收錢應上訴

      3輪0勝距蓉城11分!國安球迷怒斥:5人不配上場,裁判收錢應上訴

      我愛英超
      2026-04-04 18:22:08
      佟晨潔宣布與魏巍離婚,兩人曾于2021年參加《再見愛人》

      佟晨潔宣布與魏巍離婚,兩人曾于2021年參加《再見愛人》

      魯中晨報
      2026-04-02 14:21:04
      張雪被問為什么不用中國車手?本人回應:因為現在的車手跑不快

      張雪被問為什么不用中國車手?本人回應:因為現在的車手跑不快

      距離距離
      2026-04-04 15:45:19
      38歲王思聰私生活混亂揮霍無度,再傳大丑聞

      38歲王思聰私生活混亂揮霍無度,再傳大丑聞

      悅君兮君不知
      2026-02-27 21:20:11
      27歲單親媽媽開直播,播著播著睡著了,醒來一看后臺直接傻眼了

      27歲單親媽媽開直播,播著播著睡著了,醒來一看后臺直接傻眼了

      小椰的奶奶
      2026-04-01 17:04:55
      豬油再次被關注!醫生發現:高血壓患者常吃豬油,或出現幾種變化

      豬油再次被關注!醫生發現:高血壓患者常吃豬油,或出現幾種變化

      蜉蝣說
      2026-02-23 21:23:05
      董璇泳池大片“又圓又甜”,前任現任皆得圓滿

      董璇泳池大片“又圓又甜”,前任現任皆得圓滿

      飛娛日記
      2026-03-09 09:01:44
      14億人都不會忘卻!揭開核酸大王張核子的真面具:權力變現大公

      14億人都不會忘卻!揭開核酸大王張核子的真面具:權力變現大公

      大魚簡科
      2026-02-07 09:52:29
      重慶搖人按豬女孩現狀讓人意外:沒趁熱變現,如今在村里安安穩穩

      重慶搖人按豬女孩現狀讓人意外:沒趁熱變現,如今在村里安安穩穩

      沒有偏旁的常慶
      2026-04-04 07:30:07
      張雪機車火了,正新輪胎贏了!

      張雪機車火了,正新輪胎贏了!

      輪胎報官方
      2026-04-03 16:08:28
      財務造假!A股一公司將被ST,10家公司集體被查被罰,證監會密集出手

      財務造假!A股一公司將被ST,10家公司集體被查被罰,證監會密集出手

      21世紀經濟報道
      2026-04-04 17:44:11
      男子意外收到7年前捐贈退款:受助人渡過難關后,返還7000人近27萬元善款

      男子意外收到7年前捐贈退款:受助人渡過難關后,返還7000人近27萬元善款

      上游新聞
      2026-04-03 09:54:07
      史詩級大反轉!北上廣樓市徹底炸鍋,成交量狂飆破5年新高,一場財富大洗牌正在上演!

      史詩級大反轉!北上廣樓市徹底炸鍋,成交量狂飆破5年新高,一場財富大洗牌正在上演!

      新浪財經
      2026-04-02 12:43:03
      沉默48小時后,人民日報通告全球,把話說很重,日本聽好

      沉默48小時后,人民日報通告全球,把話說很重,日本聽好

      萬物知識圈
      2026-04-04 10:44:59
      2026-04-04 21:04:51
      人工智能學家 incentive-icons
      人工智能學家
      人工智能領域權威媒體
      4633文章數 37447關注度
      往期回顧 全部

      科技要聞

      內存一年漲四倍!國產手機廠商集體漲價

      頭條要聞

      馬克龍在韓國發表講話:"中等強國"不能成為中美附庸

      頭條要聞

      馬克龍在韓國發表講話:"中等強國"不能成為中美附庸

      體育要聞

      剎不住的泰格·伍茲,口袋里的兩粒藥丸

      娛樂要聞

      Q女士反擊,否認逼宋寧峰張婉婷離婚

      財經要聞

      中微董事長,給半導體潑點冷水

      汽車要聞

      17萬級海豹07EV 不僅續航長還有9分鐘滿電的快樂

      態度原創

      家居
      藝術
      旅游
      時尚
      公開課

      家居要聞

      溫馨多元 愛的具象化

      藝術要聞

      1111米!深圳要蓋世界第一高樓?結果連地基都沒挖

      旅游要聞

      新華財經|春假催熱旅游市場 多業態聯動釋放消費活力

      別再穿大一碼了!遮肉根本不是靠寬松

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版