<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      GPU要涼?前英偉達AMD大神將AI刻在芯片上!17000 tokens/秒屠榜

      0
      分享至


      新智元報道

      編輯:定慧

      【新智元導讀】在這個所有科技巨頭都在為英偉達的高端GPU搶破頭的時代,一家成立不到三年的多倫多小廠Taalas,突然朝著整個行業(yè)扔出了一顆反常識的「深水炸彈」:他們拋棄了液冷,拋棄了昂貴的HBM顯存,甚至拋棄了「通用計算」,選擇了一種最粗暴、最狂野的物理美學:直接把大模型焊死在芯片里!

      今天是大年初六,年還沒過完。但有一個新聞卻淹沒在各種消息中。

      這可能是今年最重要的AI新聞,但現(xiàn)在依然還沒什么人聊!

      這兩天,一家成立不到三年的多倫多芯片公司Taalas扔下了一顆核彈:

      他們繞開了所有熱門概念,直接把AI大模型,物理焊死在芯片里!


      這家公司開發(fā)的HC1芯片,運行Llama 3.1 8B的速度達到了極度恐怖的17,000tokens/秒


      作為對比,目前業(yè)界最快Cerebras跑同等模型,速度也不過兩千。

      Taalas HC1硬生生將速度拔高了將近10倍!

      而和英偉達最先進B200,提高了近50倍!


      他們還上線了一個體驗網(wǎng)站:chatjimmy.ai


      這個AI的速度有多離譜呢?可以看看下面的速度。


      這個AI不是在回復,而是直接未卜先知把答案砸在你的臉上。


      這還不算完,除了「光速」輸出Token以外。

      Taalas如何解決散熱和傳輸速度問題?

      他們交出的答卷是:拋棄液冷!拋棄HBM顯存!

      因為沒有復雜的存儲層級,HC1的成本只有傳統(tǒng)方案的1/20,功耗更是直接縮減到1/10,十張卡加起來僅僅需要2.5千瓦的空氣冷卻。


      官方博客:https://taalas.com/the-path-to-ubiquitous-ai/

      在這塊主打「復古暴力」的芯片里,它出廠時的命運就被永遠鎖死——它的晶體管只為Llama 3.1 8B的權重而生,這輩子只能跑這一個模型。


      一時間,X上徹底炸鍋了!

      「等待LLM思考」的時代宣告終結。


      有測試者滿臉震撼:

      「你敲下回車的瞬間,答案就像預謀已久一樣撲在屏幕上,那根本不是秒回,那是啪地一下砸你臉上!」


      有網(wǎng)友發(fā)出了絕望的哀嘆:「人類該怎么跟得上這種速度?」


      另一位網(wǎng)友的回答則更加冷酷:「尊敬的先生,我們不可能跟得上?!?/p>


      但反方意見同樣明確。

      首先就是,雖然速度達到「光速」,但是小模型帶來的幻覺問題無法避免。

      甚至無法正確計算簡單的加減乘除。


      而且按照現(xiàn)在的模型的迭代速度。

      在一個物理實體上固化一個即將被淘汰的模型,真的有用么?


      也有樂觀者認為,這可能確實是未來的一種方向,因為這種Token的輸出速度,并不是給人類準備的。

      而是讓智能體之間相互對話使用的。


      所以,Taalas這條所謂的物理實體AI之路是否真的能走通?


      暴力美學vs極致封印:AI的兩條路線之爭

      要看懂這場「豪賭」的意義,我們必須回顧一下芯片的發(fā)展史。

      過去三十年,無論是CPU還是GPU,甚至是后來的各種AI加速器,整個硅谷都在瘋狂追求同一件事:「造一個通用的計算平臺」。

      我們在造一個巨大的舞臺,然后讓不同的軟件在上面跳舞。

      這就形成了一個絕對的物理硬邊界:「內(nèi)存墻」。


      內(nèi)存墻通常是指處理器速度和內(nèi)存帶寬之間不斷擴大的差距

      當模型膨脹到幾百億、上千億參數(shù),你為了算一次乘法,每次都要把海量數(shù)據(jù)從顯存搬到計算單元。

      這個「搬磚」過程消耗的能量和時間,早就遠遠超過了計算本身。

      Taalas團隊的思路簡直是「反向升級」:

      既然這個舞臺每天都只演《羅密歐與朱麗葉》,我們?yōu)槭裁匆M勁巴拉地每天搬布景?直接把布景用水泥砌死在臺上不就行了!

      在這塊HC1芯片里,模型的每一個權重,都對應著芯片上特定的晶體管


      矩陣乘法根本不需要軟件去調(diào)度,而是通過物理電路的電流直接完成!

      你可以把傳統(tǒng)的GPU理解為「交響樂團現(xiàn)場演奏」,每次運行都要調(diào)配樂手、看曲譜、聽指揮;

      那么Taalas的做法就是直接刻了一張「黑膠唱片」。

      你把Llama模型錄死在磁帶上,插上電就能播,而且是以一種摧枯拉朽的倍速在狂飆。

      但,一切命運的饋贈,都在暗中早就標好了價格!


      這也意味著,只要這塊芯片一出廠,它的命運就已經(jīng)被徹底鎖死。

      它無法微調(diào),無法更換模型,更無法升級。

      如果明年Meta發(fā)布了Llama 4,或者你發(fā)現(xiàn)這個8B模型在特定業(yè)務里太卡智商,這塊滿載尖端科技的硅片,瞬間就會淪為精美的電子垃圾

      在這個所有巨頭都在拼命炫耀自家新模型多聰明的時代,主動把自己鎖死在一個固定的歷史版本上,這到底是逆天改命,還是飲鴆止渴?

      路線大分裂與人腦的奇妙隱喻

      事實上,這種極盡專用的思路,背后牽扯出的是一場硅谷頂級大佬的路線大決裂。

      Taalas的CEO Ljubisa Bajic曾在AMD、英偉達擔任骨干架構師,也是明星AI芯片公司Tenstorrent的創(chuàng)始人。


      2022年,「芯片之神」Jim Keller(「硅仙人」)加入Tenstorrent,Jim Keller 不僅為該公司提供了第一筆資金,后來更直接加入公司擔任CTO,并于2023年與Ljubisa Bajic互換角色出任CEO。


      Ljubisa在2023年4月宣布從Tenstorrent的日常管理崗位「退休」并轉任顧問,其實是為了追求一個更激進、更極端的計算夢想。

      他隨后創(chuàng)辦了新公司Taalas。

      Jim Keller的畢生信仰,是做一個通用的、可編程的、軟件友好的完美平臺。

      擴展閱讀:英偉達親手終結CUDA「護城河」?傳奇芯片架構師引發(fā)爭議


      而Ljubisa則決絕地走向了另一個極端——

      絕對的極繁固化,換取絕對的極簡自由。

      對于這種把AI模型做成ASIC(專用集成電路)的做法,網(wǎng)上的評價兩極分化。

      有人嘲諷「流片貴得嚇人,模型一更新舊卡就炸死路一條」,但也有極其敏銳的觀察者,將它與人類大腦的運行機制,產(chǎn)生了深度的共振。

      X上一條高贊評論直指靈魂:

      「哈佛和谷歌耗盡資源,花了十年時間,才勉強繪制出1立方毫米、比米粒還小的人腦圖譜。這背后的數(shù)學復雜度和能效比,足以讓地球上所有的AI實驗室集體汗顏?!?/strong>


      人類大腦那種不可思議的精密和低功耗,本質(zhì)上不就是一種長在肉體上的「硬件固化」嗎?


      且人腦的運算雖然精妙,但光論「生成代碼」和「吐詞」的速度,可遠沒有這類新硬件這般快如閃電。


      另一位網(wǎng)友的一席話更讓人破防:

      「其實大部分人類,一輩子也就說一種語言、做著一份固定的職業(yè)。

      這和大腦里刻死了一個模型有什么區(qū)別?」

      一語驚醒夢中人。

      我們并非在所有的場景里,都需要一個通曉天文地理、能寫詩能解微分方程的「全知全能神」。

      在海量的垂直場景里——比如一個需要毫秒級響應的語音助手,流水線上的自動化數(shù)據(jù)標注,甚至是你家里每天只懂避障的掃地機。

      它們根本不在乎你是GPT-6還是Claude 5,它們需要的僅僅是像一顆釘子一樣,用光速和最低廉的成本,把手頭那件事干到極致。

      這時候,一個極其便宜、永遠不需要換代的「電子牛馬」芯片,就足夠了。

      也許這就是AI走向物理世界的終極兩極分化:

      一部分化作云端龐大而昂貴的通用神靈;

      而另一部分,則被死死刻進硅晶體里,化作數(shù)以百億計的廉價、極速的工匠,滲透進人類生活的每一個毛孔。

      Taalas這步險棋,可能成為技術史上一次昂貴而有趣的注腳,但也極有可能,正在砸開一扇用「零延遲」統(tǒng)治未來的大門。

      無論怎樣,17,000 tokens/秒的兇獸已經(jīng)出籠。

      在絕對的速度和暴力成本面前,傳統(tǒng)的AI硬件法則,已經(jīng)出現(xiàn)了一道刺眼的裂痕。

      你認為人類的科技樹,應該點在哪里?

      參考資料:

      https://x.com/wildmindai/status/2024810128487096357

      https://x.com/ai_for_success/status/2025239027490971681

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      “窮就別硬裝了!”一家三口吃火鍋花了217元,父親心疼錢被群嘲

      “窮就別硬裝了!”一家三口吃火鍋花了217元,父親心疼錢被群嘲

      妍妍教育日記
      2025-11-18 19:53:15
      三亞至深圳最高票價達14460元

      三亞至深圳最高票價達14460元

      第一財經(jīng)資訊
      2026-02-22 12:34:38
      痛心!貝加爾湖沉湖7名中國游客身份確認,一家四口不幸遇難

      痛心!貝加爾湖沉湖7名中國游客身份確認,一家四口不幸遇難

      王姐懶人家常菜
      2026-02-23 09:21:58
      不宣而戰(zhàn),俄發(fā)起斬首行動,俄羅斯緊急撤僑,普京拒絕參加會議

      不宣而戰(zhàn),俄發(fā)起斬首行動,俄羅斯緊急撤僑,普京拒絕參加會議

      小陳講史
      2026-02-23 09:52:40
      有人預測:若不出意外,春節(jié)以后,國內(nèi)將迎來3個變化,很真實

      有人預測:若不出意外,春節(jié)以后,國內(nèi)將迎來3個變化,很真實

      戶外釣魚哥阿旱
      2026-02-23 09:16:09
      斷崖式下跌!中國人突然不愛喝酒了?真相太扎心!

      斷崖式下跌!中國人突然不愛喝酒了?真相太扎心!

      達文西看世界
      2026-01-18 20:56:11
      正月初七返程峰值撞上廣湛高鐵,粵西票仍秒空!4大原因藏不住了

      正月初七返程峰值撞上廣湛高鐵,粵西票仍秒空!4大原因藏不住了

      匹夫來搞笑
      2026-02-23 09:15:57
      明晚2月24日油價大漲,2026年最大油價上后,春節(jié)后油價再上調(diào)

      明晚2月24日油價大漲,2026年最大油價上后,春節(jié)后油價再上調(diào)

      油價早知道
      2026-02-23 01:33:01
      落槌!全部劃歸國資!追隨許家印6年,江蘇第一包工頭賠得精光

      落槌!全部劃歸國資!追隨許家印6年,江蘇第一包工頭賠得精光

      始于初見見
      2026-02-18 12:16:38
      157-54慘案背后有溫情!楊瀚森拒吻約基奇:在中國這是尊重

      157-54慘案背后有溫情!楊瀚森拒吻約基奇:在中國這是尊重

      大眼瞄世界
      2026-02-22 16:42:23
      測量319位中國女性外陰,他們發(fā)表全球首例研究

      測量319位中國女性外陰,他們發(fā)表全球首例研究

      醫(yī)學界
      2026-02-18 17:56:22
      6億打水漂?投資人揭《美人魚2》不上映原因,劣跡藝人害慘周星馳

      6億打水漂?投資人揭《美人魚2》不上映原因,劣跡藝人害慘周星馳

      查爾菲的筆記
      2025-09-02 00:48:54
      53歲柯藍和瞿穎在泰國過春節(jié),倆人都是李亞鵬前女友,李宗翰也在

      53歲柯藍和瞿穎在泰國過春節(jié),倆人都是李亞鵬前女友,李宗翰也在

      觀察鑒娛
      2026-02-20 11:30:57
      全國第一個房價大漲的城市,出現(xiàn)了!

      全國第一個房價大漲的城市,出現(xiàn)了!

      林子說事
      2026-02-22 23:05:09
      萬米高空爆發(fā)群毆!客機座椅血跡斑斑,2人終身禁飛,還要賠錢

      萬米高空爆發(fā)群毆!客機座椅血跡斑斑,2人終身禁飛,還要賠錢

      華人星光
      2026-02-15 12:33:21
      納斯達克100指數(shù)期貨跌幅擴大至0.75%,標準普爾500指數(shù)期貨下跌0.55%

      納斯達克100指數(shù)期貨跌幅擴大至0.75%,標準普爾500指數(shù)期貨下跌0.55%

      每日經(jīng)濟新聞
      2026-02-23 08:52:19
      最近的電車起火,辯解很有趣,都不是電池起火,是外因?qū)е?>
    </a>
        <h3>
      <a href=柏銘銳談
      2026-02-23 07:56:14
      沉寂兩年,“伊斯蘭國”突然發(fā)聲

      沉寂兩年,“伊斯蘭國”突然發(fā)聲

      上觀新聞
      2026-02-22 16:49:04
      浙江女子15年生9個娃,夢想湊齊12生肖,稱:老公基因不能浪費

      浙江女子15年生9個娃,夢想湊齊12生肖,稱:老公基因不能浪費

      科學發(fā)掘
      2026-02-21 07:48:58
      銀河戰(zhàn)艦來了!遼寧鐵人外援總身價1050萬歐:排中超第一

      銀河戰(zhàn)艦來了!遼寧鐵人外援總身價1050萬歐:排中超第一

      邱澤云
      2026-02-22 15:29:59
      2026-02-23 10:36:49
      新智元 incentive-icons
      新智元
      AI產(chǎn)業(yè)主平臺領航智能+時代
      14573文章數(shù) 66633關注度
      往期回顧 全部

      科技要聞

      馬斯克:星艦每年將發(fā)射超過10000顆衛(wèi)星

      頭條要聞

      22歲谷愛凌創(chuàng)紀錄 曾因失敗被網(wǎng)暴:他們不會原諒我了

      頭條要聞

      22歲谷愛凌創(chuàng)紀錄 曾因失敗被網(wǎng)暴:他們不會原諒我了

      體育要聞

      谷愛凌:6次參賽6次奪牌 我對自己非常自豪

      娛樂要聞

      谷愛凌奶奶去世,谷愛凌淚奔

      財經(jīng)要聞

      結婚五金邁入10萬大關 年輕人結婚更難了

      汽車要聞

      續(xù)航1810km!smart精靈#6 EHD超級電混2026年上市

      態(tài)度原創(chuàng)

      手機
      時尚
      旅游
      本地
      軍事航空

      手機要聞

      時隔4年終于回歸!iPhone 18 Pro將推出深紅配色

      50+女人更適合基礎款,掌握3個高段位搭配思路,輕松提升品味

      旅游要聞

      游客打車九折司機被迫“出血”文旅促銷需算清“成本賬”與“公平賬”|熱點即閱

      本地新聞

      春花齊放2026:《駿馬奔騰迎新歲》

      軍事要聞

      美軍重兵集結蓄力作戰(zhàn)之際 新一輪美伊談判時間“敲定”

      無障礙瀏覽 進入關懷版