<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      擴散模型成最快深度思考!告別自回歸每秒1009個tokens

      0
      分享至

      首個會深度思考的擴散模型來了!

      拋棄自回歸范式,一舉成為世界上生成速度最快的模型。

      你瞅瞅,對比之下傳統自回歸的“打字機模式”(按順序一個個token往外吐)是不是就有點像烏龜了:



      實際測評顯示,這款名為Mercury 2的擴散推理LLM在英偉達GPU上可實現1009個tokens/s

      這個速度整整比GPT-5(mini)和Claude-4.5(haiku)這些傳統模型快了5倍。



      消息一出,英偉達第一時間跑來祝賀了(當然也可能是因為它投了Mercury 2背后的公司):



      一眾網友也紛紛坐不住,畢竟最近很火的“龍蝦們”也少不了對速度的極限追求:



      還有人已經開始懷念自回歸曾經的風光了(doge)。



      so,Mercury 2是誰?它又是如何突破速度瓶頸的呢?

      不止是快,還穩

      原理其實很簡單。

      前面已經說了,傳統自回歸就像打字機一樣,一次只能處理一個token,且必須按照從左到右的順序。

      但擴散模型Mercury 2的工作方式更像一位編輯——

      你不是在看它打字,而是看它拿到一份草稿后,立刻拿著紅筆在整頁紙上同時圈改。

      換言之,一次生成答案草稿再整體編輯。

      這種“并行優化”機制,使得Mercury 2不需要等待前一個字的結果就能生成下一個字,因此響應速度極快,延遲不再與輸出長度成正比。

      最終,Mercury 2能將生成速度提升5倍以上,且速度曲線截然不同

      瞅瞅,在第三方測評中,其輸出速度可謂一騎絕塵。



      和市面主流的頂尖模型比,速度也是獨一檔的存在。



      而且不止是快,它在性能、價格方面都具有一定優勢。

      延遲低至1.7s的情況下,在GPQA(科學問答)、LCB(編程)、AIME(數學)等多個基準測試中,Mercury 2的得分普遍高于或持平于那些速度較慢的“小型/輕量級”模型(如GPT-5 Nano, Claude 4.5 Haiku)。

      甚至在AIME上的得分超過了公認的“性能怪獸”Gemini 3 Flash(推理版) 。

      這說明Mercury 2在保持極高速度的同時,并不以犧牲智商為代價。



      它目前支持128K上下文,輸入價格為每百萬token 0.25美元(約合人民幣1.7元),輸出價格為每百萬token 0.75美元(約合人民幣5.2元)。

      綜合速度與價格,Mercury 2也保持了較高性價比。



      官方表示,Mercury 2的這種速度優勢改變了推理。

      • 如今,更高的智能意味著更多的test-time計算——更長的鏈、更多的樣本、更多的重試,而這直接以延遲和成本為代價。基于擴散的推理能夠在實時延遲預算內實現推理級別的質量。

      背后公司一開始就押注擴散模型

      最后介紹一下Mercury 2背后的公司及團隊。

      它是由Inception Labs這家成立于2024年的硅谷初創公司推出的。

      從一開始這家公司就力押擴散模型,其核心使命為——

      用全新的、基于擴散/diffusion的生成機制替代傳統的自回歸Transformer模型,從根本上突破速度與成本瓶頸。

      他們認為,傳統自回歸模型的缺陷不言自明——延遲和成本會隨著token數量的增加而增加。

      而擴散模型采用由粗到精的生成過程。它并非逐個提交數據,而是通過少量步驟并行迭代地細化輸出。這使得在生成過程中可以進行修改,并帶來截然不同的速度-成本曲線。一言以蔽之:

      • 人工智能不應該像單向打字機那樣運作,而應該更像一個編輯。

      基于此,他們開始在Mercury系列中踐行這一理念。

      2025年2月,發布全球首個基于擴散模型的商業級語言模型——初代Mercury,一開始就把生成速度拉到傳統的5倍以上,而且同一時間還推出編程助手Mercury Coder。

      一年之后,升級版Mercury 2問世,在推理和多智能體日益進入主流視線的今天,帶來了更多可能。



      事實上,早在2019年,這家公司的聯創兼CEO Stefano Ermon就開始投身擴散模型的研究了。

      時任斯坦福大學計算機科學教授的Stefano Ermon,很早就思忖著將擴散模型應用于內容生成。

      當時主流的圖像生成模型還在使用GAN(生成對抗網絡),但他和團隊認為結果“不夠好”,于是開始嘗試應用Diffusion。

      而在看到Diffusion的效果不錯后(后來Midjourney、DALL-E等都是用這種方法),他們開始將研究目光轉向文本和代碼生成。

      • 圖像由連續的像素構成,而文本由離散的token構成。之前成功的擴散模型理論(如去噪得分匹配)是建立在連續空間上的,無法直接遷移到文本。

      于是在2023年,他和團隊發表了一篇關鍵性論文《Discrete Diffusion Modeling by Estimating the Ratios of the Data Distribution》,里面介紹了一種名為Score Entropy Discrete Diffusion models(SEDD)的模型。

      該模型創新性提出了“分數熵”(score entropy)這一全新損失函數,它巧妙地將連續空間的分數匹配理論擴展到了離散數據領域。

      這使得擴散模型能夠像理解圖像一樣,去理解和生成語言。



      論文結果表明,SEDD的表現明顯優于當時已有的語言模型,困惑度比未退火(未使用“動態調整溫度”這個優化技巧)的GPT-2好6-8倍。

      (注:后來這篇論文還獲得了ICML 2024最佳論文獎)

      見此,Stefano Ermon決定通過創業將技術價值放大。

      于是在2024年夏天,他邀請美國加利福尼亞大學洛杉磯分校教授Aditya Grover(左)和美國康奈爾大學教授Volodymyr Kuleshov(右)加入Inception Labs。



      去年11月,這家公司還宣布獲得了5000萬美元融資,而且投資陣容相當豪華。

      除了NVentures(英偉達風投部門)、M12(微軟旗下風險基金)、Menlo Ventures (領投方、知名長期風投機構)等明星機構,還不乏吳恩達、卡帕西這些AI大佬。

      可以說,堅持走擴散模型路子的Inception Labs始終穩扎穩打并獲得市場支持。

      最后順便一提,Mercury 2目前暫無開源計劃,不過其API全面兼容OpenAI標準。

      感興趣的朋友也可親自上手一試了。

      體驗地址:
      https://chat.inceptionlabs.ai/

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      江西中年男砸家后續:“底褲”被扒光,女兒曝更多內幕,全怪母親

      江西中年男砸家后續:“底褲”被扒光,女兒曝更多內幕,全怪母親

      天天熱點見聞
      2026-03-10 03:06:21
      三航母齊聚中東,霸權崩盤的兇兆!

      三航母齊聚中東,霸權崩盤的兇兆!

      漢唐智庫
      2026-03-09 12:17:04
      41+19+11!給機會楊瀚森就是中國版約基奇

      41+19+11!給機會楊瀚森就是中國版約基奇

      林子說事
      2026-03-09 20:03:44
      上海這夜,孫儷好土,肖戰忽視周深,坐白鹿歐豪后一排的他要哭了

      上海這夜,孫儷好土,肖戰忽視周深,坐白鹿歐豪后一排的他要哭了

      洲洲影視娛評
      2026-03-10 13:34:09
      常州將新建一所高中!位置就在…

      常州將新建一所高中!位置就在…

      常州大喇叭
      2026-03-10 15:52:06
      讓北宋無比頭疼的“契丹”,是現在的哪個民族,說出來你可能不信

      讓北宋無比頭疼的“契丹”,是現在的哪個民族,說出來你可能不信

      比利
      2026-03-09 22:04:08
      湖人拍攝全家福!東契奇搞怪把名字貼額頭 詹姆斯布朗尼笑容滿面

      湖人拍攝全家福!東契奇搞怪把名字貼額頭 詹姆斯布朗尼笑容滿面

      羅說NBA
      2026-03-10 06:29:24
      博納影業董事長于冬被指欠澳門永利賭場473萬,公司回應

      博納影業董事長于冬被指欠澳門永利賭場473萬,公司回應

      極目新聞
      2026-03-10 12:03:03
      天津停止供暖時間

      天津停止供暖時間

      天津族
      2026-03-09 19:59:41
      烏軍上校旅長陣亡,波蘭對俄白兩國關閉領空釜底抽薪

      烏軍上校旅長陣亡,波蘭對俄白兩國關閉領空釜底抽薪

      史政先鋒
      2026-03-10 15:17:08
      旺達與尤文主帥斯帕萊蒂秘密約會被狗仔抓包,隨后社媒主動曬照

      旺達與尤文主帥斯帕萊蒂秘密約會被狗仔抓包,隨后社媒主動曬照

      狗哥是一名內拉
      2026-03-10 14:38:46
      人大代表建議每年給私家車2000公里高速免費額度

      人大代表建議每年給私家車2000公里高速免費額度

      界面新聞
      2026-03-10 17:04:14
      末日預警:多名專家稱內塔尼亞胡或對伊朗動用戰術核武器

      末日預警:多名專家稱內塔尼亞胡或對伊朗動用戰術核武器

      Ck的蜜糖
      2026-03-10 16:59:15
      笑死!特朗普發文對伊朗新領袖哈梅內伊的兒子說:準備好見你爹!

      笑死!特朗普發文對伊朗新領袖哈梅內伊的兒子說:準備好見你爹!

      老馬拉車莫少裝
      2026-03-09 21:29:33
      年輕人的第一場破產危機,從沒給老家父母的衛生間裝上這根50塊的扶手開始

      年輕人的第一場破產危機,從沒給老家父母的衛生間裝上這根50塊的扶手開始

      果殼
      2026-03-09 12:10:55
      A股:要提前準備好,明天周三,A股或將迎來更大的行情?

      A股:要提前準備好,明天周三,A股或將迎來更大的行情?

      財經大拿
      2026-03-10 13:46:02
      054A抵達伊朗海域護航

      054A抵達伊朗海域護航

      烽火觀天下
      2026-03-10 11:54:38
      3月10日人民幣對美元中間價調升176個基點

      3月10日人民幣對美元中間價調升176個基點

      證券時報
      2026-03-10 09:43:08
      悲壯?伊朗女足去機場時只剩半支隊:8人逃離 另有多人仍留在酒店

      悲壯?伊朗女足去機場時只剩半支隊:8人逃離 另有多人仍留在酒店

      風過鄉
      2026-03-10 14:56:51
      值得珍藏:電力+衛星互聯網+光刻機+商業航天+英偉達+硅+半導體等

      值得珍藏:電力+衛星互聯網+光刻機+商業航天+英偉達+硅+半導體等

      Thurman在昆明
      2026-03-10 00:16:42
      2026-03-10 17:35:00
      量子位 incentive-icons
      量子位
      追蹤人工智能動態
      12260文章數 176413關注度
      往期回顧 全部

      科技要聞

      全民"養蝦"背后:大廠集體下場瘋狂賣Token

      頭條要聞

      特朗普稱已考慮接替穆杰塔巴的人選 外交部表態

      頭條要聞

      特朗普稱已考慮接替穆杰塔巴的人選 外交部表態

      體育要聞

      加蘭沒那么差,但鱸魚會用嗎?

      娛樂要聞

      肖戰首奪SMG視帝,孫儷四封視后創歷史

      財經要聞

      全民"養龍蝦"背后 第一批受害者浮現

      汽車要聞

      蔚來換電和理想5C,誰能硬剛,比亞迪兆瓦閃充?

      態度原創

      房產
      數碼
      藝術
      公開課
      軍事航空

      房產要聞

      信號!千億巨頭入局,三亞開啟新一輪大征拆!

      數碼要聞

      QNAP威聯通推出TS-h1077AFU:10×SATA盤位1U全閃NAS

      藝術要聞

      30000畝杏花開了,新疆的春天這么美!

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      剛說完戰爭很快結束 特朗普改口

      無障礙瀏覽 進入關懷版