<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      上線兩天登頂全球榜單,階躍星辰怎么讓 AI 又「聰明」又「快」?

      0
      分享至


      AGI的路怎么走?階躍星辰的答案是以巧見大,唯快不破

      作者丨董子博

      編輯丨林覺民


      就在昨天,階躍星辰登頂了全球模型榜單——他們最新開源的Agent基座模型Step 3.5 Flash,發布首日便登上全球模型平臺OpenRouter最快模型榜,而發布后僅用短短兩天,就獲得了OpenRouter“熱度趨勢榜排名第一的好成績,其數據是基于全球開發者與用戶的實際模型調用量。也就是說,Step 3.5 Flash以硬實力贏得了用戶的“用腳投票”。


      (圖為Step 3.5 Flash 登頂 OpenRouter 的Trending 榜單)

      對階躍來說,拿下榜單第一并不新鮮,而這個成績有意思的地方在于,它點破了當前AI應用深化的一個普遍瓶頸:模型越來越聰明,能處理的任務越來越復雜,但用戶和開發者在真實使用時,最直接的感官體驗卻是——“

      這里的“慢”,不是指回答一句“你好”的速度,而是當用戶任務變得復雜,任務鏈和工作流明顯變長(比如分析整篇財報、編寫復雜函數、或同時完成圖文音視頻多模態輸出等等)時,AI的處理速度必然下降,用戶的等待時間可能會被拖得很長。

      漫長的等待——本身就嚴重限制了 AI 在實際工作流中的可用性;而如果等了半天,AI 拿出的結果還不能令人滿意,用戶的流失就已成定局。

      而過去外界的一貫認知中,“快”=小參數模型的敏捷調用、輸出;“慢”=更大參數量級的模型和細致的思考。此前,模型要的是的平衡,而今天,階躍的Step 3.5 Flash卻敢于對世界說:我全都要!

      01
      MoE架構:

      不要大而全,我要以巧見大

      論速度,Step 3.5 Flash 有多快?

      在復雜推理場景下,保證穩定性的同時Step 3.5 FlashNVDIA Hopper GPU的最高推理速度可以達到每秒350Token,實現點擊即輸出的秒速體驗。

      榜單上,Step 3.5 Flash 以每秒 167 個 Token 的速度排名第九,但排在它前面的,多是在為專有硬件環境定制的模型和 8b-120b 規模不等的小型模型。


      (圖為 Step 3.5 Flash 在 OpenRouter 的 Fastest 榜位居前列)

      而 Step 3.5 Flash 的參數量是 1960 億,足以作為基座模型為 Agent 提供強勁的動力。


      (Reddit平臺用戶評價:終于有東西能在我那只有120GB顯存的破電腦上運行了)

      跑分測試上,Step 3.5 Flash 一馬當先,并且尤其擅長 Agent 場景和數學任務。在 τ2-Bench、BrowseComp 等測試,以及 LiveCodeBench V6 代碼挑戰和 AIME 2025 數學競賽中,Step 3.5 Flash 都拿出了不錯的成績。


      圖注:Step 3.5 Flash 僅憑 11B 激活參數(總規模 196B MoE)便達到了頂尖級別的智能水平,足以媲美領先的閉源及開源模型(數據來源:階躍星辰官方Tech Report)

      實踐上,Step 3.5 Flash 還在多步推理的結構化輸出、復雜邏輯求解、后端自動化和長時間運行任務中,已經具備了企業級應用落地的能力。而針對高頻工具調用和對行為可預測性有強要求的系統環境,Step 3.5 Flash 也能輕松駕馭。

      “快”很容易,“強”也很容易。要理解 Step 3.5 Flash 為何能做到又快又強,首先要了解的,是它采用的“稀疏混合專家(MoE)架構”——這是一個在追求超大模型時代里,回歸工程理性的設計。

      傳統的千億參數大模型像一個“全能巨人”,處理任何問題,無論難易,都要動用全部腦力(激活所有參數)。

      每一次都“全力出擊”,這固然能保證能力,但計算成本極高的同時,也讓推理緩慢、能耗巨大,算力的浪費也同樣不可避免。

      Step 3.5 Flash 的思路則不同。

      作為一個總參數量1960億的Agent 原生基座模型,它被精巧地組織成了許多個“專家小組”。當一個問題輸入時,一個智能的路由機制會迅速判斷:“這個問題主要由哪幾個專家小組來處理最合適?”然后,只激活這些相關的“專家”——大約110億參數——來工作。


      (海外用戶評價:它僅使用11b的活躍參數,所以運行速度極快。老實說,我對它毫無延遲的運行表現著迷。)

      你可以把它想象成一個高度專業化的超級顧問團。接到一個金融分析任務,系統不會喚醒團里的醫學專家或文學教授,而是精準地調度金融、數據分析、邏輯推理這幾個小組來協同工作。

      這種設計,既能讓每次推理實際消耗的計算資源大幅減少,提升了計算速度,成本也隨之下降;又能背靠“顧問團”1960 億參數的“總知識庫”,在需要處理復雜、跨界問題時,依然有能力調動不同領域的“專家”進行深度協作,讓輸出保質保量。

      憑借著更聰明的調用,Step 3.5 Flash 采用的稀疏 MoE 架構,打破了“大模型”必須“力大磚飛”的固有印象,讓 AI 的能力和速度,成為了可以兼得的“魚與熊掌”。

      02
      不只是
      跑得快,更是想得流暢

      光是有了更高效的架構還不夠,Step 3.5 Flash 在具體工程實現上也做了不少優化,確保在真實場景中“跑”得流暢。

      首先是處理長文本的“巧勁”。

      人要學會快速瀏覽文本,就必須學會“一目十行”——AI 也一樣,面對一個超長文本還要快速輸出內容,就不能在生成新詞時,每次都全文逐字閱讀理解。這被稱為“全注意力”機制,雖然輸出效果更好,但 AI 的計算量會隨著文本長度呈平方級增長,是導致處理長文本時速度劇降、延遲飆升的主要原因。

      要一目十行,模型就必須采取滑動窗口注意力(Sliding-Window Attention, SWA)的機制。

      所謂滑動窗口,是基于一個符合直覺的觀察:在理解一個長句子或段落時,當前詞的含義最受其“鄰近”詞匯的影響,而距離很遠的詞影響相對較小。在這種機制下,模型能更專注于一個窗口中臨近詞匯的內容,讀的內容變少了,處理速度當然更快,成本也自然更低。

      而 Step 3.5 Flash 則是博采眾長,采用了 3:1 的滑動窗口與全局注意力混合架構(SWA + Full Attention),對 256K 上下文有著高效的處理能力。

      不光得快,Step 3.5 Flash得快。

      傳統的模式,AI 生成 Token,要一個一個地“往外蹦”,在追求 AI 快交互的今天,這樣的速度明顯不夠。

      而 Step 3.5 Flash 采用了多 Token 預測(Multi-Token Prediction, MTP-3) 的技術,一次可以完成多個 Token 的預測,這相當于讓 Token 的輸出從“單車道”變成了“多車道”,直接讓文本生成的吞吐效率翻了倍。

      有了稀疏 MoE 架構,再整合了更先進的技術模式,給市場帶來的震撼是直接的:AI在處理復雜、多步任務時的“遲滯感”正在被抹平。無論是代碼生成、長文檔分析還是需要多輪思考的規劃任務,響應都變得更加即時和連貫。

      Step 3.5 Flash 的出現,對于那些希望將 AI 深度集成到自動化工作流中的開發者而言,標志著一個實用的拐點——一個既聰明又敏捷的“AI大腦已經觸手可及。

      03

      結語

      模型能力的升級,在今天似乎已經不是新鮮事——而 Step 3.5 Flash 的強勢登場,卻打破了過往的技術預設。

      Step 3.5 Flash 所代表的,不僅僅是一個模型版本的迭代,更是一種技術路徑的明確:通往更強大的人工智能的道路,不一定只靠無限制地堆疊參數,通過架構創新和工程優化,在效能與能力之間取得精妙平衡,同樣是關鍵且務實的一步。

      Step 3.5 Flash 登榜的勝利,不止是模型技術的勝利,更是模型工程的勝利,是階躍星辰在追尋 AGI 的路上,邁出的堅實一步。

      今天,Step 3.5 Flash 已在 OpenRouter、GitHub、階躍 AI APP 和網頁端等多端同步上線,面向開發者提供免費試用與快速部署支持。而同時,階躍星辰也已啟動了下一代 Step 4 的研發,并邀請全球開發者“深度參與共創”,讓模型從工程中來,到工程中去,用最“落地”的方式做最“高級”的事情。

      從 Step 3.5 Flash 開始,市場便能夠看到一條通往 AGI 更清晰的路徑——通過構建更快、更穩、更易獲取的智能基座,降低每一個創新者構建高級AI應用的門檻。

      當無數開發者可以基于這樣的基座,在面對千行百業的具體問題時,都能創造出屬于自己的智能體,并且以更便宜、更便捷的方式滿足自己的實際需求,那時的我們距離AGI,或許可以又近了一點點。

      未經「AI科技評論」授權,嚴禁以任何方式在網頁、論壇、社區進行轉載!

      公眾號轉載請先在「AI科技評論」后臺留言取得授權,轉載時需標注來源并插入本公眾號名片。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      王曼昱看到估計會難過!張雪峰曾言:我早晚請你做我們公司代言人

      王曼昱看到估計會難過!張雪峰曾言:我早晚請你做我們公司代言人

      觀察鑒娛
      2026-03-27 09:35:55
      69集諜戰劇來襲,才播3集,收視全國第一,全員高顏值演技派

      69集諜戰劇來襲,才播3集,收視全國第一,全員高顏值演技派

      樂楓電影
      2026-03-27 14:22:36
      勢不可擋!薩巴倫卡兩盤橫掃萊巴金娜,陽光雙賽背靠背晉級決賽

      勢不可擋!薩巴倫卡兩盤橫掃萊巴金娜,陽光雙賽背靠背晉級決賽

      全景體育V
      2026-03-27 10:03:58
      男性長期禁欲,精子只產不排,最后會怎樣?醫生:或有4大后果

      男性長期禁欲,精子只產不排,最后會怎樣?醫生:或有4大后果

      健康之光
      2026-03-06 13:11:59
      女性私處都有哪些形狀?關于女性生理結構的這些秘密,你知道嗎?

      女性私處都有哪些形狀?關于女性生理結構的這些秘密,你知道嗎?

      熊貓醫學社
      2026-03-27 14:07:44
      晚年大忌,別把這三個人當親人,來往越多,晚年越凄涼

      晚年大忌,別把這三個人當親人,來往越多,晚年越凄涼

      阿凱銷售場
      2026-03-06 01:00:19
      清明將至,俗話說:“墳頭三不動,一動窮三代”今年應如何祭祖?

      清明將至,俗話說:“墳頭三不動,一動窮三代”今年應如何祭祖?

      磊子講史
      2026-03-20 16:07:07
      3月全國充電樁服務費集體暴漲:最高漲幅300%?

      3月全國充電樁服務費集體暴漲:最高漲幅300%?

      侃故事的阿慶
      2026-03-26 13:54:23
      救護車側翻5人被困!過路小伙踹破車窗 救完人才發現手上都是血

      救護車側翻5人被困!過路小伙踹破車窗 救完人才發現手上都是血

      閃電新聞
      2026-03-26 16:31:53
      丹麥男友去世后,東北姑娘仍為他生下遺腹子,還為了公婆定居丹麥

      丹麥男友去世后,東北姑娘仍為他生下遺腹子,還為了公婆定居丹麥

      星星沒有你亮
      2026-03-22 08:48:35
      中國股市:如果接下來迎來牛市,堅持只買一種股票,賺到懷疑人生

      中國股市:如果接下來迎來牛市,堅持只買一種股票,賺到懷疑人生

      股經縱橫談
      2026-03-27 11:24:21
      伊朗,曾經是中東最發達的國家,如今為何淪落成“爛泥扶不上墻”

      伊朗,曾經是中東最發達的國家,如今為何淪落成“爛泥扶不上墻”

      文史達觀
      2025-06-24 06:45:04
      泰國征兵海報用《逐玉》張凌赫畫面打廣告,“想像他一樣帥氣騎馬嗎?來當騎兵”

      泰國征兵海報用《逐玉》張凌赫畫面打廣告,“想像他一樣帥氣騎馬嗎?來當騎兵”

      都市快報橙柿互動
      2026-03-27 16:52:39
      焦泊喬申請暫時離隊,球迷:實在無法忍受,就跟徐昕學,換支球隊

      焦泊喬申請暫時離隊,球迷:實在無法忍受,就跟徐昕學,換支球隊

      小樓侃體育
      2026-03-27 16:27:40
      涉嫌嚴重違紀違法!江油市交通運輸局黨組成員、副局長王毅被查

      涉嫌嚴重違紀違法!江油市交通運輸局黨組成員、副局長王毅被查

      瀟湘晨報
      2026-03-27 17:02:49
      美國最擔心的事發生了,伊朗亮出中國“底牌”,中國或成最大贏家

      美國最擔心的事發生了,伊朗亮出中國“底牌”,中國或成最大贏家

      徐云流浪中國
      2026-03-04 15:30:07
      張雪峰去世僅1天,辦公室內景曝光,寫真照被指像遺照,擺設奇怪

      張雪峰去世僅1天,辦公室內景曝光,寫真照被指像遺照,擺設奇怪

      180視角
      2026-03-26 08:43:01
      59歲黎明演唱會生圖翻車,頭禿腹凸臉腫,昔日男神被群嘲像酒保

      59歲黎明演唱會生圖翻車,頭禿腹凸臉腫,昔日男神被群嘲像酒保

      一娛三分地
      2026-03-24 18:14:53
      全世界沒料到,美國動作真快,沒踩中東坑,反而一招洗空30萬億債

      全世界沒料到,美國動作真快,沒踩中東坑,反而一招洗空30萬億債

      瀲滟晴方DAY
      2026-03-26 22:46:22
      見證歷史,中國讓Open AI絕望了!

      見證歷史,中國讓Open AI絕望了!

      君臨財富
      2026-03-25 23:36:26
      2026-03-27 19:00:49
      AI科技評論 incentive-icons
      AI科技評論
      點評學術,服務AI
      7151文章數 20742關注度
      往期回顧 全部

      科技要聞

      楊植麟張鵬夏立雪羅福莉,聊龍蝦、聊漲價

      頭條要聞

      美方稱在美軍事基地裝爆炸物的男子逃往中國 中方回應

      頭條要聞

      美方稱在美軍事基地裝爆炸物的男子逃往中國 中方回應

      體育要聞

      邵佳一:足球就像一場馬拉松

      娛樂要聞

      張雪峰靈堂內景曝光,四周擺滿了鮮花

      財經要聞

      我在小吃培訓機構學習“科技與狠活”

      汽車要聞

      與眾08,金標大眾不能輸的一戰

      態度原創

      本地
      時尚
      教育
      健康
      公開課

      本地新聞

      在濰坊待了三天,沒遇到一個“濰坊人”

      從50塊到5w,她們過去一年最愛的包是這些

      教育要聞

      重拳出擊,整治教育內卷,中考徹底變天了

      干細胞抗衰4大誤區,90%的人都中招

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版