![]()
3 月 4 日消息,中國大模型創(chuàng)業(yè)公司階躍星辰繼開源 Step 3.5 Flash 模型后,又開源了這款 Agent 基座模型的預訓練權重(Base)、中訓練權重(Midtrain)以及配套的 Steptron 訓練框架。這一舉動在當前大模型開源趨于保守的環(huán)境下,顯得頗為徹底,在開源社區(qū)引發(fā)熱烈反響。
![]()
![]()
![]()
(圖:開源社區(qū)反響熱烈)
據(jù)了解,Step 3.5 Flash 采用稀疏 MoE 架構,總參數(shù) 1960 億,但推理時僅激活約 110 億參數(shù),單請求代碼任務下推理速度最高可達 350 TPS。該模型專為智能體(Agent)場景設計,在復雜推理和長鏈任務中表現(xiàn)出色,官方稱其推理深度可媲美部分頂級閉源模型。
在開發(fā)者社區(qū)和實際應用中,Step 3.5 Flash 已經(jīng)迅速獲得了市場驗證。截至目前,這款模型在 Hugging Face 上下載量已超 30 萬次,并登上 OpenRouter Trending 第一名,獲得了較高的社區(qū)認可度。而在知名開源項目 OpenClaw(被中國網(wǎng)友稱為“小龍蝦”)上,該模型排名已升至前二。這些成績反映出模型在速度、穩(wěn)定性和 Agent 適配性上的真實競爭力。
![]()
(圖:OpenClaw 調用量模型排名)
隨著 OpenClaw 等 Agent 平臺熱度持續(xù)升溫,Step 3.5 Flash 的開源或將進一步加速中國模型在全球 Agent 生態(tài)中的滲透。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.