<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      開源新王炸!10B多模態小模型屠榜,性能媲美20倍巨無霸

      0
      分享至


      智東西
      作者 程茜
      編輯 李水青

      智東西1月20日報道,今日下午,階躍星辰開源多模態模型Step3-VL-10B。該模型參數量為10B,在視覺感知、邏輯推理、數學競賽以及通用對話等一系列基準測試中均達到同規模SOTA水平。

      階躍星辰的多項測評顯示,Step3-VL-10B的性能可以媲美甚至超越規模大10-20倍的開源模型,如GLM-4.6V 106B-A12B、Qwen3-VL-Thinking 235B-A22B以及閉源旗艦模型,如Gemini 2.5 Pro、Seed-1.5-VL。


      這一輕量級模型的性能表現,也意味著手機、電腦、工業嵌入式設備也可以運行GUI操作、復雜文檔解析、高精度計數等復雜多模態推理任務。

      從技術層面看,Step3-VL-10B的性能突破得益于三個關鍵設計,分別是高質量多模態語料庫上進行統一預訓練、縮放多模態強化學習、并行協調推理機制。

      目前,階躍星辰已開源Step3-VL-10B系列的Base模型和Thinking模型。

      Hugging Face開源地址:https://huggingface.co/collections/stepfun-ai/step3-vl-10b

      ModelScope開源地址:https://modelscope.cn/collections/stepfun-ai/Step3-VL-10B

      體驗地址:https://huggingface.co/spaces/stepfun-ai/Step3-VL-10B

      技術報告鏈接:https://arxiv.org/pdf/2601.09668

      一、從GUI感知到視覺識別和推理,Step3-VL-10B思路清晰

      階躍星辰在官方公眾號里放出了Step3-VL-10B在多模推理能力方面的真實案例。

      首先是關于摩爾斯編碼的推理,可以看到模型的思考過程思路清晰,先拆解字母再逐個查表,最后拼接,流程正確,并且對大部分字母如S、T、E、F、U、N的定位和編碼描述準確。


      其次是GUI感知能力,模型需要識別標簽頁中以章節開頭.tex結尾的文件標簽,可以看到其思考過程采用了識別標簽、排除非目標、統計數量的步驟進行了準確分析,并有效規避了干擾選項。


      第三個是關于圖推理的案例,模型需要在連線非常復雜的圖片中準確識別中長度最短的圖有幾條,從思考過程可以看到,其先確認了最小權重的邊長度是1,然后再統計所有權重為1的邊。


      二、拿下開源SOTA,數學競賽測試題超94分

      Step3-VL-10B具備三大核心亮點:

      視覺感知精度更高:在同參數量級中展現出頂尖的識別與感知精度,研究人員為其引入PaCoRe(并行協調推理)機制,模型在復雜計數、高精度OCR及空間拓撲理解等高難度任務上的可靠性提升。

      深層邏輯推演與長程推理:得益于規?;瘡娀瘜W習(RL)的持續迭代,Step3-VL-10B在10B規模上能應對競賽級數學難題、真實編程環境、視覺邏輯謎題。

      端側Agent交互:基于海量GUI(圖形用戶界面)專用預訓練數據,模型能夠精準識別并操作復雜界面。

      階躍星辰公開的多模態基準測試結果顯示,Step3-VL-10B是10B參數類別中最強大的開源模型。


      具體來看,在多模態推理能力上,Step3-VL-10B在部分測試集上超越了GLM-4.6V、Qwen3-VL等模型,其性能優于10倍至20倍大的模型。


      數學能力方面,該模型在AIME 25/24等數學競賽測試題上得分超過94分,這意味著其在邏輯嚴密性上甚至優于許多千億級模型。


      2D、3D空間推理能力上,模型在BLINK上表現出66.79%的涌現式空間意識,在All-Angles-Bench上達到57.21%,意味著該模型在具身智能應用方面具有強大的潛力。


      最后是編程能力,在真實、動態編程環境下,Step3-VL-10B超越GLM-4.6V、Qwen3-VL等模型。


      此外,該模型的開源主頁顯示,研究人員在Qwen3VL-8B相關的基準測試中出現了不準確數據,例如AIME、HMMT、LCB,目前正在修復。這些錯誤是由于其在大規模評估過程中max_tokens設置錯誤造成,他們將重新運行測試,并在下一版技術報告中提供修正后的數據。

      三、從感知到推理雙提升,三大關鍵設計加持

      該模型的論文提到,Step3-VL-10B的性能突破得益于三個關鍵設計:

      一是在高質量多模態語料庫上進行統一預訓練:研究人員采用單階段、完全解凍的訓練策略,在1.2T token的多模態語料庫上進行訓練,重點關注兩大基礎能力:推理和感知,例如通用知識和教育中心任務等推理能力,定位、計數、OCR和GUI交互等感知能力。

      通過聯合優化感知編碼器和Qwen3-8B解碼器,STEP3-VL-10B建立了內在的視覺-語言協同效應。

      二是縮放多模態強化學習:通過一個嚴格的后訓練流程解鎖了前沿能力,該流程包括兩階段監督微調(SFT)以及超過1400次的強化學習迭代,結合可驗證獎勵(RLVR)和人類反饋(RLHF)。

      三是并行協調推理機制:研究人員采用并行協調推理(PaCoRe),支持推理階段的動態算力擴展。通過并行探索多個感知假設并進行多維證據聚合,該機制顯著提升了模型在競賽級數學、復雜OCR識別、精準物體計數及空間拓撲推理中的準確度。

      階躍星辰的官方公眾號提到,得益于“三位一體”架構,Step3-VL-10B證明智能水平并不完全取決于參數規模。這也意味著:世界一流的多模態能力有望以更低成本、更少算力獲得;與此同時,過去主要集中在云端超級智能將逐步向端側下沉,推動終端走向“主動理解與可執行交互”。

      結語:Step3-VL-10B或成端側AI新選擇

      從Step3-VL-10B的實測可以看出,該模型憑借10B輕量化參數體量,通過高質量多模態語料統一預訓練、千余次強化學習迭代及并行協調推理機制,實現了對超大規模模型的跨級性能追趕。

      并且具體到GUI交互、精準計數、競賽級數學推理等任務,該模型也展現出較大應用潛力,未來有望降低在工業質檢、本地文檔分析、基層醫療輔助等場景的部署門檻。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      特朗普稱“美國擁有無人知曉的武器”,克宮表態

      特朗普稱“美國擁有無人知曉的武器”,克宮表態

      環球網資訊
      2026-01-21 21:29:06
      苦盡甘來!陳光標表示將捐贈1300萬,李亞鵬稱“德不孤行必有鄰”

      苦盡甘來!陳光標表示將捐贈1300萬,李亞鵬稱“德不孤行必有鄰”

      火山詩話
      2026-01-21 18:35:21
      國內媒體:向余望打進關鍵一球,其父親喝酒慶祝到早上

      國內媒體:向余望打進關鍵一球,其父親喝酒慶祝到早上

      懂球帝
      2026-01-21 16:30:14
      TOP14位身高170以上的女神,有顏有燈有演技

      TOP14位身高170以上的女神,有顏有燈有演技

      素然追光
      2026-01-02 02:45:02
      上映56天,僅38個觀眾,片方分賬390元,2026年最慘電影誕生

      上映56天,僅38個觀眾,片方分賬390元,2026年最慘電影誕生

      胡一舸南游y
      2026-01-21 17:19:09
      中方收到入群邀請函,特朗普也翻臉了:關稅加到200%!受害者出現

      中方收到入群邀請函,特朗普也翻臉了:關稅加到200%!受害者出現

      策略述
      2026-01-21 19:13:24
      委內瑞拉代總統會見美國中情局局長,特朗普:她會來但現在不合適

      委內瑞拉代總統會見美國中情局局長,特朗普:她會來但現在不合適

      合贊歷史
      2026-01-21 16:27:56
      著名京劇演員孫彩虹逝世,曾參演并擔任87版《紅樓夢》劇務

      著名京劇演員孫彩虹逝世,曾參演并擔任87版《紅樓夢》劇務

      澎湃新聞
      2026-01-21 15:55:20
      廣東三地市新任命副市長

      廣東三地市新任命副市長

      南方都市報
      2026-01-21 13:24:05
      女子拍攝姑姑偷玉米被姑父棒殺!姑姑哀求出諒解書,女兒絕不原諒

      女子拍攝姑姑偷玉米被姑父棒殺!姑姑哀求出諒解書,女兒絕不原諒

      葉公子
      2026-01-21 18:50:53
      剛剛 | 德云社嚴正聲明!

      剛剛 | 德云社嚴正聲明!

      天津廣播
      2026-01-21 20:23:38
      讓“吹哨人”敢吹哨!謹以此文致敬羅永浩

      讓“吹哨人”敢吹哨!謹以此文致敬羅永浩

      社會日日鮮
      2026-01-21 09:17:54
      “三評西貝關店事件”,人民日報有6個問題說錯了

      “三評西貝關店事件”,人民日報有6個問題說錯了

      黔有虎
      2026-01-21 16:52:45
      直沖20℃!浙江升溫時間確定

      直沖20℃!浙江升溫時間確定

      魯中晨報
      2026-01-21 19:27:03
      四連勝的越南隊!為何會被U23國足吊打,越南媒體撰文給出答案

      四連勝的越南隊!為何會被U23國足吊打,越南媒體撰文給出答案

      懂個球
      2026-01-22 00:08:47
      國家下狠手了!體制內大地震,少爺、公主們的“天”,要塌了

      國家下狠手了!體制內大地震,少爺、公主們的“天”,要塌了

      霹靂炮
      2026-01-19 22:24:13
      人去樓空、資金鏈斷裂!又一平臺暴雷,老板疑跑路,有人剛充上萬

      人去樓空、資金鏈斷裂!又一平臺暴雷,老板疑跑路,有人剛充上萬

      品牌觀察官
      2026-01-20 17:53:37
      一份假公證書引發的“繼承之戰”:西安翻譯學院已故創始人兩女兒爭奪“舉辦者身份”,一審宣判后3名原告上訴

      一份假公證書引發的“繼承之戰”:西安翻譯學院已故創始人兩女兒爭奪“舉辦者身份”,一審宣判后3名原告上訴

      極目新聞
      2026-01-21 21:50:59
      藍白迎戰彈劾審查會,賴清德不出席,現場擺出“清德宗”看板

      藍白迎戰彈劾審查會,賴清德不出席,現場擺出“清德宗”看板

      海峽導報社
      2026-01-21 09:52:03
      中國網球名將退役!曾4奪大滿貫冠軍,最高排名雙打世界第一

      中國網球名將退役!曾4奪大滿貫冠軍,最高排名雙打世界第一

      全景體育V
      2026-01-21 14:45:38
      2026-01-22 02:04:49
      智東西 incentive-icons
      智東西
      聚焦智能變革,服務產業升級。
      11101文章數 116943關注度
      往期回顧 全部

      科技要聞

      給機器人做仿真訓練 這家創企年營收破億

      頭條要聞

      中國球迷被指可免費入場看U23國足決賽 中使館回應

      頭條要聞

      中國球迷被指可免費入場看U23國足決賽 中使館回應

      體育要聞

      只會防守反擊?不好意思,我們要踢決賽了

      娛樂要聞

      首位捐款的明星 苗圃現身嫣然醫院捐款

      財經要聞

      丹麥打響第一槍 歐洲用資本保衛格陵蘭島

      汽車要聞

      2026款上汽大眾朗逸正式上市 售價12.09萬起

      態度原創

      時尚
      旅游
      房產
      家居
      手機

      締造仙女夢的人,去了天堂繼續縫制星光?

      旅游要聞

      不必跟風“殺豬宴”,鄉村旅游沒有“標準答案”|新京報專欄

      房產要聞

      那個砸下400億的綠地,又要殺回海南了!

      家居要聞

      褪去浮華 觸達松弛與欣喜

      手機要聞

      iPhone越貴越好賣!iPhone18沒有單打孔

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产乱沈阳女人高潮乱叫老| 四虎永久在线精品国产| 一本无码人妻在中文字幕免费 | 亚洲av无码专区国产不卡顿| 97久久精品人人澡人人爽| 国产AV中文字幕| www夜片内射视频日韩精品成人| av无码不卡| 天天躁日日躁夜夜爽| 老色鬼在线精品视频在线观看| 少妇一区二区三区久久久| 午夜在线不卡| 欧美另类图片视频无弹跳第一页 | 午夜av亚洲一码二中文字幕青青| 色色97| 国产动作大片中文字幕| 日本丰满的人妻hd高清在线| 伊人AV在线| 欧美牲交a欧美在线| 東北老熟女黃色A片| 亚洲成人国产精品| 中文字字幕在线中文乱码| 欧美丰满熟妇aaaaa片| 国产无套白浆一区二区| 亚洲熟女VS国产对比| 日韩?人妻?无码?制服| 黑人精品| 亚洲欧洲自拍自拍A| 亚洲精品国产美女久久久| 午夜精品福利影院| 无码va在线观看| 国产I熟女l国产.熟女视频| 国外少妇视频网站| 中文字幕自拍| 精品国产中文字幕av| 天堂一区二区三区av| 国产精品无码无片在线观看| а∨天堂一区中文字幕 | 国产精品毛片一区二区在线看| 久久久久国产精品熟女影院 | 超碰人人摸|