<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      無需標注圖像,RL自我進化框架VisPlay突破視覺推理難題

      0
      分享至




      在 Vision-Language Model 領域,提升其復雜推理能力通常依賴于耗費巨大的人工標注數據或啟發式獎勵。這不僅成本高昂,且難以規模化。

      最新研究 VisPlay 首次提出了一個自進化強化學習框架,使 VLM 能夠僅通過海量的未標注圖像數據進行自我演化和能力提升。

      VisPlay 將基礎 VLM 分解為「提問者」和「推理者」兩大角色,通過迭代的自我進化機制協同進化,并結合 GRPO 算法和創新的多樣性/難度獎勵,平衡了問題的復雜度和答案的質量。



      • Title:VisPlay: Self-Evolving Vision-Language Models from Images
      • Paper:https://arxiv.org/abs/2511.15661
      • Github:https://github.com/bruno686/VisPlay

      實驗證明,VisPlay 在 Qwen2.5-VL 和 MiMo-VL 等主流模型上實現了持續的性能提升,尤其在視覺推理、組合泛化和幻覺減少方面效果顯著,展示了一條可擴展、低成本的多模態智能進化新路徑。



      引言:

      VLM 推理能力的「數據困境」

      近年來,Vision-Language Model(VLM)在感知任務上取得了不小的進展,但在更復雜的視覺推理上仍然吃力。主流的提升方式如指令微調(SFT)或強化學習(RL)都繞不開一個核心難題:依賴高質量標注數據。尤其是強化學習,需要精準且可驗證的獎勵信號,而這些往往要靠耗時費力的人工標注或針對具體任務設計復雜的規則。

      隨著模型規模越來越大,人工標注的成本和速度已經逐漸跟不上模型演化的需求,這也成為進一步提升能力的主要瓶頸。在這樣的背景下,研究者開始嘗試「自進化」(Self-Evolving)的思路,讓模型能通過自我生成、自我修正以及從自身經驗中持續學習,從而實現自主的能力迭代。

      VisPlay:

      基于自我進化的自進化框架

      為解決上述挑戰,由來自伊利諾伊大學厄巴納-香檳分校、華盛頓大學圣路易斯分校、馬里蘭大學、新加坡國立大學的研究團隊提出的 VisPlay 框架,首次將自進化強化學習應用于 VLM,并實現僅依賴未標注圖片進行自主學習。

      VisPlay 的核心理念是自我進化(Self-Evolving):它從一個基礎預訓練 VLM 出發,將其在訓練過程中分解成兩個相互作用的角色。

      Image-Conditioned Questioner(提問者)

      負責根據輸入的圖片生成具有挑戰性、但又可被回答的視覺問題。具體來說,VisPlay 設計了一種精妙的獎勵機制來指導自我進化的質量,分別是難度獎勵(Difficulty Reward)和多樣性獎勵(Diversity Reward)。

      前者鼓勵提問者生成更復雜的、需要深層次推理才能解決的問題;后者確保生成的問題類型和涉及的知識點足夠廣泛,防止模型陷入狹窄的知識或推理路徑,從而實現更強大的組合泛化能力。

      通過這種獎勵機制,VisPlay 有效解決了自進化模型中常見的「答案質量低」和「問題重復度高」的問題,真正實現了從量變到質變的能力飛躍。

      Multimodal Reasoner(推理者)

      負責基于圖片和提問者的問題,生成「白銀級響應」(Silver Responses,即偽標注答案)。這里我們采用回答的準確性作為訓練信號。



      實驗結果:

      全方位的能力突破

      研究團隊將 VisPlay 應用于包括 Qwen2.5-VL 和 MiMo-VL 在內的多個主流 VLM 模型家族,并在八個主流基準數據集上進行了廣泛評估,涵蓋:通用視覺理解(如 MM-Vet)、跨模態推理(如 MMMU)、視覺數學推理(如 MathVerse)以及幻覺檢測(HallusionBench)。



      關鍵發現:

      持續穩定的性能提升:在所有測試模型和基準上,VisPlay 都實現了一致且顯著的準確率增益,證明了該框架的泛化性和有效性。

      強大的組合泛化能力:模型在訓練中未見過的復雜推理組合上表現出更強的魯棒性。

      有效抑制「幻覺」:VisPlay 通過自我進化生成的高質量問答對,有效幫助模型識別和修正錯誤的視覺-語言關聯,顯著減少了模型產生「幻覺」現象的概率,這是一個困擾 VLM 的重大問題。

      VisPlay 的成功證明了僅依賴海量非結構化圖片來持續提升 VLM 推理能力的可行性,為未來開發更智能、更自主的多模態系統指明了方向。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      收到1.2億歐元罰單后,馬斯克的X平臺關閉了歐盟委員會的廣告賬戶

      收到1.2億歐元罰單后,馬斯克的X平臺關閉了歐盟委員會的廣告賬戶

      中國能源網
      2025-12-08 11:14:09
      已證實楊振寧長子去世,看49歲翁帆現在做的事,才知我們誤會她了

      已證實楊振寧長子去世,看49歲翁帆現在做的事,才知我們誤會她了

      顧史
      2025-12-08 19:44:32
      李玟加拿大丈夫也沒想到,妻子去世兩年后,姐姐竟意外承受了惡意

      李玟加拿大丈夫也沒想到,妻子去世兩年后,姐姐竟意外承受了惡意

      梨花黛娛
      2025-11-21 15:11:04
      建議所有人:做好提前準備!2025年12月起,中國將迎來4個變局

      建議所有人:做好提前準備!2025年12月起,中國將迎來4個變局

      貓叔東山再起
      2025-11-28 10:40:03
      香港大埔宏福苑有13戶聯系不到人?不排除旅游或者全戶罹難

      香港大埔宏福苑有13戶聯系不到人?不排除旅游或者全戶罹難

      九方魚論
      2025-12-07 23:33:18
      你的身材,暴露了你的階層

      你的身材,暴露了你的階層

      洞見
      2025-12-07 21:25:07
      華為杜瓦光刻技術曝光!專利文件揭示2納米芯片制造新路徑

      華為杜瓦光刻技術曝光!專利文件揭示2納米芯片制造新路徑

      普陀動物世界
      2025-12-07 07:16:52
      特朗普徹底放棄歐洲,德國戰車正式啟動,歐盟去美國化開始了

      特朗普徹底放棄歐洲,德國戰車正式啟動,歐盟去美國化開始了

      聽風聽你
      2025-12-07 12:27:03
      王鷗跟女兒散步,母親一起同行,祖孫三代好溫馨!

      王鷗跟女兒散步,母親一起同行,祖孫三代好溫馨!

      小小一米月兒
      2025-12-08 00:50:05
      住在成都市這些商圈小區里的人要發財了!成都12月小區漲跌排行榜

      住在成都市這些商圈小區里的人要發財了!成都12月小區漲跌排行榜

      石辰搞笑日常
      2025-12-08 15:32:49
      CBA俱樂部杯八強確定,八進四對陣出爐:廣東VS上海,山東VS浙江

      CBA俱樂部杯八強確定,八進四對陣出爐:廣東VS上海,山東VS浙江

      中國籃壇快訊
      2025-12-08 17:47:20
      菲國內大亂,副總統準備接班,馬科斯急找后路,12萬菲軍被逼站隊

      菲國內大亂,副總統準備接班,馬科斯急找后路,12萬菲軍被逼站隊

      墨蘭史書
      2025-12-08 09:10:09
      F4合體阿信促成,朱孝天被踢出局,老婆哭訴真相:他早就得罪光了

      F4合體阿信促成,朱孝天被踢出局,老婆哭訴真相:他早就得罪光了

      可樂談情感
      2025-12-07 16:54:37
      法國與浙江都是6000多萬人口,法國創造了3萬多億美元,浙江呢?

      法國與浙江都是6000多萬人口,法國創造了3萬多億美元,浙江呢?

      回京歷史夢
      2025-11-10 13:29:34
      朗朗帶母親埃及旅游,打扮貴氣頭發潦草像暴發戶,吉娜和兒子沒來

      朗朗帶母親埃及旅游,打扮貴氣頭發潦草像暴發戶,吉娜和兒子沒來

      銀河史記
      2025-11-28 16:56:06
      結束了!澤連斯基發表全國講話,烏克蘭人狂歡:終于不用提心吊膽

      結束了!澤連斯基發表全國講話,烏克蘭人狂歡:終于不用提心吊膽

      愛下廚的阿釃
      2025-12-08 09:54:44
      郭曉冬老婆趕山東大集,買3元焦米棍當零食,47歲第一次吃烤雞腿

      郭曉冬老婆趕山東大集,買3元焦米棍當零食,47歲第一次吃烤雞腿

      農村娛樂光哥
      2025-12-07 11:55:52
      質疑聲超多,26歲閔某已任浙大馬院博士生導師,博士入學2年當博導?

      質疑聲超多,26歲閔某已任浙大馬院博士生導師,博士入學2年當博導?

      趣筆談
      2025-12-08 11:46:24
      中國艦隊南下,澳大利亞網友心都碎了:都是用我們的鐵礦造的啊!

      中國艦隊南下,澳大利亞網友心都碎了:都是用我們的鐵礦造的啊!

      青青子衿
      2025-12-07 23:15:49
      屁股大的女生太性感,粉色背心搭尼龍褲,肉肉的女生也能很好看

      屁股大的女生太性感,粉色背心搭尼龍褲,肉肉的女生也能很好看

      小喬古裝漢服
      2025-12-08 17:04:12
      2025-12-08 20:35:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      11873文章數 142510關注度
      往期回顧 全部

      科技要聞

      外面有人挖,家里有人跑:蘋果亂成了一鍋粥

      頭條要聞

      臺學者:殲-15開射控雷達照射F-15 反而是日本撿到寶

      頭條要聞

      臺學者:殲-15開射控雷達照射F-15 反而是日本撿到寶

      體育要聞

      一位大學美術生,如何用4年成為頂級跑者?

      娛樂要聞

      章子怡被說拜高踩低 主動和卡梅隆熱聊

      財經要聞

      重磅!政治局會議定調明年經濟工作

      汽車要聞

      純電全尺寸大六座 凱迪拉克"小凱雷德"申報圖曝光

      態度原創

      藝術
      房產
      親子
      健康
      數碼

      藝術要聞

      一棵樹的力量

      房產要聞

      碧桂園,開始甩賣海口家底!

      親子要聞

      小滿第一次看到大雪 今年韓國的第一場雪

      甲狀腺結節到這個程度,該穿刺了!

      數碼要聞

      華為Mate 80 RS率先實現BT.2020色域 李小龍:過于先進!

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲欧洲自拍拍偷精品 美利坚| 99久久精品久久久久久婷婷 | 国产精品18| 章丘市| 无码av波多野结衣| 亚州性无码不卡免费视频| 资源在线观看视频一区二区| 亚洲AV电影网| 夜夜操影院| 人人妻人人澡人人爽欧美一区九九 | 国产乱码一区二区三区| 久久精品欧美一区二区三区麻豆 | 日韩欧美一区二区三区| 东京热无码av男人的天堂| 最近最好的中文字幕2019免费| 久久成人电影| 日本极品少妇videossexhd| 日韩www| 精品少妇爆乳无码av无码专区| 亚洲资源av无码日韩av无码| 91老肥熟女九色老女人| 亚洲人妻av| 66av在线| 国产av一区二区三区天堂综合网| 亚洲中文无码永久免费| 伊人色区| 黑人大群体交免费视频| 日本理伦片午夜理伦片| 这里只有精品在线播放 | 民权县| 粗大的内捧猛烈进出视频| 中文人妻无码一区二区三区信息| 国产成人a在线观看视频| 婷婷久久久| 亚洲天堂人妻| 国产97色在线 | 中国| 日本边添边摸边做边爱| 日韩色区| 中文字幕丰满乱子无码视频| 中文字幕av无码不卡| 丁香婷婷综合激情五月色|