<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      文生圖進入Agent時代:港中文聯合伯克利開源Gen-Searcher

      0
      分享至



      過去兩年,圖像生成模型在質感和審美上一路狂飆,但大多仍是 “直接出圖” 的范式。

      一旦 prompt 涉及真實世界知識、最新信息、冷門事實,或者需要跨多個來源核對細節,傳統文生圖模型就很容易翻車。

      因為生成模型缺乏面向真實世界的 Agent 能力,仍然依賴固化的參數知識,缺少主動搜索、驗證和整合外部信息的能力。

      最近,來自香港中文大學 MMLab、UC Berkeley 和 UCLA 的研究團隊提出了 Gen-Searcher,首次嘗試為圖像生成任務訓練一個 “深度搜索” 智能體。它讓圖像生成模型能夠像 Agent 一樣進行搜索、推理、找圖和瀏覽網頁,從而輸出真正可靠的生成結果。所有數據,模型,和代碼,均已開源。



      • 論文標題:Gen-Searcher: Reinforcing Agentic Search for Image Generation
      • 論文地址:https://arxiv.org/pdf/2603.28767
      • 項目主頁:https://gen-searcher.vercel.app/

      現實需求:從 “直接生成” 到 Agentic 生成

      現實世界中的圖像生成任務,往往不只是 “按 prompt 作畫”。很多場景會涉及真實世界知識、最新信息、冷門事實,甚至需要跨多個來源核對細節。模型不僅要會生成,還要先判斷哪些信息需要確認、哪些視覺細節需要參考、哪些內容必須依賴外部知識支撐。

      在這種背景下,傳統文生圖模型有兩個核心問題:一是主要依賴預訓練學到的參數知識,缺乏主動搜索、驗證和整合外部信息的能力;二是整體流程仍是 “輸入 prompt,直接出圖”,缺少像 Agent 那樣先搜索、推理、整理證據的過程,因此在真實場景里很容易 “畫得像,卻畫不對”

      為了解決這個問題,研究團隊提出了 Gen-Searcher,希望把文生圖從 “直接生成” 推進到 Agentic 生成

      數據構建與 KnowGen 基準

      為了訓練這種能力,作者先構造了一批真實世界需要搜索才能完成的生成數據,覆蓋名人、動漫、物理、化學、藝術、建筑、新聞等約 20 個類別。



      隨后,作者讓強模型配合搜索工具生成多輪軌跡,收集文本知識和視覺證據,再用 Nano Banana Pro 合成目標圖像,得到約 30k 條原始樣本。經過 Seed1.8 篩選后,最終保留約 17k 條高質量數據,并整理成 Gen-Searcher-SFT-10k 和 Gen-Searcher-RL-6k。



      在此基礎上,作者還提出了新的 benchmark —— KnowGen。它包含 630 條人工驗證樣本,用于圖像生成 Agent 評測。

      模型訓練

      Gen-Searcher 的核心,是把生成前的信息獲取過程做成一個可訓練的 Agent。模型不再拿到 prompt 就直接生成,而是先在多輪交互中決定何時搜索、搜什么、是否瀏覽網頁、是否補充視覺參考,最后輸出準確的 prompt 和參考圖。

      它配備了三類工具:文本搜索、圖像搜索和網頁瀏覽。訓練上則分兩階段進行:先通過 SFT 訓練學會工具使用,再通過 agentic RL 優化搜索策略和長程決策。

      論文還提出了雙獎勵反饋。因為只看最終圖像效果并不穩定,作者額外加入了一個文本獎勵,用來評估輸出的 prompt 是否已經包含足夠、正確、與生成相關的信息,再與圖像獎勵結合起來共同訓練。這樣,模型不僅要 “畫得好”,也要 “搜得對”



      實驗結果

      在 KnowGen 上,原始 Qwen-Image 的 K-Score 為 14.98,接入 Gen-Searcher-8B 后提升到 31.52,提高 16.54 分。而且這種能力還能遷移到其他圖像生成器上:Seedream 4.5 從 31.01 提升到 47.29,Nano Banana Pro 也從 50.38 提升到 53.30。



      在 WISE 測試基準上,模型同樣帶來了巨大的提升。



      可視化分析表明,Gen-Searcher 能夠真正提高模型生圖的準確性和質量。



      Gen-Searcher 的推出,不僅展示了 Agentic 生成在知識密集型圖像生成任務上的潛力,也為構建真正能夠連接搜索、推理與生成的一體化系統提供了清晰路徑。

      它不僅能 “畫”,還能 “查”;不僅能完成傳統的文本到圖像生成,更能在生成之前主動搜索信息、核對事實、整合證據,展現出面向真實世界復雜任務的生成能力。

      在大模型不斷走向多模態、強推理與 Agent 化的趨勢下,Gen-Searcher 的工作或許只是一個起點,但它所驗證的方向,正在成為生成系統邁向 Agentic 時代的重要一步。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      6月1日起,包工頭徹底告別舞臺!建筑圈大洗牌,5000萬工人迎巨變

      6月1日起,包工頭徹底告別舞臺!建筑圈大洗牌,5000萬工人迎巨變

      普陀動物世界
      2026-04-10 21:35:49
      男演員吃面加蔥花被服務員阻攔,遇見小面致歉:責任在我們自身

      男演員吃面加蔥花被服務員阻攔,遇見小面致歉:責任在我們自身

      極目新聞
      2026-04-11 16:12:44
      如果當初中國不改革開放,今天仍是全球最落后的國家之一嗎?

      如果當初中國不改革開放,今天仍是全球最落后的國家之一嗎?

      掠影后有感
      2026-04-10 09:58:45
      新中國十位國家級女領導人

      新中國十位國家級女領導人

      祁州校尉
      2026-04-11 09:00:31
      克羅斯吐槽老東家:拜仁次回合總掉鏈子,皇馬就愛踢大亂戰!

      克羅斯吐槽老東家:拜仁次回合總掉鏈子,皇馬就愛踢大亂戰!

      仰臥撐FTUer
      2026-04-12 08:03:02
      求復合?馬伊琍官宣兩大喜訊,前夫文章也傳來好消息,這是鬧哪出

      求復合?馬伊琍官宣兩大喜訊,前夫文章也傳來好消息,這是鬧哪出

      子芫伴你成長
      2026-04-11 23:34:33
      4月起必辦!2個證件全國發放,人人都有,沒領的得抓緊辦了

      4月起必辦!2個證件全國發放,人人都有,沒領的得抓緊辦了

      吃貨的分享
      2026-04-12 04:03:50
      趙子琪回應《乘風2026》被淘汰:我一點都不難過,不會再來;此前孫怡隊長對決輸給闞清子,趙子琪墊底出局

      趙子琪回應《乘風2026》被淘汰:我一點都不難過,不會再來;此前孫怡隊長對決輸給闞清子,趙子琪墊底出局

      魯中晨報
      2026-04-11 09:36:09
      一碗國宴熱湯暖人心!鄭麗文直呼:這味道能講一輩子

      一碗國宴熱湯暖人心!鄭麗文直呼:這味道能講一輩子

      阿天愛旅行
      2026-04-11 13:08:53
      iPhone18ProMax最新曝光,手里的iPhone17ProMax更香了!

      iPhone18ProMax最新曝光,手里的iPhone17ProMax更香了!

      搞機小帝
      2026-04-12 00:17:00
      27歲單親媽媽開直播,播著播著睡著了,醒來一看后臺直接傻眼了

      27歲單親媽媽開直播,播著播著睡著了,醒來一看后臺直接傻眼了

      小椰的奶奶
      2026-04-01 17:04:55
      爆冷夜!近4場3敗,阿森納1-2伯恩茅斯主場翻車,多賽2場領先9分

      爆冷夜!近4場3敗,阿森納1-2伯恩茅斯主場翻車,多賽2場領先9分

      小金體壇大視野
      2026-04-12 08:14:52
      印度:我們每家都有電視,中國行嗎?法國:人家中國居民不用偷電

      印度:我們每家都有電視,中國行嗎?法國:人家中國居民不用偷電

      離離言幾許
      2026-04-10 14:51:25
      英媒爆料:兩大突發狀況出現,讓大陸放棄2027武統轉向和談

      英媒爆料:兩大突發狀況出現,讓大陸放棄2027武統轉向和談

      荷蘭豆愛健康
      2026-04-11 18:39:15
      隨著馬競1-2,巴塞羅那4-1,西甲最新積分榜出爐

      隨著馬競1-2,巴塞羅那4-1,西甲最新積分榜出爐

      凌空倒鉤
      2026-04-12 05:07:51
      同學聚會我自稱市委打雜被安排坐司機桌,開會我坐主席臺,他慌了

      同學聚會我自稱市委打雜被安排坐司機桌,開會我坐主席臺,他慌了

      刺頭體育
      2026-04-12 00:09:23
      馬斯克把網紅肚子搞大了!曝出炸裂猛料!

      馬斯克把網紅肚子搞大了!曝出炸裂猛料!

      廣告案例精選
      2026-04-11 20:46:27
      姐不僅圓又大,還是個肉墩,就在家自拍,不讓別人看

      姐不僅圓又大,還是個肉墩,就在家自拍,不讓別人看

      飛娛日記
      2026-03-19 07:26:09
      耗資68億!梅洪元院士出手!長沙奧體中心沖出地面,2028年見!

      耗資68億!梅洪元院士出手!長沙奧體中心沖出地面,2028年見!

      GA環球建筑
      2026-04-11 23:05:44
      炫喪?湖南一公路插百米白燈籠,官方介入調查,結果和想的不一樣

      炫喪?湖南一公路插百米白燈籠,官方介入調查,結果和想的不一樣

      阿纂看事
      2026-04-11 19:17:54
      2026-04-12 08:43:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      12729文章數 142623關注度
      往期回顧 全部

      科技要聞

      半夜被燃燒瓶砸醒,OpenAI CEO發文反思

      頭條要聞

      男子自帶茅臺就餐飲用時感覺不對味 服務員還"消失"了

      頭條要聞

      男子自帶茅臺就餐飲用時感覺不對味 服務員還"消失"了

      體育要聞

      換帥之后,他們從降級區沖到升級區

      娛樂要聞

      鄭鈞回應兒子走路:會監督他挺直腰板

      財經要聞

      從日本翻身看:這次誰能扛住高油價?

      汽車要聞

      煥新極氪007/007GT上市 限時19.39萬起

      態度原創

      健康
      數碼
      家居
      親子
      游戲

      干細胞抗衰4大誤區,90%的人都中招

      數碼要聞

      蘋果高配Mac全線告急,背后原因竟是它?

      家居要聞

      復古風格 自然簡約

      親子要聞

      人為什么會沒有3歲前的記憶呢?

      《永劫》女解說被批“穿著暴露” 官方解決方案來了

      無障礙瀏覽 進入關懷版