<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      南大騰訊聯合提出TimeLens,數據+算法全方位升級

      0
      分享至



      隨著多模態大模型(MLLMs)的飛速發展,模型已經能夠很好地理解視頻中 “發生了什么(What)”,卻無法精準地定位到事件在視頻中 “何時發生(When)”。這種視頻時序定位(Video Temporal Grounding, VTG)能力的嚴重缺陷,已成為制約 MLLM 邁向更精細化的視頻理解的主要瓶頸。

      長期以來,大量研究致力于設計復雜的模型結構,卻忽視了兩個關鍵問題:在數據層面,我們依賴的評測基準是否可靠?在算法層面,是否存在一套簡潔通用的最佳實踐?

      針對上述痛點,來自南京大學、騰訊 ARC Lab 和上海 AI Lab 的聯合研究團隊提出了TimeLens(時間透鏡),系統性地揭示了現有數據的“評測陷阱”,構建出更可靠的評測基準和高質量訓練數據,并探索出一套簡潔有效的算法優化。得益于這些貢獻,僅8B 參數的 TimeLens 模型成為了開源模型中的新 SOTA,更擊敗了 GPT-5 和 Gemini-2.5-Flash 等閉源巨頭。





      • 論文標題:TimeLens: Rethinking Video Temporal Grounding with Multimodal LLMs
      • 論文鏈接: https://arxiv.org/abs/2512.14698
      • 項目主頁: https://timelens-arc-lab.github.io/
      • 代碼鏈接: https://github.com/TencentARC/TimeLens

      核心洞察:撥開數據質量的迷霧

      在深度學習中,“Data is fuel”(數據即燃料)是公認的真理。然而,團隊發現,在 VTG 領域,燃料的質量卻令人擔憂。

      1. 現有基準的 “隱形陷阱”

      研究團隊通過一套標注流水線,對 Charades-STA、ActivityNet Captions 和 QVHighlights 等主流基準進行了嚴格的人工核驗,發現這些基準數據集中充斥著大量的標注錯誤。許多樣本中的文本描述模糊不清,或是文本描述的事件在視頻中根本未出現。標注方面,也存在大量的時間邊界標注錯誤,或是同一描述對應了視頻中的多個片段卻只標注了其中之一(漏標)。統計數據顯示,這些錯誤在現有基準中的比例極高。





      2. TimeLens-Bench:對評估結果的“撥亂反正”

      為了解決現有數據集中存在的嚴重錯誤,團隊構建了嚴格的標注準則,對上述三個基準數據集進行了全面的修復和重新標注,推出了TimeLens-Bench。這是一個經過嚴格交叉驗證的高質量評測基準,能夠更真實地反映模型的時序定位能力。

      將 TimeLens-Bench 和原始 Benchmark 上的評測結果進行對比,揭露了過往評估結果的不可靠—— 舊基準嚴重高估了開源模型的能力,而掩蓋了前沿閉源模型(如 Gemini)的真實水平。TimeLens-Bench 對這一錯誤進行了撥亂反正,事實上,現有開源模型仍明顯落后于閉源模型。



      3. 高質量訓練數據:TimeLens-100K

      針對同樣低質量的訓練數據,團隊設計了一套自動化流水線,對訓練數據進行了大規模的清洗和重標,發布了高質量的大型訓練數據集 TimeLens-100K。實驗證明,數據質量的提升能帶來顯著的性能增長。



      算法設計的“最佳實踐”

      在夯實數據基礎后,TimeLens 進一步對 MLLM 在 VTG 任務上的算法設計進行了全方位的消融實驗,從時間戳編碼到訓練范式,總結出一套簡潔有效的 “最佳實踐”。

      1. 簡潔有效的時間戳編碼

      時間戳編碼(timestamp encoding)是 VTG 任務中的關鍵模型結構設計,決定了模型能否準確地感知到輸入的每一視頻幀的采樣時間。

      團隊全面地對比了各種時間戳編碼方式的優劣。實驗結果表明,最優的時間戳編碼方式是簡單的交錯文本編碼(Interleaved Textual Encoding) 策略,即在每一幀的視覺 Token 前插入文本形式的時間戳 token。這種方法無需修改 LLM 的底層架構,保證了實現上的簡潔,同時還能取得最優的效果。





      2. 訓練范式:Thinking-free RLVR 的勝利

      隨著 DeepSeek-R1 等一系列工作的提出,帶有可驗證獎勵機制的強化學習(RLVR)范式在提升模型推理能力方面的作用備受關注。而在 VTG 領域,關于訓練范式的幾個關鍵問題尚無定論:

      • 有監督微調(SFT)仍是 VTG 領域最為主流的訓練范式,RLVR 范式在同樣的訓練開銷下,是否明顯優于 SFT?
      • 時序定位任務是一個以感知 (Perception) 而非推理 (Reasoning) 為主的任務。針對這樣的任務進行 RLVR 訓練時,顯式的思考過程(thinking)是否是必須的?
      • SFT+RLVR 的多階段訓練,是否比單階段訓練的效果更好?

      TimeLens 對比了多種訓練范式的優劣。結論出人意料且極具啟發性:單階段的 Thinking-free RLVR 訓練范式在計算效率和性能上均取得了最優。該范式直接讓模型輸出定位結果,并根據定位準確率(IoU)給予獎勵。這種方式不需要生成冗長的中間思考過程,訓練和推理效率高于 Thinking-based RLVR 范式和多階段訓練范式,且性能優于 SFT 范式。

      這一結果表明,對于時序定位這種偏向感知(Perception-heavy)的任務,顯式的思考過程不是必須的。 模型可以直接學習從任務輸入到輸出的映射,不需要進行復雜的邏輯推理。



      3. 關鍵訓練技巧:Early Stopping 與 Difficulty-based Sampling

      針對Thinking-free RLVR范式,團隊進行了更加深入的實驗探究,發現了兩個關鍵的訓練技巧。

      首先,與 SFT 中 “訓練越久越好” 的共識不同,在 RL 訓練中,當獎勵指標進入平臺期后,就應該采用早停策略(Early Stopping) 立即停止訓練,在該階段之后繼續訓練反而會使得模型的性能下降。

      其次,基于難度的數據采樣(Difficulty-based Sampling) 至關重要。即使數據的標注質量有保證,也并非所有的數據都適合用于 RLVR 訓練。需要預先使用待訓練的模型進行推理,評估每個訓練樣本的難度,采樣足夠具有挑戰性的樣本進行 RLVR 訓練,才能最大程度上提升模型的性能。



      實驗驗證:8B 模型逆襲閉源巨頭

      研究團隊將上述數據和算法層面的所有改進聚合在了一起,每一項技術都帶來了明顯的性能提升,最終得到了 TimeLens 系列模型。



      評測結果表明,TimeLens-8B 展現出了驚人的性能,不僅大幅超越了 Qwen3-VL 等開源模型成為新的開源 SOTA,更以 8B 的參數量,在多項核心指標上全面擊敗了 GPT-5 和 Gemini-2.5-Flash 等前沿的閉源模型。



      這一結果有力地證明了:在 VTG 任務中,通過系統性地提升數據質量并采用有效的算法設計,開源小尺寸模型完全具備挑戰甚至超越閉源大模型的能力。

      總結

      TimeLens 的貢獻不止于一個 SOTA 開源模型。團隊在數據和算法雙維度的系統性探索,為后續研究提供了極具參考價值的方法論與設計藍圖。

      目前,TimeLens 的代碼、模型、訓練數據和評測基準都已開源,希望能為未來的視頻時序定位研究提供一個更好的起點。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      離譜!上海高架上,網約車司機開著智駕睡大覺,享道出行回應

      離譜!上海高架上,網約車司機開著智駕睡大覺,享道出行回應

      新民晚報
      2026-01-06 14:47:22
      馬杜羅即將出庭,或被終身監禁,案件也可能無限拖延,專家:現行國際法無法推翻美國判決

      馬杜羅即將出庭,或被終身監禁,案件也可能無限拖延,專家:現行國際法無法推翻美國判決

      極目新聞
      2026-01-05 21:06:11
      年薪50萬帶公司牛奶回家被妻子指責:知情人曝內情,果然有情況

      年薪50萬帶公司牛奶回家被妻子指責:知情人曝內情,果然有情況

      靜若梨花
      2026-01-04 17:12:41
      北海艦隊四艘055同框,一圖就能吊打世界99%的國家海軍

      北海艦隊四艘055同框,一圖就能吊打世界99%的國家海軍

      愛吃醋的貓咪
      2026-01-05 21:32:32
      蔣超良、金湘軍、藍天立、劉慧、易會滿等,被點名

      蔣超良、金湘軍、藍天立、劉慧、易會滿等,被點名

      新京報
      2026-01-06 18:44:29
      你知道的有錢人的生活是啥樣?網友:有些人一出生就在羅馬

      你知道的有錢人的生活是啥樣?網友:有些人一出生就在羅馬

      帶你感受人間冷暖
      2026-01-03 00:05:14
      馬杜羅貼身衛隊并非全是擺設:古巴保鏢戰斗至死,盡忠職守

      馬杜羅貼身衛隊并非全是擺設:古巴保鏢戰斗至死,盡忠職守

      黃娜老師
      2026-01-06 09:27:50
      7年燒掉35億,營收僅4500萬,“中國版SpaceX”帶病闖關?

      7年燒掉35億,營收僅4500萬,“中國版SpaceX”帶病闖關?

      功夫財經
      2026-01-06 08:28:25
      折磨人的生理反應有哪些?網友:排卵期就想穿性感一點

      折磨人的生理反應有哪些?網友:排卵期就想穿性感一點

      帶你感受人間冷暖
      2026-01-04 00:10:07
      白酒立大功!醫生研究發現:高血壓喝白酒時,或有5種好處!

      白酒立大功!醫生研究發現:高血壓喝白酒時,或有5種好處!

      周哥一影視
      2026-01-06 08:19:35
      90年,鄧小平參觀亞運村詢問張百發和伍紹祖:為什么不放手辦奧運

      90年,鄧小平參觀亞運村詢問張百發和伍紹祖:為什么不放手辦奧運

      輿圖看世界
      2026-01-06 14:10:03
      他強硬回擊:將拿起武器

      他強硬回擊:將拿起武器

      觀察者網
      2026-01-06 13:23:05
      心臟裝了6個支架的王石日本看病實錄,值得深思

      心臟裝了6個支架的王石日本看病實錄,值得深思

      深度報
      2026-01-01 23:17:29
      卡德羅夫:若接到命令,我抓澤連斯基會比美國抓馬杜羅更快

      卡德羅夫:若接到命令,我抓澤連斯基會比美國抓馬杜羅更快

      桂系007
      2026-01-06 02:38:32
      6號收評:滬指刷新階段高點!所有人都注意,大盤后市或將這樣走

      6號收評:滬指刷新階段高點!所有人都注意,大盤后市或將這樣走

      春江財富
      2026-01-06 15:20:06
      醫學生真得很硬核,竟然有人因業務不精扎醒植物人!

      醫學生真得很硬核,竟然有人因業務不精扎醒植物人!

      另子維愛讀史
      2025-12-26 23:32:52
      大愛中國!56歲世界級名帥重返中超:曾培養出4名頂級巨星!

      大愛中國!56歲世界級名帥重返中超:曾培養出4名頂級巨星!

      邱澤云
      2026-01-06 13:34:10
      我國將在南海建設最大的軍事基地

      我國將在南海建設最大的軍事基地

      孤城落葉
      2025-12-29 01:01:15
      交易將至,Shams:特雷-楊團隊正在和老鷹商討交易事宜

      交易將至,Shams:特雷-楊團隊正在和老鷹商討交易事宜

      懂球帝
      2026-01-06 07:43:06
      每一口都可能促癌!哈佛大學最新:這些食品正在改變你的血液,癌癥風險恐增71%

      每一口都可能促癌!哈佛大學最新:這些食品正在改變你的血液,癌癥風險恐增71%

      醫諾維
      2026-01-06 17:00:55
      2026-01-06 21:16:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      12066文章數 142530關注度
      往期回顧 全部

      科技要聞

      速看!黃仁勛萬字實錄:甩出"物理AI"王牌

      頭條要聞

      媒體:遭美襲擊后第三天 委局勢進入關鍵階段

      頭條要聞

      媒體:遭美襲擊后第三天 委局勢進入關鍵階段

      體育要聞

      從NBA最菜首發控衛,到NBA最強喬治

      娛樂要聞

      2026年央視春晚彩排照曝光!

      財經要聞

      丁一凡:中美進入相對穩定的競爭共存期

      汽車要聞

      摩登出街潮品 實拍奇瑞QQ冰淇淋女王版

      態度原創

      家居
      親子
      健康
      時尚
      數碼

      家居要聞

      引光之宅 地下室也有生機

      親子要聞

      看了上海張柏芝的家,無數寶媽酸了:這才是拼三胎的基本條件!

      這些新療法,讓化療不再那么痛苦

      推廣|| 她們新年狀態大開掛?原來悄悄做了這筆“美麗投資”

      數碼要聞

      惠普HyperX CES 2026推出四款鍵盤,霍爾磁性、機械、薄膜軸體

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲熟妇无码另类久久久| 日日撸日日干| 欧性猛交ⅹxxx乱大交| 黑人大战欲求不满人妻| 级r片内射在线视频播放| 97人妻精品一区二区三区| 国产成人无码一二三区视频| 亚洲国产综合专区在线播放| 国产精品亚洲аv无码播放| 秋霞无码久久久精品| 中文字幕一区二区三区在线不卡| 国产成人精品永久免费视频| 中文无码高潮到痉挛在线视频 | 中文字幕无码成人片| 国产亚洲日韩在线播放更多| 无码偷拍| 国产欧美一区二区三区在线| 午夜精品福利影院| 天天摸天天做天天爽水多| 欧美高清国产| 日本不卡一区二区高清中文| 亚洲伊人影院| 亚洲精品国产成人AV流浆| 丰满熟女人妻中出系列| 9孩岁女精品╳片| 国产精品极品美女自在线观看免费| 新狼窝色av性久久久久久| 国产熟女91熟女| 人妻少妇精品无码专区二区| 亚洲综合天堂一区二区三区| 亚洲午夜福利| 97欧美精品系列一区二区| 亚洲成av人片在线播放无码| 精品国产欧美一区二区三区在线 | 色一情一乱一伦视频| 中文字幕视频在线看| 野花国产精品入口| 少妇下蹲露大唇无遮挡| 韩国无码一区二区三区精品| 久久被窝| 制服丝袜国产日韩酒店大堂经理|