<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      DualCamCtrl:給視頻生成裝上「深度相機」,讓運鏡更「聽話」

      0
      分享至



      本研究的共同第一作者是來自于香港科技大學(廣州)EnVision Research 的張鴻飛(研究助理)和陳康豪(博士研究生),兩位研究者均師從陳穎聰教授。

      你的生成模型真的「懂幾何」嗎?還是只是在假裝對齊相機軌跡?

      當前眾多視頻生成模型雖宣稱具備「相機運動控制」能力,但其控制信號通常僅依賴于相機位姿。雖近期工作通過逐像素射線方向(Ray Condition)編碼了運動信息,但由于模型仍需隱式推斷三維結構,本質上仍缺乏對場景的顯式幾何理解。這一局限性導致了相機運動的不一致——模型受限于外觀與結構兩種表征信息的耦合,無法充分捕捉場景的底層幾何特征。

      鑒于上述挑戰,來自香港科技大學、復旦大學等機構的研究團隊提出了一種全新的端到端幾何感知擴散模型框架 DualCamCtrl。該研究針對現有方法在場景理解與幾何感知方面的不足,創新性地設計了一個「雙分支擴散架構」,能夠同步生成與鏡頭運動一致的 RGB 與深度序列。進一步地,為實現 RGB 與深度兩種模態的高效協同,DualCamCtrl 提出了語義引導互對齊機制(Semantic Guided Mutual Alignment),該機制以語義信息為指導,在雙向的交互中實現了更好的模態融合。

      這些設計使 DualCamCtrl 能夠更好地解耦外觀與幾何建模,從而生成更嚴格遵循指定相機軌跡的視頻。大量實驗表明,DualCamCtrl 在相機運動一致性方面顯著優于現有方法,相機運動誤差降低超過40%



      • 論文標題:DualCamCtrl: Dual-Branch Diffusion Model for Geometry-Aware Camera-Controlled Video Generation
      • 項目主頁:https://soyouthinkyoucantell.github.io/dualcamctrl-page/
      • 論文鏈接:https://www.arxiv.org/abs/2511.23127
      • Github 倉庫:https://github.com/EnVision-Research/DualCamCtrl
      • Huggingface 模型:https://huggingface.co/FayeHongfeiZhang/DualCamCtrl



      雙分支幾何感知擴散模型



      總體而言,DualCamCtrl 巧妙地采用了雙分支視頻擴散框架(Dual Branch Video Diffusion Framework),其中一條分支負責生成 RGB 表示,另一條分支負責生成深度表示,兩種模態通過提出的SIGMA機制進行融合。

      該設計使得模型能夠從單張輸入圖像及其對應深度圖中,同步推斷出視頻級別的 RGB 與深度隱空間表征(Latent Representation),不僅最大限度降低了模態間的相互干擾,更使深度信息得以貫穿整個視頻生成過程,實現連貫的幾何引導。

      SIGMA 機制以及雙階段訓練

      在多模態可控視頻生成任務中,訓練與融合策略是關鍵。DualCamCtrl 的核心設計正是基于這一認識,包含兩部分:一是提出語義引導互對齊(SIGMA)融合機制,促進 RGB 與深度模態在生成過程中的有效協同;二是采用分階段訓練策略——首階段學習解耦的多模態表征,次階段專注跨模態融合建模。

      該設計使模型在復雜相機運動下,能同時保持外觀連貫與三維幾何準確,實現幾何感知的可控生成。

      語義引導互對齊機制



      圖3. SIGMA融合策略的動機與優勢對比示意圖。

      基于雙分支框架,RGB 分支與深度分支分別生成對應的視頻序列和對應深度序列。盡管兩者輸入相同,但它們獨立演化易導致輸出不一致,因此需要有效的融合與對齊策略(圖 3.a)。

      然而該團隊發現:單向對齊(One-Way Alignment)易損失語義一致性,幾何引導對齊(Geometry-Guided Alignment)則過度強調幾何表征而破壞了運動的一致性。為此,該團隊提出了語義引導互對齊機制(SIGMA)

      SIGMA 采用語義引導的雙向設計:淺層以 RGB 特征錨定語義結構,深層則引入深度反饋優化幾何表達。該方法基于兩個 key insights(圖 3.b、3.c):

      • 語義優先的重要性:外觀特征應在早期占主導地位以保持語義的穩定,而深度信號作為后期補充來優化幾何結構。
      • 雙向交互的重要性:兩分支相互反饋可避免單向對齊的失衡,實現更穩定的隱空間表征對齊。

      分階段訓練策略

      為實現 RGB 與深度模態穩健生成與有效協同的目標,DualCamCtrl 采用分階段訓練策略(Two-stage training),為每個階段的學習設置不同側重點:

      • 解耦訓練階段(Decoupled Stage):核心目標是使 RGB 與深度分支分別專注學習外觀與幾何表征。為此,模型使用共享預訓練權重初始化,并利用 state-of-the-art (SOTA) 視頻深度估計模型Video Depth Anything生成的深度特征進行監督。此階段禁止模態間交互,確保表征演化的獨立性。
      • 融合訓練階段(Fusion Stage):在兩個分支具備基礎能力后,核心目標轉向實現外觀與幾何信息的互補增強。為此,模型引入零初始化的融合模塊,逐步建立跨模態交互,并通過聯合優化 RGB 與深度目標函數,實現多模態表征的對齊與協同。



      圖2:兩階段訓練的效果:單階段模型因無法充分收斂(上圖),導致其相機軌跡對齊效果欠佳(下圖)。這凸顯了先解耦學習外觀與幾何表征的兩階段策略的有效性。

      實驗結果

      在定量和定性比較中,DualCamCtrl 在各項指標上均顯著優于當前的 SOTA 方法。

      定性分析:



      在相同輸入條件下,DualCamCtrl 在相機運動的對齊效果和視頻生成的視覺效果上均顯著優于現有先進方法。圖中“+”標記為視覺對比的定位參考點。

      定量分析:



      Image to Video 定量分析結果



      Text to Video 定量分析結果

      總結

      DualCamCtrl 提出了一種集成深度信息的雙分支視頻擴散模型,實現了更精準的相機控制視頻生成。通過引入語義引導互對齊機制(SIGMA)與兩階段訓練策略,該模型有效同步了 RGB 序列與深度序列的生成和融合,顯著增強了模型的幾何感知能力。實驗表明,該方法在相機一致性誤差上比先前方法降低超過 40%,為相機控制視頻生成提供了新的技術思路,并有望推動其他可控視頻生成任務的發展。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      G7變天?日本咬死了不讓中國來,北約也發話了,馬克龍壓根不聽勸

      G7變天?日本咬死了不讓中國來,北約也發話了,馬克龍壓根不聽勸

      愛下廚的阿釃
      2025-12-22 13:51:08
      鹽城一法院原庭長涉嫌嚴重違紀違法被查!

      鹽城一法院原庭長涉嫌嚴重違紀違法被查!

      鹽城市民網
      2025-12-22 11:41:20
      泰國牽頭組建反詐新聯盟,中國未加入引網友熱議

      泰國牽頭組建反詐新聯盟,中國未加入引網友熱議

      老馬拉車莫少裝
      2025-12-22 18:18:42
      1979年,楊顯東參觀完大寨后怒批陳永貴:他騙全國人民,騙黨中央

      1979年,楊顯東參觀完大寨后怒批陳永貴:他騙全國人民,騙黨中央

      帝哥說史
      2025-12-19 06:25:03
      官宣:海港助教出任主帥

      官宣:海港助教出任主帥

      五星體育
      2025-12-22 21:41:45
      快扔掉!戴一天,輻射量相當于拍117次胸片

      快扔掉!戴一天,輻射量相當于拍117次胸片

      FM93浙江交通之聲
      2025-10-28 00:01:43
      南博事件升級!66年前感謝信流出,“我們一定好好保存這批古畫”

      南博事件升級!66年前感謝信流出,“我們一定好好保存這批古畫”

      火山詩話
      2025-12-21 18:27:02
      沒想到竟然這么多工作需要保密的!網友:不讓看非看被一槍斃了

      沒想到竟然這么多工作需要保密的!網友:不讓看非看被一槍斃了

      另子維愛讀史
      2025-12-08 20:58:22
      據說全球僅20例!巴西一女子在同一晚與2名男子發生了關系

      據說全球僅20例!巴西一女子在同一晚與2名男子發生了關系

      忠于法紀
      2025-12-04 11:25:07
      離婚12年前妻早已二嫁,曾和體操冠軍傳緋聞的普京,今有了新戀情

      離婚12年前妻早已二嫁,曾和體操冠軍傳緋聞的普京,今有了新戀情

      攬星河的筆記
      2025-12-21 17:12:00
      哈佛大學研究發現:長期太累或太窮,人會變傻

      哈佛大學研究發現:長期太累或太窮,人會變傻

      深度報
      2025-12-20 20:58:49
      突發!俄羅斯遭遇沉重打擊

      突發!俄羅斯遭遇沉重打擊

      楊興文
      2025-12-22 18:53:32
      李小璐寫真生圖高清

      李小璐寫真生圖高清

      翩翩明星
      2025-11-14 09:39:36
      巴薩比上賽季同期多8分,若贏西人將創近10年第3好半程成績

      巴薩比上賽季同期多8分,若贏西人將創近10年第3好半程成績

      懂球帝
      2025-12-22 23:20:06
      銀行人勸告:家里有老人存款的,務必加上第二存款人!越早越安心

      銀行人勸告:家里有老人存款的,務必加上第二存款人!越早越安心

      小白鴿財經
      2025-12-17 07:05:02
      事實證明,劉少奇在黨內地位快速提升是有原因的

      事實證明,劉少奇在黨內地位快速提升是有原因的

      尚書喬
      2025-02-21 00:04:05
      連續7個一字漲停板!股民:根本就沒人賣!

      連續7個一字漲停板!股民:根本就沒人賣!

      數據挖掘分析
      2025-12-22 15:18:20
      71歲奶奶獲健美比賽冠軍:被兒媳夸偶像,只要身體允許我練,會一直堅持下去

      71歲奶奶獲健美比賽冠軍:被兒媳夸偶像,只要身體允許我練,會一直堅持下去

      環球網資訊
      2025-12-22 14:52:54
      CBA裁判報告:吹楊鳴2次技犯正確,6次罰球不正確 第四節可糾正

      CBA裁判報告:吹楊鳴2次技犯正確,6次罰球不正確 第四節可糾正

      體育哲人
      2025-12-22 21:45:37
      伊森:比賽輸球完全是我的錯,我不該最后時刻去協防

      伊森:比賽輸球完全是我的錯,我不該最后時刻去協防

      懂球帝
      2025-12-22 15:42:17
      2025-12-23 00:11:02
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      11971文章數 142516關注度
      往期回顧 全部

      科技要聞

      商湯聯創親自下場 痛批主流機器人技術大錯

      頭條要聞

      德鐵下單200輛中國巴士 德財長:這決定讓我十分惱火

      頭條要聞

      德鐵下單200輛中國巴士 德財長:這決定讓我十分惱火

      體育要聞

      戴琳,中國足球的反向代言人

      娛樂要聞

      張柏芝不再隱瞞,三胎生父早有答案?

      財經要聞

      央行信用新政:為失信者提供"糾錯"通道

      汽車要聞

      可享88元抵2000元等多重權益 昊鉑A800開啟盲訂

      態度原創

      游戲
      親子
      時尚
      藝術
      房產

      德瑪西亞杯:Viper完美首秀,BLG零封LNG

      親子要聞

      9歲女孩苦練高難度戲曲蹺功絕技

      珍珠配美人,最老派也最高級的時髦

      藝術要聞

      萬年松樹開花,震驚你的雙眼!

      房產要聞

      重磅!海南發布島內居民免稅商品經營主體及免稅店管理辦法征求意見稿!

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 熟女亚州综合| 成人做爰A片免费看网站找不到了| 色一情一乱一伦一区二区三欧美 | 超碰狠狠干| 五月天丁香婷婷亚洲欧洲国产| 亚洲AV无码久久精品色欲| 中国A片乱子伦| 一 级做人爱全视频在线看| 亚洲人成伊人成综合网小说| 九九精品在线看| 亚洲精品成人无码AV在线| 在线aⅴ亚洲中文字幕| 久久精品人成免费| 亚洲无码| 星子县| 色一情一乱一乱一区99av白浆| 欧美精品高清在线观看| 人妻?日韩?欧美?综合?制服 | 国产乱色国产精品播放视频| 固安县| 影音先锋成人资源| 中文日韩欧美| 性色欲情网站| AV色播| 小婕子伦流澡到高潮h| 色噜噜AV亚洲色一区二区| 久久99日韩国产精品久久99| 97久久天天综合色天天综合色hd | 越南毛茸茸的少妇| 国产av激情无码久久| 一区二区三区91国产| 久久99久久99精品免观看吃奶网| 亚洲天堂手机在线| 女人高潮被爽到呻吟在线观看| 色噜噜av亚洲色一区二区| 好紧好爽午夜视频| 欧美A√| 亚洲午夜伦费影视在线观看| 亚洲精品色午夜无码专区日韩| 国产99久60在线视频 | 传媒| 亚洲人人人|