<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      豐田研究院NeuralRemaster:AI重繪實現完美結構對稱

      0
      分享至


      這項由豐田研究院的余增、Charles Ochoa等研究人員,聯合德克薩斯大學奧斯汀分校的周明遠以及約翰霍普金斯大學的Vishal M. Patel共同完成的突破性研究,于2025年12月發表在計算機視覺領域的頂級會議上,論文編號為arXiv:2512.05106v1。這項名為"NeuralRemaster"的技術就像給圖像做了一次神奇的"換裝手術"——既能讓畫面變得更加逼真漂亮,又能完美保持原有的空間結構不發生任何變形。

      想象你有一張游戲截圖,畫面中有建筑物、道路和汽車,但看起來有些假。傳統的AI圖像生成技術就像一個粗心的畫家,雖然能把圖片重新畫得更漂亮,但經常會把建筑物畫歪、道路畫彎,甚至讓汽車變形。而NeuralReaster就像一個既有藝術天賦又極其細心的畫師,不僅能讓圖片變得更加真實,還能確保每一個物體都保持在原來的精確位置上,就連最細微的幾何關系都不會改變。

      這項研究的核心突破在于提出了"相位保持擴散"技術。在信號處理的世界里,任何圖像都可以分解為兩個部分:相位(決定結構布局)和幅度(決定紋理外觀)。傳統的擴散模型就像一個魯莽的裝修工人,既砸掉了房子的結構框架,又撕掉了墻紙裝飾,然后試圖從零開始重建一切。而相位保持擴散技術則更像一個聰明的室內設計師,只替換墻紙和裝飾,但絕不動房子的承重墻和基本結構。

      研究團隊還開發了"頻率選擇結構化噪聲"技術,這就像給設計師提供了一個精確的控制旋鈕。當你把旋鈕調到最保守的位置時,AI只會做最細微的美化調整,幾乎完全保持原圖結構。當你把旋鈕調到更激進的位置時,AI就有更多創作自由度,可以進行更大幅度的視覺改進。這種靈活控制讓用戶可以根據具體需求,在結構保持和視覺改進之間找到最佳平衡點。

      更令人興奮的是,這項技術不需要修改任何現有的AI模型架構,也不會增加額外的計算開銷。它就像一個通用的"插件",可以直接安裝到現有的各種圖像生成模型上,包括處理靜態圖片的模型和處理動態視頻的模型。無論是DDPM還是Flow Matching這些不同類型的技術框架,都能無縫集成這項創新。

      在實際應用測試中,研究團隊驗證了三個重要場景的效果。首先是照片級真實感重渲染,就是把游戲畫面變成照片級別的真實場景。其次是風格化重渲染,比如把普通照片變成素描風格或油畫風格。最后是仿真增強,特別是在自動駕駛領域的應用。

      最引人注目的成果體現在自動駕駛測試中。研究團隊使用CARLA仿真器生成的駕駛場景,通過NeuralRemaster技術將其轉換為更真實的駕駛環境。結果顯示,使用這種增強后的訓練數據訓練出來的自動駕駛規劃系統,在真實世界的Waymo數據集上測試時,性能提升了驚人的50%。這意味著AI司機在從虛擬世界轉移到真實世界駕駛時,表現要好得多,大大縮小了仿真與現實之間的差距。

      技術實現層面,相位保持擴散的工作原理相當巧妙。傳統方法使用高斯噪聲破壞圖像,這種噪聲的頻域表示具有隨機的幅度和隨機的相位,相當于既破壞了圖像的紋理信息,又破壞了結構信息。相位保持擴散則構造了一種特殊的"結構化噪聲",這種噪聲保持輸入圖像的相位不變,只隨機化幅度部分。

      具體來說,給定一張輸入圖像,系統首先計算其傅里葉變換,得到幅度和相位信息。然后保留原始圖像的相位,但用隨機生成的幅度替換原始幅度,最后通過逆傅里葉變換得到結構化噪聲。這個過程就像保留了建筑物的精確平面圖,但重新選擇了建筑材料和裝飾風格。

      頻率選擇結構化噪聲進一步擴展了這個概念。通過引入一個頻率截止參數,系統可以選擇性地保留不同頻率范圍內的相位信息。低頻信息主要控制圖像的整體布局和大尺度結構,高頻信息則控制細節紋理。通過調節截止頻率,用戶可以精確控制希望保持多少結構信息。

      在訓練過程中,系統使用這種結構化噪聲替代傳統的高斯噪聲,但保持所有其他訓練參數和損失函數不變。這種設計確保了技術的通用性和易用性,任何現有的擴散模型都可以直接采用這種改進,無需重新設計網絡架構或調整訓練策略。

      實驗評估采用了多個維度的衡量標準。對于視覺質量,研究團隊定義了"外觀分數",通過比較重渲染結果與正面提示詞(如"照片、相機拍攝、圖片、照片級真實")和負面提示詞(如"游戲、渲染、卡通、虛幻")的相似度來量化真實感提升程度。對于結構對齊,他們使用深度圖的結構相似性指數和絕對相對誤差來衡量幾何保持的精確程度。

      在照片級真實感重渲染實驗中,NeuralRemaster在UnrealCV數據集上的表現顯著超越了現有方法。該數據集包含5000張涵蓋室內外各種場景的圖像,從城市街景到自然風光,從室內房間到戶外廣場。與ControlNet-Tile、SDEdit等現有技術相比,NeuralRemaster不僅在視覺真實感方面取得了最高分數,在結構保持方面也表現最佳。

      風格化重渲染實驗驗證了技術在藝術風格轉換方面的能力。使用ImageNetR數據集的29張圖像,研究團隊測試了將普通照片轉換為各種藝術風格的效果。結果顯示,NeuralRemaster能夠在實現強烈風格轉換的同時,最大程度地保持原始圖像的空間結構和物體邊界。

      最具實用價值的驗證來自仿真增強實驗。研究團隊收集了5.5小時的CARLA駕駛仿真視頻,使用NeuralRemaster將其轉換為更真實的駕駛場景。然后分別使用原始仿真數據、其他增強方法處理的數據以及NeuralRemaster增強的數據訓練端到端駕駛規劃器。在Waymo開放數據集的驗證中,使用NeuralRemaster增強數據訓練的規劃器在零樣本遷移設置下,平均位移誤差和最終位移誤差都大幅降低,性能提升達到50%。

      這項技術的視頻擴展同樣令人印象深刻。通過對視頻的每一幀逐一應用相位保持擴散,系統能夠生成時間連貫的視頻序列。研究團隊發現,最佳策略是先對第一幀應用圖像級別的相位保持擴散,然后使用第一幀條件化的視頻相位保持擴散生成后續幀。這種方法確保了整個視頻序列在空間和時間維度上的一致性。

      技術實現的另一個亮點是其極高的效率。相位保持擴散不會增加任何推理時間開銷,也不需要額外的模型參數。整個過程只是在噪聲構造階段進行了巧妙的修改,而采樣過程保持完全不變。這使得該技術可以無縫集成到現有的產品流程中,無需擔心計算成本或部署復雜度的增加。

      研究團隊在三個代表性的擴散模型上驗證了技術的通用性:SD 1.5(圖像DDPM)、FLUX-dev(圖像流匹配)和Wan2.2-14B(視頻流匹配)。無論是完全微調還是LoRA微調,NeuralRemaster都能取得出色的效果。特別值得注意的是,對Wan2.2-14B這樣的大型視頻模型進行LoRA微調只需要單個GPU,進一步證明了技術的輕量級特性。

      消融實驗深入探索了各個技術組件的貢獻。研究發現,訓練時的最小截止半徑r0和推理時的截止半徑r都對最終效果有重要影響。較大的推理時半徑能夠提供更好的結構對齊,但可能會限制視覺改進的幅度。較小的半徑則允許更大的視覺變化,但結構保持能力會相應下降。通過調節這兩個參數,用戶可以根據具體應用場景的需求來平衡結構保持和視覺改進之間的權衡。

      在實際應用場景中,這項技術展現出了巨大的潛力。對于游戲行業,它可以將游戲畫面實時轉換為電影級別的視覺效果,而不會影響游戲機制或物理引擎。對于建筑設計,它能將簡單的3D模型渲染轉換為照片級別的建筑效果圖,同時保持精確的幾何尺寸。對于電影制作,它可以將便宜的虛擬場景轉換為昂貴的實景效果,大大降低制作成本。

      自動駕駛領域的應用前景尤其引人矚目。目前的自動駕駛系統嚴重依賴仿真數據進行訓練和測試,但仿真與現實之間的視覺差異一直是一個重大挑戰。NeuralRemaster技術為解決這個"仿真到現實"的差距問題提供了一條有效路徑。通過將仿真場景轉換為更真實的視覺效果,同時保持精確的幾何和物理關系,AI駕駛系統可以在更接近真實環境的數據上進行訓練,從而顯著提升在真實道路上的表現。

      技術的局限性也值得注意。當前版本主要針對圖像類型的輸入設計,對于深度圖或表面法向量等其他模態可能需要輕量級的預處理步驟來生成初始圖像表示。此外,雖然頻率選擇機制提供了結構剛性的連續控制,但在某些極端情況下,完全保持結構可能會限制創意表達的空間。

      未來發展方向包括將該技術擴展到更多應用領域,如圖像去模糊、重新照明、超分辨率和通用圖像修復。研究團隊指出,相位保持擴散與現有的條件控制或適配器方法是正交的,可以進行組合使用以實現更精細的控制效果。這種可組合性為構建更強大、更靈活的圖像生成系統開辟了新的可能性。

      從技術演進的角度來看,這項研究代表了生成式AI從"重新創造"向"智能增強"的重要轉變。傳統的圖像生成往往試圖從頭創建全新的內容,而相位保持擴散則專注于在保持核心結構的基礎上進行智能優化。這種思路更符合許多實際應用場景的需求,特別是那些既需要視覺改進又不能容忍幾何偏差的專業領域。

      實驗數據的詳細分析揭示了一些有趣的發現。在UnrealCV數據集上的測試表明,相位保持擴散在不同場景類型下都能保持穩定的性能,無論是室內場景還是戶外環境,無論是簡單幾何體還是復雜建筑群。在ImageNetR的風格化測試中,該技術展現了在藝術風格轉換和幾何保持之間取得平衡的能力,這對于數字藝術創作和內容生產具有重要意義。

      CARLA仿真增強實驗的成功不僅驗證了技術的有效性,也為自動駕駛行業提供了一個實用的工具。在現實世界的駕駛場景中,道路邊界、車輛形狀和空間布局的精確性至關重要,任何幾何偏差都可能導致嚴重的安全問題。NeuralRemaster能夠在提升視覺真實感的同時保持這些關鍵信息的準確性,為構建更可靠的自動駕駛系統提供了強有力的支持。

      這項研究的方法論貢獻也值得深入思考。通過重新審視擴散過程中噪聲的構造方式,研究團隊展示了有時候最有效的創新可能來自對基礎假設的重新思考,而非復雜新架構的引入。相位保持擴散的成功證明了"簡單但有針對性的改進"往往比"復雜但通用的解決方案"更有效。

      展望未來,這項技術有潛力成為下一代AI內容創作工具的核心組件。隨著虛擬現實、增強現實和數字孿生技術的快速發展,對既能提供高視覺質量又能保持精確幾何關系的圖像處理技術的需求將會越來越大。NeuralRemaster為滿足這種需求提供了一個優雅而實用的解決方案。

      說到底,這項研究解決的是一個看似簡單但實則復雜的問題:如何讓AI既能當一個優秀的藝術家,又能當一個精確的工程師。通過巧妙地分離和處理圖像的結構信息和外觀信息,NeuralRemaster成功實現了這種看似矛盾的雙重要求。對于普通用戶而言,這意味著未來我們可能會看到更多既美觀又準確的AI生成內容,無論是游戲畫面、電影特效還是專業設計圖紙。對于技術開發者而言,這項研究提供了一個新的思路:有時候最好的創新不是添加更多功能,而是更聰明地使用現有資源。隨著這項技術的進一步發展和應用,我們有理由期待一個視覺AI既強大又可靠的未來。

      Q&A

      Q1:相位保持擴散技術的核心原理是什么?

      A:相位保持擴散技術的核心是巧妙地分離圖像的結構信息和外觀信息。它保留輸入圖像的相位(控制空間結構布局),只隨機化幅度部分(控制紋理外觀),就像保留建筑平面圖但更換裝修材料一樣,確保AI重繪后的圖像在變美的同時保持完美的幾何對齊。

      Q2:NeuralRemaster在自動駕駛測試中取得了什么效果?

      A:在CARLA到Waymo的自動駕駛測試中,使用NeuralRemaster增強訓練數據的駕駛規劃系統性能提升了50%。這意味著AI司機從虛擬仿真環境轉移到真實道路時表現更好,大大縮小了仿真與現實之間的差距,為自動駕駛技術發展提供了重要突破。

      Q3:這項技術相比現有圖像生成方法有什么優勢?

      A:NeuralRemaster的最大優勢是無需修改任何現有AI模型架構,不增加計算開銷,就像通用插件一樣可以直接安裝到各種圖像生成模型上。同時通過頻率選擇機制提供精確控制,用戶可以自由調節結構保持和視覺改進之間的平衡,適應不同應用場景需求。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      WOC!楊瀚森排在NBA聯盟第3...

      WOC!楊瀚森排在NBA聯盟第3...

      左右為籃
      2025-12-12 12:29:32
      “新冠疫苗之父”落馬,榮譽清零!打過三針的網友慌了

      “新冠疫苗之父”落馬,榮譽清零!打過三針的網友慌了

      胡嚴亂語
      2025-12-07 15:51:07
      苦等5年,蒙古熟鴨子還是飛了,中俄誰也不讓步,坐視大項目泡湯

      苦等5年,蒙古熟鴨子還是飛了,中俄誰也不讓步,坐視大項目泡湯

      科普100克克
      2025-12-07 18:20:34
      華人在國內的錢,想匯出來難了!

      華人在國內的錢,想匯出來難了!

      以希臘之名
      2025-12-09 18:10:47
      因中國游客減少,日本一溫泉12月損失超1800萬,現已停業

      因中國游客減少,日本一溫泉12月損失超1800萬,現已停業

      隨波蕩漾的漂流瓶
      2025-12-12 18:30:08
      解放軍進入臺海,美航母早已跑路,統一已成定局,鄭麗文開始追責

      解放軍進入臺海,美航母早已跑路,統一已成定局,鄭麗文開始追責

      朝子亥
      2025-12-12 12:00:03
      特朗普和克林頓等在列!美國民主黨陸續公開愛潑斯坦的相關照片!

      特朗普和克林頓等在列!美國民主黨陸續公開愛潑斯坦的相關照片!

      AI商業論
      2025-12-13 10:35:59
      被冤枉6年!36歲貝爾再談皇馬爭議事件:我被媒體抹黑了

      被冤枉6年!36歲貝爾再談皇馬爭議事件:我被媒體抹黑了

      葉青足球世界
      2025-12-10 21:18:51
      太炸裂了!印度首富小兒媳和大兒子被曝驚天丑聞,倆人牽手摸腰很自然

      太炸裂了!印度首富小兒媳和大兒子被曝驚天丑聞,倆人牽手摸腰很自然

      小魚愛魚樂
      2025-12-12 08:39:41
      “只要給錢什么都行”,43歲保姆的話,讓62歲的我破防了

      “只要給錢什么都行”,43歲保姆的話,讓62歲的我破防了

      新時代的兩性情感
      2025-12-03 12:59:07
      柬埔寨是世界最貧窮的國家之一,但統治該國的洪森家族卻富可敵國

      柬埔寨是世界最貧窮的國家之一,但統治該國的洪森家族卻富可敵國

      大道無形我有型
      2025-09-05 11:31:52
      WTT總決賽:孫穎莎轟11-1零封日乒黑馬,國乒包攬女單4強太強了

      WTT總決賽:孫穎莎轟11-1零封日乒黑馬,國乒包攬女單4強太強了

      寒律
      2025-12-13 10:53:35
      香港總決賽混雙四強!莎頭回應被打1-11,日本組合險勝雨果兩口子!

      香港總決賽混雙四強!莎頭回應被打1-11,日本組合險勝雨果兩口子!

      好乒乓
      2025-12-13 11:27:55
      放棄中國國籍投靠日本,結果日本不收中國不要,成為夾縫中的黑戶

      放棄中國國籍投靠日本,結果日本不收中國不要,成為夾縫中的黑戶

      牛牛叨史
      2025-12-13 02:23:07
      中國申請CPTPP4年還在門外?這3座大山比想象中更難爬

      中國申請CPTPP4年還在門外?這3座大山比想象中更難爬

      明月光
      2025-12-11 22:04:44
      被拐30年兒子認親14小時就走,全程冷臉,網友:窮家標簽太刺眼

      被拐30年兒子認親14小時就走,全程冷臉,網友:窮家標簽太刺眼

      老特有話說
      2025-12-06 17:31:27
      中國政府已經暫停大型粒子加速器計劃!

      中國政府已經暫停大型粒子加速器計劃!

      達文西看世界
      2025-12-11 17:05:23
      他們要來10000只死蚊子,把它們的嘴做成了3D打印噴頭

      他們要來10000只死蚊子,把它們的嘴做成了3D打印噴頭

      果殼
      2025-12-10 16:09:31
      明星母親導演父親,他出道16年不火,如今47歲演《大生意人》紅了

      明星母親導演父親,他出道16年不火,如今47歲演《大生意人》紅了

      查爾菲的筆記
      2025-12-10 18:11:47
      蘋果iOS 26.2正式版發布:負一屏終于不卡頓 動效Q彈絲滑

      蘋果iOS 26.2正式版發布:負一屏終于不卡頓 動效Q彈絲滑

      快科技
      2025-12-13 08:16:07
      2025-12-13 12:07:00
      科技行者 incentive-icons
      科技行者
      科技正在如何變革商業世界
      6531文章數 542關注度
      往期回顧 全部

      科技要聞

      比亞迪、小鵬、北汽,集體表態

      頭條要聞

      央媒談美新國安報告:時隔8年 美國提到中國的語氣變了

      頭條要聞

      央媒談美新國安報告:時隔8年 美國提到中國的語氣變了

      體育要聞

      有了風騷白人禿頭,忘掉談了10年的前任

      娛樂要聞

      保劍鋒方回應爭議,否認出軌贈送香水

      財經要聞

      鎂信健康闖關港交所:被指竊取商業秘密

      汽車要聞

      表面風平浪靜 內里翻天覆地!試駕銀河星艦7 EM-i

      態度原創

      健康
      房產
      親子
      旅游
      時尚

      甲狀腺結節到這個程度,該穿刺了!

      房產要聞

      每日狂增1300+企業!封關在即,海南徹底爆發!

      親子要聞

      打卡得能湖才懂為何家長繞道周末都要來(附上實用遛娃攻略)

      旅游要聞

      震撼!4000米海拔看日出云海金光萬丈

      導演們,該有危機意識了!野生創作正在崛起

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 揉捏奶头高潮呻吟视频| 五月天成人小说| 成人综合精品| 又黄又爽又色的视频| 亚洲精品欧美综合二区| 国产人免费人成免费视频| 一区二区三区四区视频| 婷婷色色五月天| 国产精品成人国产乱| 亚洲色av天天天天天天| 五月天国产成人av免费观看| 99精品视频在线观看| 免费av网站| 国内综合精品午夜久久资源| 日本丰满少妇高潮呻吟| 成人精品视频一区二区三区| 欧美精品福利| 欧美喷白浆| 男女吃奶做爰猛烈紧视频| 国产日韩av二区三区| 国产丝袜AV| 色欲人妻无码| 亚洲熟妇色自偷自拍另类 | 最大胆裸体人体牲交| 日本熟妇浓毛| 91色在线视频| 丁香花在线影院观看在线播放| 国产麻豆成人传媒免费观看| 国产v综合v亚洲欧美大天堂| 四虎论坛| 亚洲国产成人精品女人久久久| 国产狂喷潮在线观看| 国产精品白浆在线观看免费 | 熟女91| 中文无码日| 亚洲日本色| 亚洲日本乱码在线观看| 99久久久无码国产精品动漫| 狼友福利在线观看| 波多野结衣无码视频一区二区三区| 一本色道久久88加勒比中文字幕|