IT之家 4 月 3 日消息,科技媒體 9to5Mac 昨日(4 月 2 日)發(fā)布博文,報道稱蘋果研究團隊聯(lián)合香港大學(xué)發(fā)布最新論文,提出名為 LGTM 的全新渲染框架。
IT之家援引博文介紹,該框架全稱為“Less Gaussians, Texture More”,核心突破在于解耦 3D 場景的幾何結(jié)構(gòu)與表面紋理,讓系統(tǒng)在保持幾何形狀簡單的同時,通過疊加紋理層實現(xiàn) 4K 級超高清畫質(zhì)。
當(dāng)前主流的“前饋 3D 高斯?jié)姙R”(Feed-forward 3D Gaussian Splatting)技術(shù),能利用 AI 將 2D 圖片快速轉(zhuǎn)化為可多角度觀看的 3D 場景,但在處理高分辨率畫面時,隨著像素增加,算力需求呈指數(shù)級暴漲,導(dǎo)致設(shè)備難以負荷。
![]()
LGTM 正是為解決這一痛點而生。研究團隊采用兩步走策略:首先讓模型從低分辨率圖像中學(xué)習(xí)場景結(jié)構(gòu),確保幾何框架在 2K 或 4K 渲染下不出現(xiàn)破綻;隨后引入第二個網(wǎng)絡(luò)專門負責(zé)外觀細節(jié),將高分辨率紋理精準(zhǔn)映射到幾何結(jié)構(gòu)上。這種分工避免了全鏈路高算力消耗。
![]()
對于普通用戶而言,這項技術(shù)主要能提升蘋果 Vision Pro 體驗。該頭顯雙眼屏幕合計擁有約 2300 萬像素,單眼像素量超過 4K 電視。
現(xiàn)有渲染技術(shù)在如此高分辨率下極易遭遇性能瓶頸,導(dǎo)致畫面卡頓或模糊。LGTM 有望解決這一算力難題,帶來更流暢的沉浸式體驗。
![]()
實際演示顯示,接入 LGTM 框架后,生成的 3D 場景在紋理細節(jié)和文字清晰度上均有顯著提升,畫面效果已非常接近真實原圖。這意味著未來用戶在使用頭顯查看虛擬環(huán)境或進行透視體驗后,將獲得更逼真、更清晰的視覺效果。
參考
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.