未來,相機或可徹底告別模糊照片!
無論是拍照、顯微成像,還是自動駕駛攝像頭,大多數成像系統數百年來受限于同一個物理規則:
一片透鏡,在同一時刻,只能形成一個統一的焦平面。
這意味著相機必須在大光圈、景深、分辨率之間不斷妥協——景深可以擴大,但代價是亮度下降、衍射變糊。長久以來,這條規則定義了相機的結構,也限制了相機的能力。
近日,來自美國卡內基梅隆大學 CMU 的一項研究徹底突破了這一規則。研究團隊提出了一個全新的成像范式:Spatially-Varying Autofocus 空間可變自動對焦。該成果獲得 ICCV2025 最佳論文榮譽提名獎。論文一作 CMU 博士生秦穎思向 DeepTech 介紹道:
“我們構建了首個能夠在單次曝光中,實現像素區域級自動對焦的成像系統。”
![]()
圖 | 秦穎思(來源:https://yingsiqin.github.io/)
這項技術讓相機第一次擺脫“只有一個焦平面”的限制——把對焦從一個平面升級為可自由編程、可隨場景變化的焦曲面。
![]()
圖|空間可變自動對焦(來源:https://imaging.cs.cmu.edu/svaf)
具體來說,它能做到哪些過去相機做不到的?
它可以讓相機在任何復雜、起伏劇烈的三維場景中做到真正的“全場景清晰”。無論深度多么不規則,相機都能在一次曝光中讓各區域自動對到正確的位置,讓對焦成為一個可編程的維度,不再受光圈與景深的物理限制,可以自由、直觀地交互調控。


(來源:https://imaging.cs.cmu.edu/svaf)
它可以讓相機“看穿”前景的小遮擋。比如,拍人像時,如果前面有鐵絲網、樹枝,傳統相機會把它們拍進去。而新系統可以讓這些遮擋在光學上直接變得極其模糊甚至不可見,只聚焦在主體與背景。

(來源:https://imaging.cs.cmu.edu/svaf)
它可以讓你進行創意虛化。告訴相機“讓凱旋門和遠方樓群清晰對焦,其他地方都要模糊”,相機就能直接拍出這種效果,無需任何后期處理。

(來源:https://imaging.cs.cmu.edu/svaf)
核心突破來自光學與算法的共同創新
秦穎思告訴 DeepTech:“這一系統級突破由兩大核心創新共同支撐:在光學硬件層面,我們實現了首個可對不同傳感器像素賦予不同焦距的可編程光學結構。在算法層面,我們同樣首次提出了能夠驅動不同圖像區域進行獨立自動對焦的算法框架。”
正是這兩項各自具備首創性的硬件與算法的結合,才產生了這個首個具備像素區域級獨立自動對焦能力的成像系統,而“自動”這一關鍵特性,正是由上述算法所驅動的。
![]()
圖|原型機(來源:https://imaging.cs.cmu.edu/svaf)
總的來說,這一成果讓相機擁有了任意控制不同圖像區域的對焦距離的能力,首次實現了一種能讓相機不同像素同時對焦在不同深度上的成像系統。
![]()
(來源:https://imaging.cs.cmu.edu/svaf/static/pdfs/Spatiall
它成功地將焦平面拓展為可自由編程的焦曲面,能夠根據場景的實際深度分布,動態調整并讓光學系統直接適配不同區域的焦距,從而在保持大光圈和高通光量的前提下,一次性光學捕獲整個場景都清晰的高分辨率圖像,無需依賴后期合成。
給相機的每個像素裝上專屬“智能眼鏡”
秦穎思表示,本次這項空間可變自動對焦的研究,是光學與算法上的綜合提升,而其核心的光學技術創新其實源自她之前在 VR 顯示的一項研究工作:Split-Lohmann 多焦面 3D 顯示技術。
在顯示領域,一個場景的 RGB-D 信息(即顏色與深度)是已知的,顯示的目標是輸出信息,將場景的不同像素光學聚焦到不同深度,最終呈現到人眼中。
而同樣的光學創新也可以應用于成像系統,只不過方向相反,即從“輸出信息”轉變為“輸入信息”,也就是要捕捉現實世界的信息。
研究團隊利用光路可逆這一概念,將顯示技術中的光學突破,應用到成像系統中。于是,一個新型成像系統誕生了。
此次研發的核心光學結構名為“Split-Lohmann 計算透鏡”——它打破了傳統鏡頭只能產生單一焦平面的限制,把焦距變成可像素區域級控制的維度。這個結構的核心是兩個特殊的鏡片即立方相位板,以及一塊名為空間光調制器(SLM,Spatial Light Modulator)的“智能畫布”。
當兩面特殊鏡片以特定方式組合時,它們的功能就相當于一個焦距可變的透鏡。而“智能畫布”能夠通過編程,精確地控制它穿過不同區域的光線的聚焦。
在這套系統中,相機傳感器的每一個像素點,都能對應到“智能畫布”上的一個特定區域。通過編程可以對畫布不同區域施加不同的影響。這就等于給相機的每一個像素點都配了一副獨一無二的“眼鏡”。
假如你要給朋友拍攝一張他站在櫻花樹下的照片,使用這一相機時等于給靠近你朋友的像素點戴上了“看近處”的眼鏡,而拍攝遠處花朵的像素點則戴上了“看遠方”的眼鏡。通過此相機實現了空間變焦,即在同一張照片里不同地方的焦點可以完全不同。
![]()
圖|光學系統(來源:https://imaging.cs.cmu.edu/svaf)
相機如何學會對焦?
只有可以空間變焦的智能透鏡是遠遠不夠的,相機還得知道照片里的每個東西到底距離它有多遠,只有這樣才能給對應的像素分配合適的眼鏡。就像人類的眼睛需要先判斷物體的遠近,大腦才能指揮眼球肌肉進行對焦一樣。為此,秦穎思給這臺相機設計了兩種自動對焦算法。
第一種算法是對比度探測法(CDAF),它可以讓相機邊試邊找。這種方法有點像我們在黑暗中摸索開關。具體來說,相機會首先在整個焦距范圍內拍攝三張略有不同對焦深度的照片。然后,它會分析照片中每個小區域的對比度也就是顏色和明暗的反差,而對比度最高的位置往往對應最佳對焦深度。
隨后,相機會把搜索范圍減半,再在更小的范圍內試拍并比較新一組圖像。通過這樣逐步收縮范圍、每次拍攝三張左右的方式,相機可以在極少的試拍次數內迅速收斂到最佳對焦深度,而不需要像傳統方法那樣做全面窮舉式掃描,最終為每個小區域找到那個能讓它變得最清晰的對焦深度。
![]()
圖|CDAF 介紹(來源:https://imaging.cs.cmu.edu/svaf)
第二種算法是相位探測法(PDAF),能為相機帶來一眼看穿的能力。這個方法需要一種雙像素傳感器,這種傳感器的每個像素點(微透鏡)下面都有兩個眼睛(光電二極管),能夠同時捕捉到略有視差的兩個圖像。當物體清晰對焦的時候,這兩個圖像是完美重合的。
如果物體模糊了,這兩個圖像就會錯開。通過計算錯開的距離和方向,相機就能判斷出物體距離和對焦距離之間差了多少,從而瞬間自動對焦。
![]()
圖|PDAF 介紹(來源:https://imaging.cs.cmu.edu/svaf)
秦穎思表示:“這兩種方法的根本任務都是精確計算場景深度,它們與 AI 或主動感知等方法并非互斥,未來完全可以相互結合、互補,以進一步提升結果的精度、物理可靠性和魯棒性。”
實時全場景動態對焦成為可能
值得強調的是,這并非停留在靜態場景上的成像系統,研究團隊的相位探測法原型機已經實現了 21FPS 的實時全場景動態對焦。

(來源:https://imaging.cs.cmu.edu/svaf)
或將創業進行產品孵化
據秦穎思介紹,在那些需要對整個場景清晰成像和信息獲取的領域,本次技術將發揮至關重要的作用。
一個典型的應用是自動駕駛。在自動駕駛中,我們需要實時感知周圍環境的所有動態。大家都不希望因為一個行人從車前走過,相機的自動對焦發生改變,導致模糊忽略了遠方正快速駛來的車輛。
自動駕駛需要確保環境感知的全面性和連續性。傳統自動對焦難以實現這一點,常在兩者之間來回切換,導致延遲。而本次成果全場景聚焦技術正好可以滿足這一需求,避免對焦延遲可能帶來的風險。
另一個重要應用是顯微成像,實現一次性看清厚樣本。對于具有厚度的組織樣本,傳統顯微鏡必須逐層掃描再后期合成。而這臺相機可以讓整個厚樣本同時變得清晰,為觀察動態樣本、實時監測生物過程提供可能。
此外,在監控安防領域,對于監控攝像頭而言全面掌握整個場景的清晰細節和信息是核心需求,本次系統能夠確保畫面中的所有區域始終聚焦,滿足安防對信息完整性的高要求。
最后,在醫療成像和機器人遠程手術中,醫生通過遠程操控機器人進行精密操作時,對視覺反饋的清晰度和準確性要求極高。本次相機則能提供實時全場精準對焦的畫面,為手術的“穩”與“準”提供關鍵的技術支持。
秦穎思表示,團隊已圍繞核心技術布局全球專利,美國專利正在申請中。她說:“隨著工程推進,我相信這項技術會自然進入那些需要高可靠視覺的應用場景,成為下一代視覺系統的底層能力。同時,應用層面的反饋與需求也能反過來驅動科研,持續提升性能。我期待在未來推動這項技術成為產品落地,改善和提升大家的生活。”
參考資料:
研究論文:Spatially-Varing Autofocus
論文地址:https://imaging.cs.cmu.edu/svaf/static/pdfs/Spatially_Varying_Autofocus.pdf
項目網站:https://imaging.cs.cmu.edu/svaf/
作者網站:https://yingsiqin.github.io/
演講視頻:https://www.youtube.com/watch?v=kbIFbTkv1l0
運營/排版:何晨龍
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.