![]()
從視覺之外出發,聲波與毫米波正在重塑 AI 理解物理世界的方式。
作者丨鄭佳美
編輯丨岑峰
![]()
這幾年,隨著人工智能逐步走出實驗室,進入真實世界,感知問題重新回到技術討論的中心。
從自動駕駛、智能終端,到空間智能和具身智能,系統不再只是理解信息,而是必須在復雜、動態的物理環境中持續獲取可靠信號。現實應用中,單一依賴視覺的感知方式正不斷暴露出局限,也由此促使學術界和產業界重新審視多模態感知在下一階段智能系統中的位置。
在這樣的背景下,聲波、毫米波等無線感知技術逐漸受到關注。這類技術并不以看見為目標,而是通過對物理信號的建模與分析,讓設備在不增加額外負擔、也更少干擾用戶的情況下理解環境與行為。它們距離全面普及仍有距離,但已被視為支撐空間智能與真實世界交互的重要基礎。
在 GAIR 2025 期間,南方科技大學副教授張進圍繞無線感知、多模態感知以及面向空間智能的新型感知技術展開分享。長期從事相關研究的她,更關注這些技術在真實場景中的可行性與可信性,而不僅僅是實驗條件下的效果表現。
在會議現場,AI 科技評論與張進教授圍繞無線感知及其在真實世界中的應用展開對話。對話中,相比對技術前景的宏觀判斷,她更愿意從研究實踐出發,討論感知技術在落地過程中遭遇的限制與挑戰,并且了分享自己精彩的個人經歷和行業觀點。相關內容 AI 科技評論做了不改變原意的編輯整理:
![]()
01
一所大學的成長,與一個學者的判斷
AI 科技評論:您從清華到港科大,學術背景非常扎實,為什么最終選擇來到南方科技大學任教?
張進:我當時選擇南方科技大學,核心原因并不是個人發展的跳槽邏輯,而是我非常清楚一所年輕大學在正確制度和環境下,能夠成長到什么程度。香港科技大學本身就是一個非常典型的例子,它成立只有二十多年,但已經能做到世界一流。我在港科大工作過,對這件事有非常直接、切身的認識。
南科大當時正處在一個必須要成長起來的階段,而且是深圳市明確要重點支持、重點打造的一所大學。我們當時內部有一句很響亮的話:“叫醒南科大學生的不是鬧鐘,而是中國高校改革的號角。”這并不是一句口號,而是一種真實存在的狀態,大家是以一種創業的心態在辦大學。
我進入南科大的時候,學校甚至還沒有計算機系,是從零開始搭建的。我們找系主任、建學科方向、定培養方案,一步一步把計算機系做起來。到現在為止,計算機系每年大約培養 200 名學生,十年下來接近 2000 人。雖然不能說已經非常強,但至少體系完整、規模穩定,這對一所年輕大學來說并不容易。
AI 科技評論:如果把南科大當成一家創業公司來看,您是否更像創始人型的角色?
張進:某種程度上確實是這樣。這種參與感會讓你對學校產生完全不同的情感。學生怎么培養、課程怎么設計、學科方向怎么布局,這些都不是既定規則,而是你親自參與制定的。
我現在不僅是計算機系的副系主任,負責研究生培養和科研工作,同時也是致仁書院的副院長。書院制是南科大非常有特色的一部分。再加上去年我們成功拿到了博士點,整個計算機系從 2014 年開始先做本科培養,再到后來逐步完善研究生培養體系,這一整套結構,都是我們一起搭建起來的。
正因為是從無到有參與建設,這種感情和責任感是非常不一樣的。
AI 科技評論:除了學校本身,深圳這座城市對您來說意味著什么?
張進:很多人一提深圳,第一反應是很富裕,但我覺得深圳的優勢絕不只是有錢。美國也有錢,硅谷也有錢,但硅谷很多硬件最終還是要回到深圳來做。
深圳真正厲害的地方在于,它擁有非常完整的產業鏈配套,同時又具備高密度的人才儲備和真實存在的市場需求。這三件事疊加在一起,是非常罕見的。
港科大的很多畢業生,最后都會選擇來深圳,要么創業,要么做科研。我們希望做的是那種真正能改變世界、并且能和產業緊密結合的研究方向,而深圳正好處在一個高速成長的階段。在這個階段進入,而不是等它已經到頂了再進去,會有更大的空間。
02
從通信到無線感知的「自然遞進」
AI 科技評論:您的研究方向跨度非常大,最早是從哪里開始的?
張進:我的研究方向確實經歷了多次變化。碩士階段在清華,我做的是 3G/4G 的無線移動通信系統,到港科大讀博士后,進入計算機系,研究方向轉向無線網絡,主要關注 WiFi 多基站之間的協同部署。
后來又進一步做認知無線電,也就是讓通信系統具備一定智能,能夠自動判斷頻段占用情況,并進行動態切換。博士畢業之后,我開始嘗試把無線信號用于智慧醫療場景。
一開始只是感知數據、傳輸數據,但很快我意識到,無線信號本身就可以用來感知人的健康狀態。這是一個非常重要的轉折點。
AI 科技評論:您在智慧醫療方面具體做過哪些探索?
張進:博士畢業后,我在港科大做了幾年創業,和深圳市人民醫院、深圳市第二人民醫院有非常深入的合作。我們一起做了移動健康監測系統,包括網絡醫院的管理系統,用來管理幾萬名曾經看過病的患者,同時也做了腦卒中的篩查等工作。
從現在回頭看,我們當時做得非常早。像 Fitbit、Jawbone 這些手環產品,當時都還沒有出現。也正因為太早,技術條件、產業環境和市場認知都還沒準備好,很多事情最終沒能真正規模化落地。
這讓我意識到,一些真正前沿、周期很長的事情,可能還是更適合回到學術界持續做。
AI 科技評論:您后來是如何系統性地進入感知這一方向的?
張進:回到學術界之后,我并沒有放棄對健康和環境感知的關注,而是開始從非視覺的角度重新思考這個問題。 2014 年我到南科大之后,開始系統研究毫米波雷達,到 2018、2019 年左右,又逐步引入聲波感知,同時繼續推進毫米波方向。
技術路徑上,我們從最早的信號處理,逐步引入機器學習、深度學習,再發展到現在的大模型。這是一個非常自然的遞進過程。我們這個方向的一個天然優勢在于,我們既有扎實的信號處理背景,又有計算機和人工智能的背景,所以能夠把物理信號和AI模型很好地結合起來。
03
讓設備「看不見」卻「懂得更多」
AI 科技評論:那您如何理解聲波感知和毫米波感知?能否用通俗的方式解釋?
張進:聲波感知其實非常直觀。你可以把手機、電腦、耳機想象成一只蝙蝠:揚聲器發出人耳聽不到的聲波,聲波打到周圍環境后反射回來,再由麥克風接收,通過這些反射信號來感知環境和人體狀態。
它可以用來檢測呼吸、心跳,感知房間布局,識別手勢姿態,甚至幫助設備之間判斷相對位置關系。最大的好處是,它不需要額外增加新的傳感器,成本低、體積小,而且感知能力并不弱。
毫米波感知大家最熟悉的是汽車前面的毫米波雷達,用來檢測前方是否有車輛。但在生活場景中,它同樣可以用來監測室內是否有人、人數多少、人的位置、心跳狀態、是否發生跌倒等。同時它又看不到具體形象,在隱私保護方面比攝像頭更友好。
AI 科技評論:您認為大眾對感知技術最大的誤解是什么?
張進:我覺得感知技術本身并不需要被大眾理解。最好的技術,往往是你感覺不到的技術。
就像耳機,你戴上就能連上,這是最好的體驗,如果你還得點來點去才能連上,你就會非常不爽。感知技術的核心目標,是讓設備在具備環境理解能力之后,自然地完成交互,而不是讓用戶不斷去告訴設備現在發生了什么。
AI 科技評論:在您看來,感知技術在推動 AI 和科學發展中有什么不可替代的作用?
張進:現在大家都在談“空間智能”,但僅靠視覺、語音和圖像是遠遠不夠的。圖像很難精確獲取距離和真實空間結構,而要真正理解和交互物理世界,必須引入物理感知模態。
人類最早發展的智能并不是語言智能,而是空間智能。智能機器如果要成為真正的智能體,也必須具備對物理空間的理解和交互能力。這時候,聲波、毫米波以及其她新型感知模態就變得不可或缺。
04
當感知真正進入現實世界
AI 科技評論:那感知結果是否可信?是否會被攻擊?
張進:這是我們近兩三年重點關注的問題。尤其是毫米波雷達已經大量應用在汽車上,對安全性的要求極高。如果感知系統被攻擊,可能會讓車輛看不到真實存在的車,或者憑空看到不存在的障礙物,從而引發嚴重事故。
因此我們不能假設世界上所有人都是好人。感知系統在信號設計、模型結構和整體系統層面,都必須具備抵御攻擊的能力,才能真正做到可信。
AI 科技評論:從開始到現在,您的研究方向跨度這么大,如何看科研中的得與失?
張進:我覺得科研的本質是好奇心。如果你每天都在做已經會的事情,其實是沒有太大意義的。方向會隨著世界在發生什么、社會需要什么而變化,但科研的內核是不變的,發現問題、理解前沿、解決別人沒解決的問題。
我也經常跟學生說,你們找工作的時候,不用只看公司要的技術是不是你博士或碩士期間做過的東西。真正重要的是你有沒有系統性分析問題、構建解決方案的能力。一個成功的博士,就應該具備進入任何新領域的能力。
AI 科技評論:那您如何看待“女生不適合學工科”的說法?
張進:我完全不認同這種說法。我不認為女生的邏輯能力比男生差,很多時候是被反復暗示“你不行”,才真的不自信。
在我看來,女生學計算機反而有很多優勢:稀缺性高、溝通能力強、共情能力強、更細心、抗挫折能力強、韌性更好。在需要團隊協作的大型系統性研究中,這些都是非常重要的能力。
我培養過很多非常優秀的女學生,其中就包括南科大第一個拿到美國教職的本科生。所以女生完全可以、也非常適合選擇計算機和硬核理工科。
AI 科技評論:如果讓您描述未來三年內的感知世界,您會怎么說?
張進:我覺得感知領域未來一定是高度多樣化、碎片化的,不會有一種技術可以解決所有問題。不同場景、不同設備約束、不同需求,會對應不同的技術組合。
但最終目標是一致的:技術要真正落地到產品中,讓產品變得足夠智能,讓用戶不需要額外輸入信息,設備就能理解物理世界。只要能做到這一點,不管用什么技術手段,都是好的感知技術。
未經「AI科技評論」授權,嚴禁以任何方式在網頁、論壇、社區進行轉載!
公眾號轉載請先在「AI科技評論」后臺留言取得授權,轉載時需標注來源并插入本公眾號名片。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.