<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      影石:十年全景相機,拍出了一座數據金礦

      0
      分享至

      research

      ? 一家相機公司的 AI 研究院,比很多大模型公司人還多

      ?「天空有多遠」和「杯子有多遠」,對算法來說完全是兩個問題

      ? 全景賽道太小了,不開源只有自己在玩

      以上內容,來自我和影石 AI 研究院 Gavin 的對話

      做全景相機的影石Insta360,最近把 4 篇頂會論文的核心算法 全部開源

      DAP|CVPR 2026

      全景深度預測,純視覺,一張圖量距離

      AirSim360|CVPR 2026

      全景仿真平臺,單日百萬幀,成本 20 塊

      DiT360|CVPR 2026

      全景文生圖,輸入文字生成 360 度全景圖

      DDGS|ICLR 2026

      稀疏視角 3D 高斯潑濺重建

      影石,年營收近百億,在全景相機領域市占率66%,連續八年全球第一

      不為人知的是,他們還有個數百人的 AI 研究院,比許多頭部大模型公司還大


      Insta360 全景相機

      一家相機公司,攢下了稀缺的空間數據

      以下內容,來自我和 Gavin 的對話,在影石,他是研究院總監、董事會成員,這些工作都由他負責統籌和指導

      同時,Gavin 是 TPAMI 編委,之前在字節跳動帶視頻生成大模型的數據基建。聊完之后我才明白,論文只是切面,真正有意思的是影石手里的數據

      全景數據的空間密碼

      我問 Gavin,全景數據和普通照片到底有什么本質區別

      他跟我說:很不一樣

      用手機拍一張照片,它是一個固定視角的平面投影。畫面邊緣之外的世界對模型來說完全未知。它輸出一個深度值,對不對,誰也不知道,沒有任何物理約束能去校驗它

      全景圖完全不同,記錄的是完整的 360 度空間信息。全景圖的最左邊和最右邊在物理上一定是無縫拼接的,每一幀全景數據都自帶一個閉環的數學校驗:模型產出的空間信息如果不滿足這個幾何閉合條件,數據系統本身就會報錯

      自校驗能力,普通照片不具備

      Gavin 把這個特性總結為:「全景數據,自帶物理閉環的幾何約束

      訓練空間 AI 的時候,不需要額外的人工標注,數據本身就在約束模型的行為。對于任何在做具身智能、自動駕駛、空間計算的團隊來說,這種數據天然帶著一層「防幻覺」機制

      這就是影石十年全景數據的真正價值。不只是量大,而是每一幀數據都自帶結構化的空間信息和內建的校驗機制

      十年的全景數據

      影石做了十年全景相機,積累了海量的全景空間數據。光是為 DAP 這個深度預測任務,經過數據清洗和場景平衡后篩出來的有效訓練集,就有 200 萬張。

      此前,學術界最大的全景深度數據集就幾萬張

      影石從十年前就在持續積累全景空間數據,早在 2020 年就用 3D 全景相機和貝殼找房合作采集室內空間數據

      對此,Gavin 表示:在全景空間數據的積累上,影石在全球范圍內應該是最大的

      DAP 的訓練數據來源三塊:公開數據集、用自研仿真平臺 AirSim360 生成的 9 萬幀合成戶外數據(覆蓋紐約、舊金山、羅馬等 5 個城市場景)、以及從互聯網采集的 170 萬張真實全景圖。注意,這 170 萬張圖沒有深度標注,靠一套三階段的偽標簽流水線自動生成 ground truth

      一張全景圖,算出每個像素的距離。零樣本,全球第一

      一張圖量距離,不需要激光雷達。對做空間感知的人來說,硬件成本從幾千塊的 LiDAR 模組降到一顆全景鏡頭。這個成本差異是量級的

      不用激光雷達

      我去讀了 DAP 的論文,發現了一件有意思的事:影石做深度預測用的是純視覺方案,不用激光雷達。只需要一張全景圖,就能算出每個像素的距離

      DAP (Depth Any Panoramas)CVPR 2026

      通過這個全景深度預測基礎模型,只需要一張全景圖,就能算出畫面中每個物體的距離,精確到像素。純視覺方案,不用激光雷達。用 200 萬級數據訓練,零樣本深度預測全球第一

      為什么走這條路?Gavin 說參考的是特斯拉 FSD 的思路。特斯拉用 Data Scaling Law 證明了:數據夠多的時候,純視覺可以解決絕大部分問題。影石手里有全世界最大的全景數據集,走純視覺在數據量上有天然優勢

      局限也有,大面積透明玻璃、純白色墻面,純視覺確實抓瞎。影石的做法是在無人機上配 ToF 傳感器做輔助,動態權重算法在不同場景下調整依賴程度。絕大部分場景純視覺覆蓋,極端情況傳感器兜底

      影石最終想做的產品是一臺「完全自主的跟拍攝影師」,或者說:Cameraman

      在這個過程中,設備不需要人操控,自己看懂空間、自己避障、自己構圖、自己用電影感的運鏡方式拍攝。這條路線的終局和自動駕駛是同一個邏輯:傳感器只是補充,數據規模才是壁壘

      這個判斷對所有在純視覺和多傳感器融合之間做選擇的團隊都有參考價值。核心問題永遠是:有沒有足夠規模的數據,來喂純視覺方案

      那 10% 的 Gap

      影石做了一個仿真平臺 AirSim360,能在虛幻引擎 5 里原生渲染全景數據,單日產出 100 萬幀,成本 20 塊錢。官方說減少約 90% 的戶外實飛。我問 Gavin,那剩下的 10% 呢?

      AirSim360CVPR 2026

      這是一個全景無人機仿真平臺,借由虛幻5引擎,在其中搭建城市、山林等虛擬環境,接入真實飛控板做飛行訓練。自動生成深度、語義、實體等多層標注,不需要人工標注

      那剩下的 10% 卡在哪?Gavin 說是真實世界里不可預測的物理噪聲。高速運動時的湍流、圖傳信號丟包、鏡頭震動導致的動態虛焦,這些在虛幻引擎里沒法完美建模。只能在真實世界里飛,炸一次機收集一次數據

      然后我們聊到了室內和室外的區別,當然,這個話題跟我自己有關。我在同時裝修兩個幾百平的酒吧,正在把它們做成數字孿生,計劃讓具身智能的機器人在虛擬環境里訓練完直接來店里上班。做的過程中發現,室內的全景數據和戶外的完全是兩套處理邏輯

      「因為天空的距離是不一樣的」

      室外天空是無限遠的,算法設定一個無窮遠就行。但在室內,最遠距離就是天花板和墻壁

      「天空有多遠」和「杯子有多遠」在深度幾何約束上完全是兩個概念。這也是很多深度預測模型只能做室內或者只能做室外的原因

      對所有做室內具身智能的團隊來說,這是一個繞不開的基礎問題。DAP 在論文里做到了室內外統一的深度預測,但 AirSim360 仿真平臺目前只覆蓋了城市和戶外。Gavin 說內部已經在做室內空間的探索,包括無人機和機器人在多層建筑里自主穿梭的課題

      影石現在也在和一些具身智能團隊合作,用定制化的全景設備給機器人當「眼睛」。360 度無死角,不用來回轉頭

      做數字孿生還有一個繞不開的問題:怎么從幾張照片,還原出完整的三維空間?

      拍的角度越少,重建就越快、成本越低,但質量也越難保證。影石的另一篇論文 DDGS 就在解決這個問題,而全景數據天然的全視角覆蓋,讓「少拍幾張」變得可行

      DDGSICLR 2026

      通過這項算法,只需要少量不同角度拍攝的照片,就能還原出可以自由旋轉查看的 3D 場景。全景相機一張圖覆蓋 360 度,天然減少了所需的拍攝次數

      暖手寶問題

      論文做出來了,但要塞進一顆運動相機的芯片,是另一回事。影石做的是消費級硬件,芯片算力和功耗被極度限制

      Gavin 舉了個例子,目標追蹤領域效果最好的是 Meta 的 SAM 系列,追蹤什么物體都很準。但想放到影石的相機芯片上,底層硬件根本不支持 SAM 的某些網絡結構和算子

      更致命的是散熱。相機體積太小,大模型跑起來發熱控制不住

      「總不能把運動相機做成暖手寶」

      所以影石的算法團隊做的事情,本質上是把學術界的大模型用裁剪、蒸餾和量化硬塞進消費級芯片。但問題還不止于此:由于全景數據的幾何畸變特性,通用學術模型的適配程度本身就不高,即使能跑進硬件,算法模型也要重新開發。這是為什么必須從底層自研,團隊需要數百人

      這個問題不只是影石的。任何想把 AI 做進終端硬件的公司都面對同樣的約束:云端可以堆卡,終端沒這個條件。算力不夠的時候,算法設計本身就要為硬件讓路。影石在這件事上積累的經驗,對所有做端側 AI 的團隊都有參考價值

      為什么開源

      全景在 AI 領域還是一個很小的分支。影石占了全球 66% 份額,但整個賽道的體量有限。不開源,這個賽道就只有影石一家在玩

      Gavin 說把底層技術開源,是希望學術界和工業界先用起來。用起來之后能反哺很多影石自己看不到的應用場景。一個人把蛋糕做不大,但基建鋪好了,別人進來,蛋糕才能變大

      創始人劉靖康最近在上海一場黑客松上做了一件有意思的事。影石每年 1024 程序員節有個內部傳統:給最優秀的工程師發純金打造的鍵帽,回車鍵或者空格鍵,大約 30 克純金。這次劉靖康第一次把黃金鍵帽發給了外部的獲勝開發者,希望拿到鍵帽的人把它們拼在一起,拼出一個詞:NO BUG


      NO BUG,用純金拼出來的

      以及,對在做空間 AI 的開發者來說,影石這次開源的東西中還有一個值得一看:DiT 360,代碼和權重都放在了 GitHub 上

      DiT360CVPR 2026

      輸入一段文字描述,就能生成一張完整的 360 度全景圖。生成的圖在邊緣能無縫拼接,保持幾何結構的一致性,同時支持對已有全景圖做局部修改和擴展

      聊到最后,Gavin 說了他對未來三年的押注:把感知和生成統一到一個全景基座模型里。三年后,設備放飛,完全自主地看懂空間、避障、構圖、拍攝。他管這個叫「完全自主的超級跟拍師」

      然后他提到:最近在研究怎么讓無人機在室內自主爬樓梯

      我說:我的新酒吧正好有樓梯,到時候留一段給你測試

      關于 Gavin

      Gavin(亓魯),90 后,2024 年加入影石。長期擔任 NeurIPS、ICML、ICLR、ICCV、CVPR 領域主席,AI 2000 全球人工智能學者,Google Scholar 引用 16000+

      最后,感謝 Gavin 和影石研究院團隊的坦誠分享

      影石 AI 研究院開源項目

      https://github.com/Insta360-Research-Team

      DAP 在線 Demo

      https://huggingface.co/spaces/Insta360-Research/DAP

      DiT360 在線 Demo

      https://huggingface.co/spaces/Insta360-Research/DiT360

      AirSim360 論文

      https://arxiv.org/abs/2512.02009

      DAP 論文

      https://arxiv.org/abs/2512.16913

      DiT360 論文

      https://arxiv.org/abs/2510.11712

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      爆料!全紅嬋網暴案真正的犯案目的

      爆料!全紅嬋網暴案真正的犯案目的

      藝利森
      2026-04-17 11:34:28
      48歲TVB視后證實患癌,發文交代病情嘆世事無常

      48歲TVB視后證實患癌,發文交代病情嘆世事無常

      TVB劇評社
      2026-04-17 22:51:38
      一條煙、一瓶酒,2026年5月起,連茶葉盒都得過紀檢這道關

      一條煙、一瓶酒,2026年5月起,連茶葉盒都得過紀檢這道關

      周哥一影視
      2026-04-17 19:29:59
      錢賺夠了,名聲沒了,謝娜開演唱會迎來全網罵潮,劉燁當初沒說謊

      錢賺夠了,名聲沒了,謝娜開演唱會迎來全網罵潮,劉燁當初沒說謊

      洲洲影視娛評
      2026-04-15 23:09:10
      中國女子稱在韓旅游遭日本男子騷擾,“警方說他已回日本,只能等下次入境再抓”

      中國女子稱在韓旅游遭日本男子騷擾,“警方說他已回日本,只能等下次入境再抓”

      極目新聞
      2026-04-17 20:15:36
      剛剛,美國發動史詩級搶劫,無恥的搶到了天量財富!

      剛剛,美國發動史詩級搶劫,無恥的搶到了天量財富!

      一個壞土豆
      2026-04-17 19:34:56
      特朗普稱霍爾木茲海峽局勢已結束,全球巨震:美股上漲,油價暴跌,黃金白銀上漲

      特朗普稱霍爾木茲海峽局勢已結束,全球巨震:美股上漲,油價暴跌,黃金白銀上漲

      澎湃新聞
      2026-04-18 04:19:38
      雷軍挑戰成功!小米新SU7行駛1313公里只充1次電,連續直播15個小時,多名車友一路跟隨

      雷軍挑戰成功!小米新SU7行駛1313公里只充1次電,連續直播15個小時,多名車友一路跟隨

      極目新聞
      2026-04-17 22:41:31
      向太太敢說了!向華強今年已經78了,但是她和向華強還有X生活!

      向太太敢說了!向華強今年已經78了,但是她和向華強還有X生活!

      心靜物娛
      2025-12-24 11:02:28
      以色列和黎巴嫩政府和談,真主黨面臨徹底覆滅的危險

      以色列和黎巴嫩政府和談,真主黨面臨徹底覆滅的危險

      高博新視野
      2026-04-17 07:30:13
      狂砸 1.4 億!克洛普給皇馬下死命令,先簽 3 大巨星,1 人必賣

      狂砸 1.4 億!克洛普給皇馬下死命令,先簽 3 大巨星,1 人必賣

      瀾歸序
      2026-04-18 05:59:49
      這跟不穿有啥區別?張萌開叉到胃,文詠珊副乳松弛,張天愛大又挺

      這跟不穿有啥區別?張萌開叉到胃,文詠珊副乳松弛,張天愛大又挺

      嫹筆牂牂
      2026-04-16 07:31:11
      山東泰山球迷意難平!不止因為1-1戰平海港,更多在于以下五點!

      山東泰山球迷意難平!不止因為1-1戰平海港,更多在于以下五點!

      田先生籃球
      2026-04-17 23:07:19
      北京電影節開幕式紅毯:高圓圓舒淇好美,高葉造型亮眼,尹正瘦了

      北京電影節開幕式紅毯:高圓圓舒淇好美,高葉造型亮眼,尹正瘦了

      八卦先生
      2026-04-16 23:19:54
      靈隱寺的事,沒那么簡單!

      靈隱寺的事,沒那么簡單!

      新動察
      2026-04-17 10:18:37
      打不得!日本戰艦闖入臺海峽,我軍為什么不直接擊沉它?

      打不得!日本戰艦闖入臺海峽,我軍為什么不直接擊沉它?

      動漫里的童話
      2026-04-18 04:21:22
      日本賭中方不會動手,派艦進入臺灣海峽,下1秒,直接被中方處置

      日本賭中方不會動手,派艦進入臺灣海峽,下1秒,直接被中方處置

      明天后天大后天
      2026-04-18 04:39:30
      許家印倒臺后,恒大歌舞團長白珊珊近照曝光,曝已嫁人生活滋潤

      許家印倒臺后,恒大歌舞團長白珊珊近照曝光,曝已嫁人生活滋潤

      180視角
      2026-04-17 11:44:13
      越南高鐵訂單給了德國,蘇林來中國為何還要坐10多個小時高鐵?

      越南高鐵訂單給了德國,蘇林來中國為何還要坐10多個小時高鐵?

      開著車去流浪
      2026-04-17 22:17:46
      不會干,你就別干了!中國勒令馬士基停運,巴拿馬終于坐不住了

      不會干,你就別干了!中國勒令馬士基停運,巴拿馬終于坐不住了

      優趣紀史記
      2026-04-17 20:17:18
      2026-04-18 08:12:49
      賽博禪心
      賽博禪心
      拜AI古佛,修賽博禪心
      387文章數 50關注度
      往期回顧 全部

      藝術要聞

      吳昌碩:八大夢中督我把荷畫

      頭條要聞

      "A股之王"源杰科技1年漲超12倍:曾被日本供應商當騙子

      頭條要聞

      "A股之王"源杰科技1年漲超12倍:曾被日本供應商當騙子

      體育要聞

      中超-泰山1-1海港 楊希處子球克雷桑任意球扳平

      娛樂要聞

      劉德華摯友潘宏彬離世 曾一起租房住

      財經要聞

      "影子萬科"2.0:管理層如何吸血萬物云?

      科技要聞

      7家頭部平臺被罰沒35.97億元

      汽車要聞

      又快又穩的開掛動力! 阿維塔06T全系搭分布式電驅

      態度原創

      教育
      健康
      手機
      時尚
      公開課

      教育要聞

      四年級奧數題,難倒不少學生,豬是多少?

      干細胞抗衰4大誤區,90%的人都中招

      手機要聞

      紅米Note17:天璣中端芯+1.5K屏+金屬中框,并開啟10000mAh時代

      今日熱點:許光漢否認和周子瑜戀情;郝熠然與誠實一口終止合作……

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版