網易首頁 > 網易號 > 正文申請入駐

李飛飛一篇論文，ChatGPT、Claude全部是”智障”

2026-03-10 23:09:49　來源: Kevin改變世界的點滴

廣東舉報

分享至

最近一篇論文讓我反復觀看，那就是李飛飛聯合西北大學教授做了一個測試，將ChatGPT、Claude、DEEPSEEK等主流一線模型做了一個基線測試。

” “Thinking in Space: How Multimodal Large Language Models See, Remember, and Recall Spaces”

研究團隊設計了一個 空間推理測試集 VSI-Bench ，包含：

5000+ 視頻空間問答任務
需要模型理解：
- 物體位置
- 空間移動
- 距離關系
- 環境結構

測試模型

論文測試了多種大模型，例如：

GPT 系列
多模態模型
視覺語言模型

從而得出結論

LLM的空間理解能力遠低于人類
語言推理技巧（CoT、Tree-of-Thought）幾乎無幫助
模型缺乏真正的 “world model / 空間認知結構”

并且語言推理技巧也幾乎完全落后人類

語言推理技巧（CoT、Tree-of-Thought）幾乎無幫助
模型缺乏真正的 “world model / 空間認知結構”

LLM模型無法做空間的底座

為什么現在的AI模型無法生成空間系統了，因為他就沒有辦法去理解空間操作能力，這就導致我們現在做vision Pro的開發，當程序員想用AI編碼工具生成，幾乎無法完成。

被迫只能手動寫代碼，在現在空間計算里面，因為他們記不住在視頻里面的內容，也很難分辨出空間里面的物體。

在論文里舉例，如果現在的常識是在3D圖形旋轉一圈之后，看下AI模型能不能識別，而這種只是拿著標準答案來測試；于是他們用真實的家庭識別來測試，或者工廠或者辦公室。

空間智能有4個能力，分別是視覺能力、語言能力、時間處理、空間推理，其中

1.視覺感知（visual perception）

模型需要：

識別物體
識別形狀
識別位置

例如：

桌子、椅子、門、窗戶

2.語言能力（linguistic intelligence）

模型要理解問題。

例如：桌子在沙發左邊還是右邊？

3.時間處理（temporal processing）

視頻是：

時間序列

模型要理解：

物體移動
相機移動
人的路徑

4.空間推理（spatial reasoning）

這是最難的部分。

模型要理解：

距離
方向
相對位置

例如：

桌子在椅子前面

而這點現在大模型做不到，主要是因為大模型現在只有tokens sequence，所以LLM不會真正理解房間結構、路徑、距離。

最后就是通過空間智能之后，加上時間的維度就是空間記憶，比如在記憶里面人類可以記住物體的位置，完整的房間布局結構。

而機器人要想能夠自主運動，就是需要空間模型，而當前時間是沒有空間模型的，都是LLM，這也是為什么vision Pro與AndroidXR會成為下一代革命，當真正使用空間設備的人多了之后，就可以快速生成更多高質量的空間數據，就可以完成空間智能模型的訓練了。

今天的分享就到這里

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

李飛飛李曼玲團隊發布空間理論：AI的空間智能還在三歲小孩階段

DeepTech深科技 2026-03-31 15:06:46
0 跟貼 0
李飛飛放出2款模型，幾分鐘造出3D世界？

機器之心Pro 2026-04-11 12:00:00
0 跟貼 0

00后兄弟輟學創業，盯上Sora弱點，3個月融資2900萬

智東西 2026-01-04 18:09:55
1 跟貼 1

NUS邵林團隊提出T(R,O) Grasp：刷新跨智能體靈巧抓取SOTA

機器之心Pro 2026-04-13 13:17:37
0 跟貼 0
“不確定性”的終極集約：從神學盲盒到算法獵場

鈦媒體APP 2026-04-13 14:53:50
0 跟貼 0

斷腿也能跑！97小伙研發樂高式機器人，斷臂秒變三腳怪獸繼續狂奔

DeepTech深科技 2026-04-13 13:07:42
0 跟貼 0

30年數學懸案，Claude一小時破解，88歲圖靈獎得主震驚

量子位 2026-03-07 20:19:13
0 跟貼 0
護士都得懂點推理，聽完患者的話護士秒懂，原來是饞蟲作祟！

歡樂生產地 2026-04-11 14:59:47
1 跟貼 1

8個月前AI就知道他要殺人！ChatGPT員工爭論了很久，選擇沉默… 最后8個生命消失在這座小鎮

英國那些事兒 2026-02-22 22:49:40
1754 跟貼 1754
ColaVLA：自動駕駛大模型，不一定非要把「思考過程」寫成文字

機器之心Pro 2026-04-03 12:48:20
1 跟貼 1
擠干大模型高分水分!最強模型僅49分,南大傅朝友發布Video-MME-v2

機器之心Pro 2026-04-13 10:12:23
0 跟貼 0
程序員用ChatGPT給狗設計疫苗，腫瘤真的縮小了，科學家都服了

DeepTech深科技 2026-03-15 18:11:33
0 跟貼 0
人類首例“被恐龍咬傷事件”！男子把頭伸進恐龍模型里被卡住，當事人：沒想到它會不松口大家別跟我學 #

開屏新聞客戶端 2026-04-11 18:04:45
12 跟貼 12
ChatGPT：再見「破折號」

機器之心Pro 2025-11-17 14:10:18
0 跟貼 0
「ChatGPT說我在浪費生命，但它錯了」，WhatsApp前產品掌門人的清醒反擊

36氪 2025-11-27 11:59:07
0 跟貼 0
OpenAI慘遭反超！Anthropic狂吞70%新客戶，Claude已開啟「靈魂校準」

新智元 2026-04-12 15:33:49
93 跟貼 93
國內首個！加入六維力的全感知數采，讓VLA模型進化出力觸覺

機器之心Pro 2026-04-13 14:16:50
1 跟貼 1
120W是“型號”不是功率？誤導消費者要付出代價

南方都市報 2026-04-13 00:36:10
2822 跟貼 2822
機器人也懂人情世故，好處不到位就罷工，讓人欲哭無淚！

生活杰杰樂 2026-04-11 16:13:50
1 跟貼 1
CVPR 2026 | 從視覺Token內在變化量出發，實現VLM無損加速1.87倍

機器之心Pro 2026-03-16 11:56:33
0 跟貼 0
AI的盡頭是神學：60歲硅谷前高管神父重寫Claude靈魂，拒五角大樓軍用

新智元 2026-04-11 12:18:53
35 跟貼 35
僅憑一個細節就能破案，這推理能力太絕了，真相背后大有文章

尚悅電影 2026-04-09 11:00:40
1 跟貼 1
純手工打造！外媒盛贊《影之刃零》“行業清流”

游民星空 2026-04-12 19:25:25
6 跟貼 6
20小時心理評估揭示Claude AI模型人格特征：好奇與焦慮并存

IT之家 2026-04-10 10:02:36
2 跟貼 2
外國人在中國用手勢比劃點餐，全障礙語言但無障礙溝通。網友：中文含量0%，溝通效率100%

中國日報網 2026-04-12 18:40:25
141 跟貼 141
真正的全海鮮宴，看到上菜方式不淡定，真的不怕腥嗎！

鴨嘴愛搞笑 2026-04-12 10:57:31
1 跟貼 1
非洲哪個國家最適合中國人工作？我待過5個國家后，終于有了答案

駐外之家 2026-04-13 14:34:40
0 跟貼 0
ICLR 2026｜隱式思考模型LRT：「隱式思維鏈」推理，更快更強！

機器之心Pro 2026-04-13 12:37:25
0 跟貼 0
大模型的下半場，屬于擁有云+AI全棧引擎的玩家

量子位 2026-01-30 03:29:45
0 跟貼 0
朋友圈刷屏的SBTI測試出自“抽象”區女博主：初衷是勸朋友戒酒，曾把ChatGPT當“電子老公”

極目新聞 2026-04-10 11:36:17
1 跟貼 1
馬龍VS喬丹！誰才是真正的MVP？

白嫖的小知識 2026-04-13 10:21:17
5 跟貼 5
李飛飛新世界模型來了！實測一張照片生成3D末日安全屋

量子位 2026-04-10 19:24:43
0 跟貼 0
Vidu Q3 悶聲放大招，參考生之王回歸，漫劇短劇影視廣告的好日子來了

愛范兒 2026-04-13 12:20:24
0 跟貼 0
百度副總裁石清華：汽車產業正邁入“全量推理時代”

中國青年報 2026-04-12 13:58:55
0 跟貼 0
4小時規則實測：我讓ChatGPT接管了一周工作日，產出反而漲了

賽博蘭博 2026-04-09 15:47:40
0 跟貼 0
李飛飛的世界模型公司融資10億，估值50億

量子位 2026-02-20 23:27:02
0 跟貼 0
拒絕智能手機，炮轟ChatGPT，沒有他就沒有今天的互聯網

DeepTech深科技 2025-12-26 18:07:26
35 跟貼 35
當IT男決定不讓他狗去死：ChatGPT全程輔助尋找靶點設計癌癥疫苗！奇跡出現了

英國那些事兒 2026-03-15 23:05:04
0 跟貼 0
第2課慧凈電子HL-Car STM32全功能智能小車主板銅柱安裝

星慈光 2026-04-11 17:45:33
0 跟貼 0
組裝川崎忍者模型套件

制造科技 2026-04-09 19:07:20
41 跟貼 41

手機 / 數碼

房產 / 家居

李飛飛一篇論文，ChatGPT、Claude全部是”智障”

傳榮耀與字節跳動接洽“豆包手機”合作

女子名下多出一套上海房產很苦惱：丈夫去世 房子沒了

女子名下多出一套上海房產很苦惱：丈夫去世 房子沒了

一支球隊不夠爛，也是一種悲哀

賈玲減重后現身馮鞏生日宴 身材未反彈

起底AI"造黃"灰產：19.9元"一鍵脫衣"

不止命名更純粹 領克10/10+要做純電操控新王

態度原創

郭碧婷傳授備孕經驗，二胎順轉剖后，整個人廢了，尤其是肢體上

高管親自放風 何剛暗示華為 WATCH FIT 5 Pro即將發布

22位中國當代名家油畫作品

洛陽國際牡丹園“混血”黑牡丹——水墨丹青迎來最佳觀賞期

2025高考數學第一題，平均數？小學生也會

女子名下多出一套上海房產很苦惱：丈夫去世房子沒了

女子名下多出一套上海房產很苦惱：丈夫去世房子沒了

賈玲減重后現身馮鞏生日宴身材未反彈

不止命名更純粹領克10/10+要做純電操控新王

高管親自放風何剛暗示華為 WATCH FIT 5 Pro即將發布