<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>

色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3

<abbr id="zwway"></abbr>

<dfn id="zwway"><menu id="zwway"></menu></dfn>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

陶哲軒親測Claude跑崩電腦，全靠這份保姆級指令清單翻盤

2026-03-11 01:37:25　來源: 新智元

北京舉報

0

分享至

新智元報道

編輯：元宇

【新智元導讀】從電腦崩潰到半小時拿下Lean形式化證明，數學大神陶哲軒用親身踩坑經歷警告：AI越強大，人類越不能偷懶，應時刻保持「人類在環」的絕對清醒。

連跑45分鐘，燒光Token，最后電腦直接死機。

你可能很難想象，這竟是全球頂尖數學家陶哲軒在實測最新AI編程工具時，遭遇的一次真實翻車現場。

九個月前，他曾在一個視頻中向大家展示如何將一段復雜的數學證明形式化。

九個月后，面對被業界瘋狂追捧的新一代AI助手Claude Code，他本以為這會是一場降維打擊。

沒想到，第一次完全放權給AI，不僅沒有完成數學證明，還把自己的電腦搞崩潰了。

在接到一句宏大的指令后，AI陷入了瘋狂的回溯與試錯，狂跑了45分鐘，不僅沒寫出一行可用代碼，龐大的計算過載還把電腦弄死機了。

眼下整個科技圈都在狂熱地討論AI智能體。

仿佛只要隨手拋出一句話，AI就能替你打理好全部工作。陶哲軒這場硬核實測，卻像一劑清醒劑，終結了這種技術幻覺：

即使面對再強大的AI，人類也不能完全「關掉大腦」。

保持參與，才是最好的使用AI的方式。

「一波流」幻想破滅

AI智能體的「過載陷阱」

故事要從九個月前說起。

在當時的Equations of Theories項目里，為了證明等式1689能夠推導出等式2（即singleton law），陶哲軒使用GitHub Copilot和一個名叫conical的輔助工具，靠著人類的智慧和輕度的AI輔助，一步步手動完成了證明的形式化。

如今，全面升級的智能體來了。

由于對AI的過度信任，陶哲軒在第一次嘗試Claude時進入了一個極其普遍的誤區，他給Claude下達了一個大而籠統的指令：「請把整個事情都做完。」

他原本以為，AI會自動拆解任務、理清邏輯、輸出完美代碼。

然而這句不加限制的指令，直接觸發了機器的「過載陷阱」。面對復雜的邏輯鏈條，Claude在底層引理的證明泥潭里迷失了方向。

它花了大把時間去猜測該怎么做，接著犯錯，然后瘋狂回溯、推倒重做。

就這樣，在燒掉大量Token之后，AI狂跑了整整45分鐘仍然一無所獲。而且，龐大的計算壓力，也讓陶哲軒的電腦崩潰了。

事實證明，當人類下達給AI的任務指令缺乏清晰邊界時，AI的勤奮只會像無頭蒼蠅式的亂撞，最終演變成一場徒勞無益的消耗。

這次慘痛的教訓，也戳破了當下人們對AI的一個幻覺：認為有了智能體，自己就可以當「甩手掌柜」了。

「保姆級」指令的勝利

真正的轉折，發生在第二次和第三次嘗試里。

第二次，其實已經成功了。

陶哲軒把任務拆開，不再要求Claude Code一次完成全部證明，而是先形式化引理1、引理2、引理3，再逐步把證明補進去。

最后大約用了25分鐘，完整證明做出來了。

在第三次，他還摸索出了一套防AI「暴走」的干貨步驟，核心秘訣，就是專門建一個Markdown文件，把所有指令按步驟寫清楚，再交給Claude Code執行。

只是這次他并沒這么做，而是把這些步驟直接寫進Lean文件的注釋里。

這套流程的精髓，不在于復雜，而在于克制。

第零步，先形式化S和F這兩個記號。先把符號系統立住，別急著證明。

第一步，創建證明骨架。把引理1、引理2、引理3的陳述都形式化出來，但這個階段嚴禁AI嘗試證明，一律用「sorry」占位。

這一步看似保守，實際上非常高明。因為他已經從第一次失敗里看明白了：

一旦讓Claude Code過早進入「我要把它證出來」的狀態，它就會在證明細節里瘋狂打轉，反復試、反復錯、反復回退，最后什么都做不完。

與其讓它一上來就沖刺，不如先讓它把結構搭好。

然后才是第二步：把非形式化證明里的每一行，逐行轉成Lean代碼。

理由先不補，能用「sorry」的地方先用「sorry」。

這個動作特別像搭腳手架。先把房子的梁柱立起來，再慢慢砌墻，而不是抱著一堆磚頭就想直接蓋完。

也是在這里，陶哲軒點出了Claude Code一個很有意思的弱點：它在最底層、最機械的步驟上，反而容易「想太多」。

本來人類可能覺得「這一步一兩行就該結束了」，它卻會繞出更長的路徑。

在陶哲軒的第一次嘗試時，AI甚至不愿意沿用S和F這些簡寫，而是把式子不斷展開，導致證明越來越難讀。

這正是很多人今天會誤判AI的地方。

你以為它最擅長的是細活，它偏偏會在最該老實執行的時候，突然開始「發揮創造力」。

而在形式化證明這類任務中，過度發揮，往往不是加分項，反而可能是事故源頭。

在這套「保姆級」指令的約束下，Claude終于不再像脫韁的野馬。它老老實實地跟著人類給定的證明，幾秒鐘就吐出了規整的代碼框架。

「人機并行協作」

你做你的填空，我修我的Bug

真正讓這次實踐變得好看的，是中間那段非常絲滑的人機配合感。

做到一半，電腦又崩了一次。

但這一次，崩潰沒有毀掉進度。

原因很簡單：因為任務已經被拆成了一段一段的小步驟，所以恢復起來并不痛苦。

分步推進，不只是為了防止AI暴走，也是為了人類后期修改方便。

更精彩的戲碼是在修Bug階段。

在填補細節時，Claude卡在了某個底層步驟上。陶哲軒發現，AI把記號SA展開了兩次，而實際上只需展開一次。

面對這個邏輯死結，AI試圖換一種極其復雜的思路去繞過它，甚至給出了一段冗長代碼。

這個時候，人類的作用顯現了。

陶哲軒果斷出手，他調出Info View面板，親自接管了這行邏輯。

面對多余的展開項，他直接使用congruence（消掉同類項），瞬間清空了報錯信息。連他自己都忍不住感慨：「這也太強了，居然直接就成了。」

隨后，他又意識到，這里其實可以把H1抽出來，單獨作為一個關鍵方程引理，因為后面兩個地方都能復用它。

此時，全場高潮的「人機結對編程」畫面出現了。

當陶哲軒在前方手動修復復雜邏輯、提取引理時，Claude Code根本沒有閑著。

它在后臺默默同步，聰明地把過去代碼里的H1替換成了一行簡練的證明，并自動給后續的引理三搭好了骨架。

這才是這次實驗最舒服的一幕：不是你命令，我執行；也不是你放手，我亂跑；而是兩者在同一個代碼庫里獨立運轉，互不干擾卻又完美配合。

像一場真正的結對編程，只不過你的搭檔，不是另一個人類，而是一個需要被約束、但又確實能干活的智能體。

拒絕「多智能體焦慮」

要把手放在方向盤上

最后，這份證明完成了。

總耗時大約半小時，里面還算上了一次系統崩潰。對比第一次45分鐘空轉到電腦死機，這個結果已經足夠說明問題。

但在復盤階段，這位數學大神給出的，不是某種神話式結論，而是一種很清醒的技術態度。

他顯然看到了自動化的誘惑。

Claude Code足夠強，大多數人很容易生出一種沖動：干脆讓它全包，我少操點心。

可問題在于，一旦你真這么做，它很可能直接扔掉你原本已經很好的非形式化思路，按它自己的方式重寫一遍。

結果，就是代碼變得晦澀難懂，一旦跑不通，你連調試都無從下手。

他還順手吐槽了當下很流行的一種趨勢：

讓多個智能體同時跑，再用另一個智能體去管理前面那幾個智能體。

理論上當然可以。

可至少在這次任務里，他已經對單個、聽話、受控的Agent非常滿意了。再往上疊，不一定是效率提升，也可能只是另一種形式的復雜化焦慮。

此外，在這場技術洪流中，人類必須保持參與感。

最頂級的AI工作流，不是關掉大腦，而是始終把手放在方向盤上。

因為一旦完全依賴工具，出了問題，你能做的往往只剩下一遍遍重新調用，像是在對一個黑箱許愿。

而當你把「人類在環」這件事堅持到底，局面就完全不同了。

這時候，AI不是替你思考的大腦，而是你手里那把越來越鋒利的劍。真正決定它往哪兒揮的人，仍然還得是你。

參考資料：

https://mathstodon.xyz/@tao/116190707979654536%20

https://github.com/teorth/analysis/blob/main/analysis/Analysis/Misc/equational.lean%20

https://www.youtube.com/watch?v=JHEO7cplfk8

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

Jeff Dean新訪談：未來開發者人均50個智能體，寫需求成核心技能

量子位 2026-03-10 15:12:54
0 跟貼 0
Karpathy Vibe Coding整新活：Agent版「GitHub」問世

機器之心Pro 2026-03-10 16:29:28
2 跟貼 2

arXiv創始人親測：水論文這一塊，Grok最強，Claude最不配合

量子位 2026-03-09 12:29:21
1 跟貼 1

17歲高中生用AI解決數學界難題，陶哲軒、Jeff Dean點贊

機器之心Pro 2026-01-26 14:24:45
0 跟貼 0
MiniMax來承包你的桌面了-4

機器之心Pro 2026-01-20 20:19:42
0 跟貼 0

陶哲軒：AI看似在推理，其實是在背答案

量子位 2026-01-05 09:20:21
0 跟貼 0

支持遠程操控和通用GUI操作3

機器之心Pro 2026-03-02 13:36:13
0 跟貼 0
三維空間太難懂？2

機器之心Pro 2025-12-31 13:49:19
0 跟貼 0

谷歌發布首個原生多模態嵌入模型Gemini Embedding 2

華爾街見聞官方 2026-03-11 07:36:19
0 跟貼 0
QClaw指令發紅包？微信員工緊急回應：假的！

雷科技 2026-03-10 23:03:19
0 跟貼 0
10個月完整配置經驗全公開，冠軍咋用Claude Code?

機器之心Pro 2026-01-22 12:34:29
0 跟貼 0
陶哲軒用Claude Code解題，兩度宕機，因為token不夠用

DeepTech深科技 2026-03-09 18:31:36
0 跟貼 0
深度剖析東大對薩德問題態度轉變的內在邏輯，一起來聽聽

八極拳兌一 2026-03-10 03:48:51
2 跟貼 2
AReaL v1.0開源，智能體強化學習「一鍵接入」

機器之心Pro 2026-03-05 14:46:18
0 跟貼 0
3B打32B？海外病毒式傳播的小模型，竟然來自BOSS直聘

機器之心Pro 2026-03-09 14:09:17
2 跟貼 2
突發！微信絕密「龍蝦」爆出，14億用戶體驗或將顛覆

新智元 2026-03-11 01:36:21
0 跟貼 0
太瘋狂了！“龍蝦”紅透A股，OpenClaw連更兩日，32款養蝦大模型集結，創始人在線打假

智東西 2026-03-10 15:03:30
13 跟貼 13
德黑蘭市區再遭密集轟炸有戰機轟鳴

新華社 2026-03-10 10:39:14
12056 跟貼 12056
倆法國小伙辭職走路到中國:耗時2年走出新疆花了45天

新民周刊 2026-03-10 16:44:38
4350 跟貼 4350
大風315 | 游客稱飛3000公里在西雙版納一景區游玩，因明星錄制綜藝節目被清場；景區：具體情況需由游客回應

大風新聞 2026-03-09 17:06:09
6995 跟貼 6995
不僅卸載了QQ，還砸了電腦！

愛豆觀影 2026-03-10 10:21:40
1 跟貼 1
88歲圖靈獎得主，用Claude一小時破解30年數學懸案

量子位 2026-03-09 12:48:02
1 跟貼 1
學 C# 上位機的同學！按鈕點擊代碼你看懂了嗎？

華山自控編程 2026-03-08 19:30:00
0 跟貼 0
廣場舞伴日常相處，美女發出指令讓大爺心急，欲擒故縱拿捏住了！

小軒搞笑街坊 2026-03-07 09:32:26
1 跟貼 1
陳寶國坦言不玩電腦，李靜：不怕被時代淘汰？

EduStar教星派 2026-03-08 10:04:20
2 跟貼 2
未來10年，這3個崗位一定會越來越吃香，年入20萬起

李舟 2026-03-09 18:54:52
0 跟貼 0
男人開車沒有剮蹭過，背個電腦就有劃痕，網友：這車花里胡哨的！

小妹愛搞笑呢 2026-03-09 14:22:27
1 跟貼 1
PackingStar雙智能體博弈，攻克14維難題

量子位 2026-02-16 13:12:43
0 跟貼 0
哪個模型最適合養蝦？OpenClaw之父推薦PinchBench

量子位 2026-03-11 04:46:25
0 跟貼 0
離開美國！世界知名數學家萬大慶回國，加入一985高校！

凱旋學長 2026-03-10 15:11:08
0 跟貼 0
龍蝦更新后記憶變強，如何養好AI龍蝦？

機器之心Pro 2026-03-09 19:10:43
0 跟貼 0
Claude Code之父，推特親傳使用技巧，超 500 萬人關注

機器之心Pro 2026-01-05 13:26:18
0 跟貼 0
爆火！把智能體當游戲角色來玩，一個人就是一個公司

機器之心Pro 2026-02-12 18:04:44
0 跟貼 0
杭州蕭山“養龍蝦”十條來了，算力補貼最高2000萬

新浪財經 2026-03-11 00:07:11
0 跟貼 0
開源鴻蒙重寫世界，從一行微小的代碼開始

量子位 2025-12-31 01:50:02
0 跟貼 0
中國成品油價迎四年來最大漲幅

環球網資訊 2026-03-10 09:34:47
5393 跟貼 5393
女子在杭州西湖景區把“西泠印社”認成“杜帥冷面”，網友：四個字認錯五個，當事人：沒有文化確實不行

揚子晚報 2026-03-06 17:44:56
997 跟貼 997
如果美國拿下伊朗，下一個會是誰？答案跟很多人想的不一樣

聚焦光輝與陰暗 2026-03-11 06:10:44
1 跟貼 1
“見過搶米搶面，沒見過搶塑料”，中東開戰，東莞一個小鎮大堵車！貿易商：潑天的富貴來了，干嘛不抓住？業內提醒：只是虛假繁榮

每日經濟新聞 2026-03-10 21:06:07
64 跟貼 64
全網售罄、多地斷貨！老板懵了：以前堆成山都賣不掉，結果現在價格暴漲

掌上春城 2026-03-10 20:24:37
6 跟貼 6

楊瀾參加車展，全程被冷落無人在意，丈夫吳征大腹便便不正眼看她

楊瀾參加車展，全程被冷落無人在意，丈夫吳征大腹便便不正眼看她

法老不說教

2026-03-10 18:08:15

美容院老板娘大實話：脫了衣服，女人的差距根本不在臉上！

美容院老板娘大實話：脫了衣服，女人的差距根本不在臉上！

夜深愛雜談

2026-03-08 21:28:24

別被文化同化騙了，漢族能延續幾千年，靠的從來不是講道理

別被文化同化騙了，漢族能延續幾千年，靠的從來不是講道理

掠影后有感

2026-03-09 09:52:38

看了沙特的海水淡化技術，再看中國海水淡化技術，才懂差距有多大

看了沙特的海水淡化技術，再看中國海水淡化技術，才懂差距有多大

完善法

2026-03-10 18:26:19

“活不起了？”男子橫幅威脅引發熱議，真相令人震驚！

“活不起了？”男子橫幅威脅引發熱議，真相令人震驚！

一絲不茍的法律人

2026-03-10 12:45:20

90后常德小伙歷時8天從伊朗回到湖南：此前赴死的心都有了，和平真好

90后常德小伙歷時8天從伊朗回到湖南：此前赴死的心都有了，和平真好

瀟湘晨報

2026-03-10 19:14:12

有沒有人敢爆自己的瓜？網友：確定玩這么大嗎？

有沒有人敢爆自己的瓜？網友：確定玩這么大嗎？

夜深愛雜談

2026-02-18 20:55:58

12年前，那個美國抓捕未果，入籍俄羅斯的斯諾登，如今過得怎樣？

12年前，那個美國抓捕未果，入籍俄羅斯的斯諾登，如今過得怎樣？

就一點

2026-03-08 23:09:47

要分手了！東契奇未婚妻向法院提交申請要求支付兩位孩子撫養費

要分手了！東契奇未婚妻向法院提交申請要求支付兩位孩子撫養費

羅說NBA

2026-03-11 06:09:37

古巴連續六十小時停電，民眾敲鍋抗議

古巴連續六十小時停電，民眾敲鍋抗議

昊軒看世界

2026-03-10 09:36:21

關于和伊朗談判，特朗普最新表態！

關于和伊朗談判，特朗普最新表態！

每日經濟新聞

2026-03-10 21:15:06

一場足球賽，帶來24萬億的性交易額，為何韓國會淪落到這個地步？

一場足球賽，帶來24萬億的性交易額，為何韓國會淪落到這個地步？

嘆為觀止易

2026-03-10 21:16:46

上海這夜！瘦到認不出的蔣欣大氣優雅的吳越敗給兩個70歲老太太

上海這夜！瘦到認不出的蔣欣大氣優雅的吳越敗給兩個70歲老太太

阿纂看事

2026-03-09 18:55:52

谷愛凌把米蘭冬奧會全部獎金796萬自己4萬，一共800萬全部捐出去

谷愛凌把米蘭冬奧會全部獎金796萬自己4萬，一共800萬全部捐出去

離離言幾許

2026-03-09 22:43:32

俄羅斯：駐伊朗一總領館遭空襲波及要求保障外交人員安全

俄羅斯：駐伊朗一總領館遭空襲波及要求保障外交人員安全

海外網

2026-03-11 07:22:12

楊冪視后夢碎了？《生萬物》除女主之外全員拿獎，秦海璐缺席都有

楊冪視后夢碎了？《生萬物》除女主之外全員拿獎，秦海璐缺席都有

萌神木木

2026-03-10 11:58:28

“跳梁小丑”降央卓瑪跌落神壇，不會被世界寬容，名譽徹底崩塌

“跳梁小丑”降央卓瑪跌落神壇，不會被世界寬容，名譽徹底崩塌

吃青菜長高

2026-03-10 23:10:30

虧損超3.5億，請來內娛頂流明星也沒用，春節檔最大票房慘案誕生

虧損超3.5億，請來內娛頂流明星也沒用，春節檔最大票房慘案誕生

喵喵娛樂團

2026-03-09 16:07:26

巴拿馬遭索賠140億，中方終于騰出手來，港口事件不能就這么算了

巴拿馬遭索賠140億，中方終于騰出手來，港口事件不能就這么算了

王裕慶

2026-03-10 19:02:13

巴黎兩回合歐冠淘汰賽5連勝，連續3次淘汰英格蘭球隊

巴黎兩回合歐冠淘汰賽5連勝，連續3次淘汰英格蘭球隊

懂球帝

2026-03-11 02:16:30

AI產業主平臺領航智能+時代

14689文章數 66681關注度

往期回顧全部

科技要聞

蔚來今年要少虧150億，沖擊年度盈利

頭條要聞

"一對老夫妻雙雙129歲相戀100年"視頻引熱議當地回應

頭條要聞

"一對老夫妻雙雙129歲相戀100年"視頻引熱議當地回應

體育要聞

加蘭沒那么差，但鱸魚會用嗎？

娛樂要聞

《逐玉》注水風波升級！315評論區淪陷

財經要聞

“龍蝦補貼”密集出爐最高1000萬！

汽車要聞

MG4有SUV衍生上汽乘用車多款新車規劃曝光

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

家居

本地

游戲

公開課

軍事航空

家居要聞

自然肌理溫度質感婚房

獨棟獨院精致親子墅
暖棕撞色輕法奶油風
奶白柔境閑臥享時光

本地新聞

云游中國｜候鳥高顏值亮相！沉浸式打卡青海濕地

卡普空推出《生化危機9》主視覺服裝售價26美元起

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
古代的馬真能日行八百里嗎
李彥宏：百度離破產30天

軍事要聞

剛說完戰爭很快結束特朗普改口

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

<em id="yvnjn"></em>

<pre id="yvnjn"><tfoot id="yvnjn"></tfoot></pre>

<meter id="yvnjn"><td id="yvnjn"></td></meter>