![]()
這幾周,其實我給自己的大腦放了一些假期。我在前幾篇文章里提到過:當你非常密集地與 AI 交互,而且還是多語種(中文、英文)、多語言模式(編程、形式化語言)的高密度交互之后,會明顯感受到一種信息過大、信息漂移的狀態,一種身心上的沖擊和疲憊。
我意識到我必須切換一下,給自己換一個想法,換一件事情做。人一旦鉆進牛角尖,是很難產生好的創意的。
所以我打算認真研究一下這段時間我非常在意的一個人:Stephen Wolfram。為什么是他?因為我突然意識到,Stephen Wolfram 可能是過去二十多年里,唯一一個一直在談科學“范式轉移”的人。他的書名本身就叫The New Kind of Science
最近我剛在網上買了這本書。其實在此之前,我已經接觸過 Stephen Wolfram:他的元胞機研究、Mathematica,以及他反復提到的概念——計算不可約性、Ruliology(這是他自己造的詞)。但說實話,我一直沒有真正看懂他,也沒有真正理解他,更沒有深入下去。這些概念在當時并沒有在底層邏輯上擊中我,沒有讓我產生那種“我愿意非常嚴肅地投入自己寶貴的時間和腦力去弄懂他”的沖動。
我以前也提到過 Kuhn 的《科學革命的結構》,這本書這幾年在我心里的重要性一直在上升。但真正讓“范式轉移”成為我這一代人普遍討論話題的,其實是 2022–2023 年 AI 的商業化。而 Stephen Wolfram 很早就認定了這一現實,并且在他大量的文章中反復闡述過這一點——其中不少文章寫于 2005 年、2012 年,距今已經十多年了。
借這篇文章,我想分享一下我是如何重新嘗試理解他的。我想站在他的角度,去理解“計算不可約性”,去體會他的思維方式;同時借助 AI 查找相關論文。恰好我手邊還有一個朋友從中國帶來的兒童玩具——一臺密碼機。
這臺密碼機背后,其實隱藏著一個 NP-complete 問題。我想從 Wolfram 的全新視角和語言觀出發,去研究和理解這個復雜度問題。尤其是在這幾個月高強度寫作的過程中,我常常會想起維特根斯坦關于語言與世界關系的那些話。只有當你完全接受了一種語言體系,你其實獲得了一種全新的世界觀和看問題的角度。
Wolfram從the New Kind of Science 成書那一天開始,就飽受學術共同體的極大爭議
也幸虧他是商業/企業科學家,基本完全自費,繞過了傳統的學術體系和發表體系,也不需要靠學術共同體活著。這一點其實讓我本人非常關注一類和他相似的人——企業科學家。比如Elon Musk,美國國家工程院院士,但他同樣不混學術界。
正因為他們不依賴學術體系生存,反而是真正“有實力”的科學家,所以他們對學術界的評價和批評,往往非常值得一看。尤其是在今天這個時代:大學高校論文大量灌水,職稱體系的意義本身開始變得可疑,大學正在被 AI 逐步侵蝕知識解釋權;再加上以美國為首的政府開始削減學術經費,公開質疑學術系統的現實價值——在這樣的背景下,這種來自體系外的視角,本身就是一種很好的平衡。
話不多說,我直接給你看幾篇文章。
這是對 Wolfram 的一篇重要批評,來自數學共同體——美國數學學會American Mathematical Society旗下的Bulletin of the AMS,是一篇正式的書評。文章對他的具體論證方式、表述的嚴密性,以及與既有文獻脈絡之間的關系,提出了不少批評,比如:有些解釋“說不清楚 / 不成體系 / 缺乏可檢驗的細節”。
在復雜系統和統計物理相關的圈子里,最尖銳的一類批評則集中在一句話上:“新瓶裝舊酒 + 過度宣稱”。核心觀點是認為 Wolfram 把復雜系統和計算理論中已經存在的很多思想重新包裝了一遍,然后通過非常強的敘事方式宣稱“范式躍遷”,但在對既有研究的承認和歸功方式上存在問題。這一類批評中,比較有代表性的聲音來自Cosma Shalizi
在這里我并不想討論誰對誰錯。因為無論是 Wolfram,還是這些寫下批評的學者,他們的學識都遠遠高于我。
但我讀完這些批評之后,尤其是這幾個月我因為刻意練習寫作,積累了不少中英文的語言語感,我有兩個非常強烈的直觀感受:
第一,Wolfram 和這些批評者,從語言體系上看,根本就不在同一個系統里。不是觀點分歧,而是語言協議不同,幾乎是一種“雞同鴨講”的狀態(我們廣東人常說的,倆都在自說自話,無效溝通)。
第二,這些批評文本里帶有非常明顯的情緒。你幾乎不需要太仔細分析,就能讀出一種“不滿”的情緒。這一點對一個自我標榜為理性、冷靜的科學家群體來說,其實是挺奇怪的。
后來我慢慢也體會到了這一點。AI 時代到來之后,很多人被指責為“民科”的感覺,其實是非常相似的——泛指那些沒有教授頭銜、卻在認真做科學問題的人。
“好吧。”
我只能說,如果是在 AI 時代,我寧愿混成 Wolfram 這種超級富翁型民科,也比現在那些向上要不到經費、職業前景朝不保夕的教授和講師來得更實在一些。
Wolfram怎么回答?他在13年前,就已經親身經歷了范式轉移對他的個人沖擊,而且非常有條理的跟你描述了出來。
要說他是“民科”….那就真的是可笑了。
我們現在引用他本人在2012年的文章,來看看他如何描述這種沖擊的。因為他其實早就脫離學術界了,我認為在1987年他開始做軟件的時候,他本人應該就有這個傾向。后來他不發論文,他自己也在此文有具體的描述,總的來說就是論文套格式,形式大于實質,而他的科學”真材實料“實質實在太多了,論文發不過來。他寧愿發博客。所以我現在理解他的想法,就是看他的本人的博客,Stephen Wolfram writings.
他為什么堅持:這是“范式轉移”
他談及對他的評論,大部分學者是一種情緒強度異常的學術現場:
“You’re destroying the heritage of mathematics…”
我就說這些批評者都是很強情緒的,對于一個學者來說,為什么要發脾氣?你會對一個非嚴肅科學,比如撒滿巫師,瑜伽師提出的科學發脾氣嗎?不會,因為你不會去理他。
Wolfram的回答是:
this is what a paradigm shift sounds like—up close and personal.”
范式轉移首先不是新結論,而是新評價體系
所以對方的情緒不是因為某個定理被推翻,而是因為:
- 舊的“何為科學”的標準被威脅了(論文、審稿、引用、學術網絡)
- 舊的“職業人生投資”被威脅了(幾十年的訓練路徑和聲望資本可能失效)
他后面把這種深層原因說得非常赤裸,甚至分成兩類“核心受威脅群體”。
他明確區分“surface reason / deeper reason”。
“there was a surface reason… and a deeper reason.”
A. 內容層面的兩類恐懼(這就是范式沖突的“職業學”內核)
第一類(多為物理學家):
“we’ve spent our whole careers barking up the wrong tree”.
這句話的含義是:如果 NKS 的計算視角成立,那些人不是“錯了一點”,而是整個科研投資方向可能被判定為低收益路徑
這就是 Kuhn 式范式轉移里最常見的:舊范式的成功指標,在新范式里不再值錢
第二類(復雜性研究相關的人):
“it’ll overshadow everything we’ve done”.
這不是“真假焦慮”,這是注意力與權威結構焦慮:誰來定義主敘事,誰就擁有學科入口、教材、基金評審的話語權。
形式層面的沖突:你做了“academic-like”,但不按“academic rules”
“academic-like, but you haven’t played by academic rules.”
這里的潛臺詞是:學術界有一套“合法性協議棧”,包括:
- peer review 作為準入
- references 作為關系網可見性
- 大出版社/期刊體系作為分發渠道
- 學術身份作為話語資格
而 Wolfram 的路線是:我把這套協議棧繞過去了。所以你會看到他強調:
- 我不是 academic,我不受它約束:
“I wasn’t an academic…”
這其實就是他這篇文章的核心沖突:新范式 + 新分發/驗證機制,對舊系統是雙重威脅。
他寫書和博客….
具體內容可以去看他的原文。
我們這里也不再展開。
Khun Loss
我說一下Khun 庫恩,哪怕他那本科學革命的結構這本書快成書一個世紀,還真的是精準的預言了我們這篇文章寫到現在,這個時間點的精確過度觀點。我真的忍不住要引用一下。具體內容還是要看SEP原文,鏈接我也貼出來了。
一次范式革命不只是“多解決了一些問題”,它也會“丟掉(甚至宣布不合法)一些舊范式曾經非常看重、并且在舊標準下算是成功的問題/解釋”。
這種“丟掉的解釋能力/問題集/評價標準”,就是 Kuhn loss。
它是 Kuhn 用來打掉“科學進步 = 累積式逼近真理”的關鍵楔子之一。
1) 到底“丟”了什么
- 問題集改變:什么算“重要問題”變了
- 標準改變:什么算“合格解釋/好科學”變了
- 概念與世界圖景改變:同一個詞在兩個范式里指向的東西、允許說的話、能表達的句子集合都變了
所以 Kuhn loss 不只是“少了一個推導”,而是更像:
- 舊范式里“必須解釋”的東西,在新范式里變成了
- “不需要解釋”、
- “沒意義”、
- “形而上學”、
- 甚至“偽問題”。
這就是他為什么說革命會改變“科學的定義”。
2) 詞條里的經典例子:牛頓為何“沒解釋力”,卻贏了
SEP 用的例子很 Kuhn:
- 亞里士多德/笛卡爾的力學傳統里:
- “吸引力如何可能?”是硬指標(你必須給出接觸機制/本體論解釋)。
- 牛頓的萬有引力在當時看起來像“隔空作用”,在舊標準下是不合格的,所以會被拒絕。
但一旦牛頓范式勝出,新共同體會把這類問題從科學議程里踢出去(說它“不合法/不科學”)。
這就是 Kuhn loss:你從舊范式的評分表看,新范式“解釋力變差了”;但從新范式的評分表看,這題根本“不該做”。
然后 SEP 也補了一刀:這個問題后來在廣義相對論的框架下以另一種方式“重新出現并得到處理”。這更能體現 Kuhn 的意思:不是直線累積,而是議程反復改寫。
3) Kuhn loss 和“不可通約”是什么關系
你可以把 Kuhn loss 看成不可通約(incommensurability)的一個可觀察癥狀
不可通約在 Kuhn 這里不是“完全不可比較”,而是:
- 沒有共同度量:因為兩邊在用不同的概念網、不同的問題清單、不同的評價標準。
- 因此你沒法用同一個“統一指標”說:A 比 B 更接近真理、或“總體更好”。
Kuhn loss 就是告訴你:
即使新范式在某些方面更強,它也可能在舊范式曾經擅長的維度上更弱——但“更弱”這件事本身是否成立,取決于你站在哪個范式的度量體系里。
4) 為什么 Kuhn loss 對“科學理性”構成刺激
這就是當年 Kuhn/Feyerabend 被罵“反科學”的原因之一:
- 如果革命會改寫問題與標準,那“理性比較”是不是變成了政治斗爭?
- 如果舊成功會被新范式宣布不合法,那科學是不是不再“逼近真理”?
SEP 也強調了 Kuhn 后來的澄清:
不可通約 ≠ 不可比較;Kuhn loss ≠ 非理性。
Kuhn 的立場更像:
- 范式選擇沒有“中立算法”,但仍可用一組價值(accuracy/scope/simplicity/fruitfulness…)來做“有理由的爭論”;
- 不同人對這些價值的權重不同 → 允許“理性分歧”。
又回到了廣東人的那句俗語:雞同鴨講,是不是變得更貼切了?
https://plato.stanford.edu/archives/fall2019/entries/incommensurability/#RevParThoKuhInc
我隨手拿了一個decoder/mastermind玩具來體驗不可約
真的是因為我想到這一點的時候,這個玩具剛好就在我書桌上而已。
一個看似簡單的兒童玩具,背后其實隱藏著一個NP-complete級別的問題。它最早的名字叫Mastermind:一款需要兩個人參與的桌游——一個人負責“設密碼”,另一個人負責“猜密碼”。
規則很直接:設密碼者先選定一組顏色/位置組成的密碼并隱藏起來;猜密碼者需要在有限回合內(也就是棋盤給定的槽位/回合數限制)把它猜中。若能在限制回合內猜中,猜密碼者勝;否則設密碼者勝。
每一回合,猜密碼者提交一個猜測,設密碼者必須給出反饋。經典反饋形式是黑釘/白釘
- 黑釘:顏色正確且位置正確;
- 白釘:顏色正確但位置不正確。
本質上,這是一條“反饋信道”,而且它必須嚴格滿足規則——完全正確、無噪音,否則整個推理鏈就會崩掉。
我手上的這個電子版Decoder可以看作是 Mastermind 的升級版:它把“設密碼的人”替換成了設備內部的隱藏算法,并且加入了更多變體反饋機制,比如:
- 綠燈表示顏色和位置都正確,
- 白燈表示顏色正確但位置不對,
- 不亮表示這種顏色根本不在密碼里(或者等價地表示“顏色也不正確”的數量)。
在完全indirect hint的單機模式下,玩家甚至看不到位置信息——這會讓狀態空間急劇膨脹,遠遠超出 brute force 直接窮舉的可行范圍。而從理論上說,這背后的復雜性并不是“感覺上很難”這么簡單:在2005 年,Jeff Stuckman 和 Guo-Qiang Zhang 的論文證明了Mastermind 是 NP-complete
好,用了一整天的時間,我把這個玩具范圍內的800 個關卡全部解完了。我采用的是minimax策略:每一步選擇在最壞情況下能最大幅度壓縮候選空間的猜測,而不是追求“看起來聰明”的局部最優。
這里必須認真夸一句——這款來自中國計科公司的玩具產品做得非常扎實。它的反饋信道高度可靠、完全無噪聲,嚴格遵守規則約定。能在一個面向兒童的消費級玩具里,把反饋一致性和規則執行做到這種程度,其實很厲害。
所有解法的repo我都已經放出來了:
不僅包含針對這臺設備本身配置的求解器,也包括可擴展的通用解法,能夠支持比原機更大的顏色空間和更多變體規則。可以直接復用、改參數就能跑。
就當是給訂閱者的一個小福利吧。雖然我寫的文章通常都很長、也不怎么“友好”,但這個玩具倒是個很好的切入口——你可以買一個給孩子,讓他自己認真玩幾天;等他真的卡住、開始懷疑人生的時候,你再掏出這套算法,幾百關輕松帶過。
他大概率會覺得你特別厲害
從實用角度講,這可能也是一種讓小孩子突然很喜歡你的辦法
玩到這個階段,其實已經沒什么“解題意義”可再展開了:一個兒童玩具,被完整求解,全部關卡通關。它在理論上當然是NP-complete,但在這個被嚴格限制的規模內,五步之內必然可解。然而,這從來不是我的真正目標。我并不是想證明我解決了一個兒童玩具,而是想站在Wolfram 的視角重新審視復雜性本身。
這里的復雜性并不來自規則——規則極其簡單——而是來自這樣一種結構:存在一個被隱藏的真值 (s)(密碼、答案),你每一次只能提交一個 guess,系統返回一個反饋(G/W/N),你必須在有限輪數內把這個 (s) 反演出來。你想直接算出答案,卻永遠缺少關鍵信息;而你獲得信息的唯一方式,是不斷發起查詢并接收反饋。答案不是從規則中推導出來的,而是從交互過程中被迫挖出來的。
從信息論的角度看,這個模型異常純粹:信息單向地從隱藏真值向外泄露,困難不在于規則復雜,而在于信息被鎖在一個 oracle(反饋器)后面;本質上,這是一個標準的黑箱查詢問題——你每一步都在用一次 query,換取極其有限的 bit。這種結構并不只存在于玩具中,它在現實世界里廣泛存在,而且復雜性往往呈指數級放大。玩具的“仁慈”在于:你被明確告知反饋信道是完全無噪聲的,規則被嚴格執行,oracle 不會撒謊;而現實中,有誰說了反饋一定是真實的?無噪的?于是,真正值得思考的對象就變成了這個你無法看到內部機制的黑箱:你只能向它提出查詢,它只返回一個反饋,而整個復雜性,正是從這種受限、單向、被遮蔽的信息交互中自然涌現出來的。
- 安全/密碼學:你對系統內部狀態未知,只能試探/探測(queries)
- 診斷/醫學:你不知道病因,只能做檢查(queries)來縮小候選
- 科學實驗:你不知道規律,只能做實驗(queries)得到觀測,逐步收斂
- 工程調參:你不知道最佳配置,只能試運行(queries)拿到反饋再更新
當然,我也很清楚自己還處在一個非常早期的階段,而且這類問題并不是無人涉足。事實上,在學界它早已被系統化地研究過。在理論計算機科學和“謎題復雜度”相關的研究中,Mastermind 通常被表述為一種約束滿足 / 一致性判定問題,標準形式被稱為Mastermind Satisfiability Problem(MSP),并且已經被嚴格證明是NP-complete——這一點前面其實已經交代過了。就經典桌游參數而言(4 位、6 種顏色、允許重復),整個狀態空間只有 (6^4 = 1296) 種可能;早在1977 年,Knuth 就給出了一個最壞情況 5 步必勝的策略。我的實現本質上也是這個級別:最壞不超過 5 步,而且我看到的文獻里給出的統計結果,平均步數大概在4 點多。所以在這個規模和框架之內,能被形式化、能被證明、能被優化的部分,其實已經被研究得相當充分了。我接下來如果繼續推進,更可能會從信息熵的角度入手,把問題重新表述成“每一步查詢能榨取多少有效信息”的問題。也正好,今天還偶然看到一篇挺有意思的新論文:Gür(2025)的 Weighted Entropy Approach,用加權熵作為啟發式,逼近理論最優的平均步數,本質上也是把“策略”當成一種測量儀器來設計,這個思路對我來說非常有參考價值。這里就不展開了,有興趣的可以直接去讀原文。
https://arxiv.org/abs/cs/0512049?utm_source=chatgpt.com
https://www.cs.bu.edu/fac/best/res/papers/alybull86.pdf?utm_source=chatgpt.com
https://arxiv.org/abs/2511.19446?utm_source=chatgpt.com
我感興趣的是 Wolfram會怎么看待這種問題
當然,更現實、也更符合我今年節奏的做法,是把一部分時間真正投向元胞機本身。因為在我看來,這條線索幾乎是一切的起點——起點就在 A New Kind of Science。無論是那本書本身,還是此后 Wolfram 持續二十多年發表的大量文章、講座與補充材料,核心對象的起點在元胞機。我感覺他是把它當作一種最小、最干凈的計算宇宙,用來正面研究復雜性、不可約性、以及“規則極簡但行為極端復雜”這一事實本身。在這條路線上,Stephen Wolfram 對元胞機的系統性、規模化、長期投入,幾乎是全球獨一無二的——不論是規則空間的全面掃描、演化分類、計算不可約性的提出,還是后來發展出的 ruliology 視角,在全球范圍內都很難找到真正意義上的“第二家”。所以我肯定也會持續在這條上學習。
我一直覺得,Wolfram 所謂的“新科學范式”,在他當年以一個人的身份提出這樣一個宏大的敘事,本身就已經非常了不起了——而且我絕對不是唯一一個對此產生強烈震動的人。關鍵不在于他說了什么“結論”,而在于他到底在問什么問題。你看,同樣是拿到Mastermind / Decoder這個游戲,我的第一反應肯定是:求解。這當然很自然——計算的目的之一,難道不就是求解嗎?世界里似乎存在一個“真相”,一個唯一的 secret code(或者一個極小的候選集合);成功的指標也非常清楚:用盡量少的步數把答案鎖定下來,追求收斂、收束、最短路徑。這套思路在復雜度理論里再熟悉不過了:CSP / SAT / 搜索問題,加上一點策略優化,所有評價指標都圍繞“最快定位唯一解”。(突然想感慨一下,好做題家的思維啊….)
但如果換成Stephen Wolfram的視角,問題的重心會發生明顯偏移。他關心的往往不是“這個實例的答案是什么”,而是:這個規則系統本身會長成什么樣。比如:它會不會涌現出普適計算能力?它的整體行為屬于哪一類(簡單、周期、混沌、復雜)?它有沒有“捷徑”,還是說本質上是計算不可約的?在整個規則空間里,這種行為到底是稀有的,還是普遍存在的?在這個框架下,成功的指標不再是“鎖定唯一解”,而是發現結構現象、分類現象、識別生成機制,并回答“為什么這種現象在規則宇宙中如此常見”。
有一個讓人稍微有點“背脊發涼”的念頭, 我想到:元胞機是圖靈完備的。這意味著你面對的不是一個“解題器”,而是一個潛在的計算宇宙。圍繞這一點,Wolfram 提出了PCE(Principle of Computational Equivalence)——說實話,這個原則我自己目前也還在消化之中,但它大致在說:一旦系統的行為超過某個極低的復雜性閾值,它們在計算能力上往往是等價的。換句話說,“能算的都差不多一樣能算”,區別不在于是否強大,而在于是否可預測、是否可壓縮、是否必須一步步模擬
所以,Wolfram 并不是不“求解”,而是徹底換了問題的形狀。他不是在問:“這個具體實例的答案是什么?”他更常問的是:“這個系統的行為規律是什么?”在同樣是“給定規則 + 初態”的前提下,他未必在意你是否把系統推進到第 N 步、得到某一個確定圖像;他可能更關心的是:能否預測某些統計量(密度、熵率、結構壓縮率),能否證明或通過經驗判斷“只有模擬才能知道結果”,以及能否把一個看似完全不同的問題編譯進這個系統,從而顯示它的普適性。在PCE 的視角里,“唯一解”從來不是中心問題;真正居中的,是不同系統是否共享同一類計算能力、同一類行為類型。這正是我開始慢慢意識到的、與“解題直覺”幾乎正交的一種世界觀。
這個系列我會持續更新,這是一個值得長期學習和探討的議題。說實話我的認識目前還算很淺。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.