大家好,我是船長。
概率論與統計學研究中充滿了“可能”、“偶然”和“不確定性”。那么,數學追求的“絕對真實”,在概率論這片看似混沌的領域是否依然適用?長久以來,概率論因其與經驗的緊密聯系和對“隨機性”的擁抱,被許多數學家視為“非正統”,甚至希爾伯特在1900年也將概率論視作物理學(而非數學)的一部分。直至今天,概率論都不能有效地納入邏輯經驗論和分析哲學的數學觀。
而其實早在1933年,蘇聯數學家安德雷·柯爾莫哥洛夫就已經證明,概率論和其他數學分支一樣,也是建立在一組公理之上的符號系統。1713年,瑞士數學家雅各布·伯努利給出了大數定理的數學證明。大數定理是指,隨著拋硬幣的次數增多,該隨機事件(硬幣某一面朝上或朝下的次數趨于相同)發生的“可能性”越來越大。用數學公式表示,就是它占總“可能性空間”的比例趨于1,即其概率接近于1——這是一個關于“可能性空間”收斂的、嚴格的數學定理,基于符號系統結構(數學)的真實性而非經驗的真實性。
由此便可以探尋隨機事件的真實根基:雖然隨機過程不可預測,但“隨機事件整體”的結構(如拋硬幣所有可能結果的集合)、隨機事件的結果(可通過受控觀察確證)、以及對結果的測量(測度)都分別對應著普遍可重復受控實驗的不同層面,因而都具有真實性。正是通過這三個層面與真實實驗結構的牢固連接,概率論的公理系統得以建立并獲得其作為科學真實符號系統的地位。
![]()
圖:正態分布
破解概率之謎——大數定理與數學真實的邊界
文/金觀濤
大數定理:概率之謎
在數學領域,概率論和統計數學是一個與一般數學不同但又極為重要的領域。那么,本編第二章對于數學真實的分析,是否適用于概率論和統計數學呢?我們又該如何理解概率論和統計數學的真實性呢?
在相當長的時間中,數學家認為概率與來自《幾何原本》的所有數學觀念都不同,甚至于離開經驗,概率論是否為真都無法判定。直至19世紀末,概率論仍不是一門嚴格的學科。1900年,德國數學家大衛·希爾伯特在法國舉辦的國際數學家大會上做了題為“數學問題”的著名講演,他根據19世紀數學研究的成果與發展趨勢總結了23個問題,其中第六個問題是用數學的方式實現物理學的公理化,而處在首位的便是概率論和力學的公理化。概率論可以和數理邏輯甚至是抽象代數那樣,成為具有某種特定結構(真實)的純符號系統嗎?表面上看來,這是不可能的。即便希爾伯特在1900年也將概率論視作物理學(而非數學)的一部分。
因此,概率論對20世紀哲學(特別是數學哲學)一直構成巨大挑戰。關于什么是概率,邏輯經驗論和分析哲學存在兩種看法。一種是將其視為經驗研究,這方面的代表人物之一是德國哲學家漢斯·賴欣巴哈。他先將概率陳述視作“類”之間的關系,即“關于一個特定序列的一類元素的陳述之間的一般蘊涵關系”。之后,他以頻率來定義概率,即“概率是在一個無限序列中頻率的極限”。這種解釋面臨的最大問題在于,在經驗世界中,任何序列都是有限的。在這種情況下,我們不可能通過對經驗世界的觀察獲得有關“無限序列中頻率的極限”的信息。另一種主流看法以美國分析哲學家魯道夫·卡爾納普為代表,其根據數學即邏輯的大前提,認為概率是符號系統符合經驗的即“確證度”,故在認識論上亦屬于邏輯范疇。卡爾納普的觀點存在兩個繞不過去的困難。第一,根據邏輯經驗論,只要符號系統符合(指涉)經驗對象,它就獲得經驗的真實性。任何一個隨機事件都可用一個符號串來表達,該符號串是符合經驗的,故不存在符號串的確證度問題。為了建立符號系統的確證度,必須將概率論的研究對象限定在全稱陳述,或那些不是直接指涉經驗對象的符號系統。然而,一旦做出這一限定,概率論就只涉及如何從單稱陳述得到全稱陳述,即歸納邏輯的一部分,而實際上概率論的研究范圍比歸納邏輯廣泛得多。第二,確證度的計算必須基于等概率事件的存在,概率論不能保證這一點。故直至今天,概率論都不能有效地納入邏輯經驗論和分析哲學的數學觀。
其實,正當布爾巴基學派把各門數學建立在集合論之上時,概率論的基礎終于有了答案。1933年,蘇聯數學家安德雷·柯爾莫哥洛夫證明:概率論和其他數學分支一樣,也是建立在一組公理之上的符號系統。我認為,概率論公理實為將對控制結果的不確定性(隨機事件)研究納入受控實驗普遍可重復為真的結果。下面我以大數定理的發現來說明如何用普遍可重復的受控實驗來研究隨機事件(控制結果的不確定性)。
![]()
圖注:以特定擲單個骰子的過程來展示大數定律
所謂大數定理,是指在實驗不變的條件下,重復實驗多次,隨機事件的頻率會接近它的概率。比如,我們拋一枚硬幣,硬幣落下后,某一面朝上是不確定的(即是隨機事件),能確定的只是硬幣某一面朝上或朝下的概率。所謂“朝上”或“朝下”的概率是指可能發生的事件(硬幣某一面朝上或朝下)在總可能性空間中所占的比例。因為總共只有硬幣某一面朝上或朝下兩種可能,它們是相同的。這樣,每一種占可能性空間的比例都是1/2,即某一面朝上和朝下的概率均為1/2。頻率是指若干次實驗后,隨機事件發生數占實驗總次數的比例。當我們拋硬幣的次數足夠多,達到上萬次、幾十萬次甚至百萬次時,就會發現硬幣某一面朝上(或朝下)的次數約占實驗總次數的1/2,也就是隨機事件的頻率似乎在“逼近”它的概率。
表面上看,“頻率逼近概率”出于經驗觀察,故一開始大數定理被稱為“大數定律”。定律何來用于指來自經驗的法則,它和數學推出的定理是不同的。這樣,概率論似乎類似于物理學,也建立在經驗規律之上。然而,人們很快就發現將大數定理視為經驗定律是不能成立的。原因在于,即便重復再多次實驗,硬幣某一面朝上(或朝下)的次數并不一定是實驗總次數的一半。既然大數定理不是經驗觀察的結果,即當實驗的總次數趨于無窮時,“頻率一定逼近概率”在經驗上并不成立,那它又是什么意思?
![]()
圖:瑞士數學家雅各布·伯努利
直至1713年,瑞士數學家雅各布·伯努利才給出了大數定理的數學證明。該證明是數學的,不需要經驗檢驗。從此以后,“大數定律”成為“大數定理”。伯努利的數學推理方式如下。還是以拋硬幣為例,每次硬幣正面朝上的概率為p(0
![]()
這里,伯努利根據排列組合從某一隨機事件A的概率算出另一隨機事件(A在n次重復實驗中發生k次)的概率。由此,可以進一步用數學得出:當n趨于無窮時,隨機事件A出現np次的概率會不斷接近1。表面上看,“大數定律”是指我們在經驗上觀察到隨機事件A的頻率逼近它的概率,伯努利則指出這是不成立的,因為上述隨機事件并一定發生(即不是真的)。但根據排列組合,可以算出隨機事件頻率逼近其概率的“概率”,計算證明,隨著n趨向無窮大,隨機事件頻率逼近其概率的“概率”會越來越接近1。
準確地講,μ是n次獨立實驗中隨機事件A發生的次數,當隨機事件A在每次實驗中發生的概率為p時,所謂隨機事件頻率逼近其概率是指對任意正數ε,存在如下公式:
![]()
上述公式顯示,大數定理是數學定理而非經驗定律。也就是說,隨著拋硬幣的次數日益增多,硬幣某一面朝上(或朝下)的次數趨于相同并不是真實的事件,而是一種“可能性”。大數定理是指,隨著拋硬幣的次數增多,該隨機事件(硬幣某一面朝上或朝下的次數趨于相同)發生的“可能性”越來越大。用數學公式表示,就是它占總“可能性空間”的比例趨于1,即其概率接近于1。由此可見,概率論推出的大數定理本身是一個概率上成立之陳述,它之所以為真,只是因為其發生的概率無限接近于1而已。
這一點可以用數學證明,基于如下兩個前提。第一,拋硬幣本身是一個無限可重復的實驗,每一次硬幣某一面不是朝上就是朝下,只有兩種可能,這一點不會改變。這樣,可以把每次實驗可能性空間的大小定為1,由此可以得到n次實驗的總可能性空間的大小為1的n次方。第二,根據這兩起事件是等可能性的,我們可以算出每一個隨機事件序列(它亦是隨機事件)的概率。所謂隨機事件序列的概率,是隨機事件序列可能性占總可能性(可能性空間)的比例,該比例隨著實驗次數增多而趨近于1。大數定理的成立,基于符號系統結構(數學)的真實性而不是經驗的真實性!
![]()
圖:拋硬幣
隨機事件的符號表達及其真實性
讓我們來分析大數定理為符號(數學)真實性的根據。本書第一編第二章指出,數學是普遍可重復受控實驗的符號結構,規定數學各分支的公理實為受控實驗各環節的細部結構,以及它們普遍可重復的符號表達。受控實驗的普遍可重復是一種結構,其為真意味著該結構是真的,它保證具有該結構的符號系統也為真,這是數學作為純符號系統為真的根據。顯而易見,隨機事件不滿足普遍可重復性的要求。如果以受控實驗(經驗)普遍可重復為真實性標準,隨機事件本身就不是真的,其符號表達當然亦無真實性可言。
然而,我們明明知道隨機事件的存在,并可以用一個符號串來指涉它,說其不是真的,這和人們的直覺矛盾。問題出在什么地方呢?我仍用拋硬幣為例來分析其真實性。在拋硬幣實驗中,就每次實驗結果(硬幣某一面朝上或朝下)而言,哪一種可能性實現是隨機的,不具備普遍可重復性?我們之所以覺得每一次實驗都為真,是因為該實驗的結果(硬幣某一面朝上或朝下)可以被一個普遍可重復的受控觀察(或實驗)證明。然而,這里被證明為真的是拋硬幣的結果,而不是導致該結果的過程。
什么是導致隨機事件結果的過程?它是指我們拋硬幣的控制動作導致硬幣某一面一定朝上(或朝下),它作為隨機事件本身,不具備普遍可重復性。我們覺得其為真是看到該隨機過程的結果即硬幣某一面朝上(或朝下),它是可能性的實現。對于這一結果的真實性,基于硬幣某一面朝上(或朝下)可以用一個普遍可重復的受控觀察(或實驗)來證明。我們認為隨機事件是真實的,這是用其結果來代替過程帶來的錯覺,因為隨機事件(可能性)實現后,它已經不是隨機事件(可能性)了。
![]()
圖:隨機圖
既然拋硬幣的結果為真,那么規定結果的過程即隨機事件本身難道不是真的嗎?拋硬幣有兩種可能結果,即硬幣某一面朝上或朝下。我們通常所說的拋硬幣過程,是指這兩種結果中必然有一種出現,而不是其中某一種一定出現。換言之,正因為我們已經把這兩者中的任何一個發生視為拋硬幣的過程,拋硬幣的過程作為某種控制活動當然是真的。因為這時拋硬幣已經不是隨機事件,它是一個普遍可重復的受控實驗!
通過上面的嚴格分析可以得出如下結論。首先,作為包含隨機事件所有可能結果之“隨機事件整體”對應著一個控制活動,它不是隨機事件,因為這一控制活動是普遍可重復的,它必定是真的。我們可以用一個符號真實之公理來表達“隨機事件整體”。其次,隨機事件發生后,其結果對應著普遍可重復的受控觀察或受控實驗,故是真的。這促使隨機事件的符號表達成為可能。為什么?因為隨機過程和其結果一一對應,當我們用一個符號串指涉隨機過程的結果時,它也對應著導致該結果的隨機過程。最后,正因為隨機事件的結果是真實的,我們可以分析各個結果對應的另一些受控觀察和受控實驗,研究它們之間的關系。如果這些關系是真實的,我們一定可以用另一組代表符號真實的公理表達它們,這就是隨機事件的概率。這樣,也就得到定義隨機事件概率的公理。它和“隨機事件整體”對應的控制行動的公理一樣,亦是受控實驗普遍可重復的符號表達。
由此可見,雖然隨機事件本身不滿足受控實驗普遍可重復的要求,不能將其真實性表達為普遍可重復受控實驗的符號結構,但它和普遍可重復的受控實驗存在著如下三個割不斷的聯系。第一,隨機事件整體對應著普遍可重復的受控實驗。第二,隨機過程的結果可以用普遍可重復的受控觀察(實驗)證明,我們用指涉其結果的符號串加上限定以準確表達隨機事件,即用符號串指涉隨機事件是可行的。第三,當隨機事件的結果對應著測量時,測量也是普遍可重復的受控實驗。這樣隨機事件本身雖不是真的(不對應著普遍可重復的受控實驗),但其結果的測量是普遍可重復的。也就是說,只要隨機事件符號集可測,其測量結果即“測度”是真的。
正因為隨機事件上述三個和普遍可重復的受控實驗相連接的部分都對應著真實的符號結構,我們可以將隨機事件納入科學真實的研究,用這些相連接的部分之符號表達建立一個純粹的符號系統。該符號系統就是概率論的公理。它們和本編第二章數學系統滿足的公理系統不盡相同,但同樣是真實的。
本文系摘選自《真實與虛擬》一書第三章1-2節。為便于閱讀,部分段落做了拆分和刪減,推文標題為編者所擬,學術討論請以原文為準。文中部分配圖來源于網絡,如有侵權請聯系公眾號后臺刪除。
![]()
《真實與虛擬》
掃描上方二維碼可購買
內容編校:夢丹
內容整理:航琦
編發 審定:船長
聲明
雙體實驗室出品 如需轉載聯系后臺
歡迎轉發朋友圈 一起探索人文科技
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.