概率論構(gòu)成了人工智能、密碼學(xué)以及統(tǒng)計(jì)學(xué)的基石。正如哲學(xué)家伯特蘭·羅素所言:“概率是現(xiàn)代科學(xué)中最為重要的概念,但吊詭的是,幾乎沒有人真正明白它的確切含義。”
作為一名向工程學(xué)專業(yè)的學(xué)生教授統(tǒng)計(jì)學(xué)的學(xué)者,我深知概率論雖然至關(guān)重要,但其內(nèi)在邏輯往往有悖于人們的直覺。
從本質(zhì)上講,概率論是數(shù)學(xué)的一個重要分支,專門用于描述隨機(jī)性。當(dāng)科學(xué)家們探討“隨機(jī)性”時,他們所指的是那些純粹靠幾率發(fā)生的事件——例如拋擲硬幣——而非那些荒誕離奇的偶然現(xiàn)象,比如一個穿著斑馬服裝在街頭漫步的人。
![]()
盡管科學(xué)家們無法預(yù)測那些離奇離譜的突發(fā)狀況,但概率論確實(shí)能夠精準(zhǔn)預(yù)測事物的長期行為。換言之,它能夠揭示在無數(shù)次重復(fù)事件的疊加之下,最終必然會浮現(xiàn)的宏觀趨勢。
鑒于概率論的核心在于研究各類事件,科學(xué)家首先必須界定清楚他們究竟要考察哪些特定的事件。這種選擇直接構(gòu)筑了統(tǒng)計(jì)學(xué)中所稱的“樣本空間”。
以拋擲硬幣為例,你可能會將硬幣落地時的狀態(tài)定義為你所關(guān)注的事件。在絕大多數(shù)情況下,硬幣落地后要么是正面朝上,要么是反面朝上。盡管概率微乎其微,硬幣極其偶然地立在邊緣上的情況也并非完全不可能發(fā)生。
因此,在構(gòu)建樣本空間時,你實(shí)際上會面臨兩種選擇:其一是僅包含“正面”和“反面”;其二是包含“正面”、“反面”以及“立面”。為了便于理解,我們暫時撇開硬幣立住的極端情況,僅用“正面”和“反面”來構(gòu)建我們當(dāng)下的樣本空間。
確立了樣本空間之后,下一步便是為這些事件分配相應(yīng)的概率。概率本質(zhì)上描述的是某一特定事件發(fā)生的頻率,其數(shù)值范圍恒定在0%到100%之間。例如,一次絕對公平的拋擲,其最終呈現(xiàn)正面朝上和反面朝上的概率將各自趨向于50%。
在分配概率時,你必須對事件發(fā)生的具體情境進(jìn)行極其嚴(yán)謹(jǐn)?shù)钠饰觥<僭O(shè)那個拋硬幣的人是個心懷鬼胎的作弊者呢?現(xiàn)實(shí)中確實(shí)存在一種隱秘的手法,能夠讓硬幣在空中僅僅是“搖擺”而并非真正翻轉(zhuǎn),從而暗中操控最終的落地結(jié)果。
退一步講,即便你能完全杜絕作弊行為,現(xiàn)實(shí)世界中真實(shí)的硬幣拋擲,其落地結(jié)果也總是會略微偏向于起拋時朝上的那一面。也就是說,如果你在拋擲前硬幣是正面朝上的,那么它最終落地時正面朝上的幾率就會出現(xiàn)極其微小的上升。
![]()
無論是在蓄意作弊的場景下,還是在真實(shí)的物理拋擲中,你都需要設(shè)定一個更為貼切的樣本空間:即“初始朝上的那一面”與“另外一面”。
為了在現(xiàn)實(shí)世界中實(shí)現(xiàn)一次真正意義上的公平拋擲,你必須引入一個額外的步驟。你需要以完全相等的概率,隨機(jī)決定硬幣起拋時究竟是哪一面朝上,隨后再將其拋向空中。
上述這些預(yù)設(shè)條件會迅速疊加。為了保證一次拋擲的絕對公平,你不得不忽略硬幣立住的極端情況,預(yù)設(shè)沒有任何人從中作梗,并假定初始朝上的那一面是完全隨機(jī)決定的。
正是這些嚴(yán)苛的假設(shè)條件,共同構(gòu)建出了一個用以描述隨機(jī)結(jié)果的硬幣拋擲模型。概率論的作用,恰恰在于向我們揭示這樣一個隨機(jī)模型在長期運(yùn)行下的內(nèi)在規(guī)律。具體到硬幣模型中,概率所描述的,就是在海量次數(shù)的拋擲中,究竟有多少次會呈現(xiàn)正面朝上。
讀到這里,有人或許會產(chǎn)生疑問:既然如此,與其依賴一個抽象的隨機(jī)模型,我們?yōu)楹尾桓纱嘤梦锢韺W(xué)的定律來精準(zhǔn)求解硬幣拋擲的軌跡呢?
事實(shí)上,科學(xué)家們早已進(jìn)行過此類嘗試。物理學(xué)規(guī)律表明,硬幣在翻轉(zhuǎn)過程中速度的極其微小的變化,都將直接決定其最終是正面還是反面朝上。正是這種對初始條件極其極端的敏感性,使得單次硬幣拋擲的結(jié)果變得根本無法預(yù)測,這也反過來證明了,采用隨機(jī)模型來解析這一現(xiàn)象反而是最明智的選擇。
概率與頻率有著本質(zhì)的區(qū)別。頻率所指代的,是某一事件在特定序列中實(shí)際發(fā)生的比率。
舉例來說,如果你連續(xù)拋擲一枚硬幣8次,結(jié)果出現(xiàn)了2次正面朝上,那么此時的頻率就是25%。盡管在宏觀的長期觀察中,硬幣呈現(xiàn)正面朝上的概率雷打不動地維持在50%,但在任何短促的拋擲序列中,呈現(xiàn)出的結(jié)果都會千差萬別。
![]()
在8次拋擲中,“4次正面與4次反面”固然是最具可能性的結(jié)果,但其他各種失衡的分布狀況不僅存在理論上的可能,在現(xiàn)實(shí)中也必然會真真切切地發(fā)生。
頻率與概率僅僅在一種極其特殊的極端設(shè)定下才會畫上等號:那就是當(dāng)數(shù)據(jù)點(diǎn)的數(shù)量趨近于無窮大之時。正是在這一哲學(xué)層面的意義上,概率論為我們揭示了事物深藏不露的長期行為演化。
概率論的用武之地遠(yuǎn)不止于預(yù)測硬幣的起落。它實(shí)際上構(gòu)成了眾多現(xiàn)代尖端科技系統(tǒng)的底層運(yùn)行邏輯。
以當(dāng)下炙手可熱的人工智能系統(tǒng)為例,諸如大型語言模型等前沿技術(shù),其核心基石正是對“下一個詞”的精準(zhǔn)預(yù)測。從本質(zhì)上剖析,它們是在為你輸入的提示詞之后可能出現(xiàn)的詞匯,進(jìn)行著龐大而復(fù)雜的概率計(jì)算。
例如,當(dāng)你輸入提示詞“紐約”時,模型預(yù)測出的下一個詞極有可能是“市”或者“州”。這是因?yàn)樵谀P屯掏碌暮A坑?xùn)練數(shù)據(jù)中,這兩個字眼是緊隨其后出現(xiàn)頻率最高的詞匯。
由于概率論的核心在于描述隨機(jī)性,因此大型語言模型的輸出結(jié)果同樣充滿了不可預(yù)知性。這就如同你無法保證每一次硬幣拋擲的序列都如出一轍,如果你向大型語言模型拋出同一個問題,你往往會收獲截然不同的回答。
在模型的算法黑箱中,它實(shí)際上將每一個即將吐出的新詞,都視作了一次全新而獨(dú)立的硬幣拋擲。
![]()
隨機(jī)性同時也是密碼學(xué)的命門所在——這是一門致力于捍衛(wèi)信息安全的嚴(yán)密科學(xué)。密碼通信依賴于諸如密碼之類的共享機(jī)密,以此來為信息傳輸保駕護(hù)航。
僅僅具備令人感到意外的隨機(jī)性,遠(yuǎn)遠(yuǎn)不足以構(gòu)筑起堅(jiān)不可摧的安全壁壘。這也就是為什么,選擇一個看似出人意料的生僻詞匯作為密碼,往往是一個極其愚蠢的決定。
一個共享機(jī)密只有在極其難以被猜透的情況下,才能稱得上是真正安全的。即便一個詞匯再怎么冷門,現(xiàn)實(shí)中真實(shí)存在的詞語,也遠(yuǎn)比針對密碼中的每一個字母去單獨(dú)拋擲一次“硬幣”要容易破解得多。
如果你懂得運(yùn)用概率論的法則,在鍵盤上完全隨機(jī)地盲選字符來生成密碼,你就能打造出一道堅(jiān)實(shí)得多的數(shù)字防線;當(dāng)然,更為明智的策略是,直接求助于專業(yè)的密碼管理軟件。
最后,隨機(jī)性在統(tǒng)計(jì)學(xué)領(lǐng)域同樣扮演著舉足輕重的角色。統(tǒng)計(jì)學(xué)家的核心職責(zé),便是精心設(shè)計(jì)并深入分析各項(xiàng)研究,以此在有限的數(shù)據(jù)中榨取最大的價值。
在開展醫(yī)療手段評估的研究中,這種嚴(yán)謹(jǐn)?shù)膶?shí)踐顯得尤為生死攸關(guān),因?yàn)榇藭r的每一個數(shù)據(jù)點(diǎn),都沉甸甸地承載著一條鮮活的生命。
在這一領(lǐng)域,被業(yè)界奉為圭臬的黃金法則便是“隨機(jī)對照試驗(yàn)”。研究人員會基于類似公平拋擲硬幣的隨機(jī)原則,將參與試驗(yàn)的患者分配去接受全新的實(shí)驗(yàn)性療法,或者是繼續(xù)維持現(xiàn)有的標(biāo)準(zhǔn)治療方案。
![]()
用類似拋擲硬幣這種充滿隨機(jī)性的方式來決定攸關(guān)生命的醫(yī)療方案分配,乍一聽或許會讓人覺得荒謬絕倫。正是這種冷酷的不可預(yù)測性,在此刻發(fā)揮了無可替代的關(guān)鍵作用。
它能夠絕對公平地確保,參與者自身的任何個人特質(zhì)——無論是年齡、性別、種族、收入水平抑或是其他任何潛在因素——都絕不會干擾他們獲得特定治療的機(jī)會。
這種不可預(yù)測性猶如一道無形的防火墻,幫助科學(xué)家們確鑿地證明,他們所觀察到的臨床結(jié)果完完全全是源于治療手段本身,而絕非任何其他外在因素的干擾。
那么,概率究竟意味著什么?如同任何一種數(shù)學(xué)分支一樣,它僅僅是一個理論模型,這意味著它永遠(yuǎn)無法絕對完美地刻畫這個復(fù)雜多變的真實(shí)世界。但在我們所探討的上述諸多案例中,概率論在描述事物的長期行為演化,以及巧妙運(yùn)用不可預(yù)測性來攻克現(xiàn)實(shí)難題方面,展現(xiàn)出了無與倫比的強(qiáng)大威力。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.