本文從簡單概率的概念出發,逐步過渡到條件概率,最后介紹貝葉斯定理。整個過程會盡量保持直觀,不涉及復雜的數學形式。
假設有兩個盒子:盒子 A 和盒子 B。盒子 A 裝了 4 個球,3 紅 1 綠;盒子 B 同樣裝了 4 個球,1 紅 3 綠。
![]()
一個蒙著眼的人站在兩個盒子前面,隨機選中任一盒子的概率是 1/2。選定了某個盒子,比如盒子 A,從中摸到紅球的概率是 3/4,摸到綠球的概率是 1/4。
![]()
樹形圖清楚地展示了盒子選擇和球選擇的概率分布也引出了幾個基本概念:蒙眼的人選定盒子 A 后,取到紅球的概率是 3/4,取到綠球的概率是 1/4。
選中任一盒子的概率是 1/2,寫成數學語言:P(A) = 1/2,P(B) = 1/2。這屬于簡單概率。
在盒子 A 已被選中的前提下,從中取出紅球的概率是 P(R | A) = 3/4。這就是條件概率,它以"盒子 A 已被選中"為條件,說法是"在盒子 A 已被選中的條件下,取出紅球的概率"。
P(R | A) = 3/4 = count of Red balls in box A / total balls in box A
同理,P(G | A) = 1/4 表示在盒子 A 已被選中的條件下取出綠球的概率。
條件概率有一個關鍵特征:它縮小了"世界"的范圍。計算條件概率時,參考系限定在條件所界定的子集之內。選擇盒子時,"世界"是包含兩個盒子的全集;選擇球時,"世界"縮小到了那個特定的盒子,概率以該盒子中球的總數為分母。換言之,就是用盒子 A 中紅球的數量除以盒子 A 中球的總數。
P(R ∩ A) 和 P(G ∩ A) 呢?它們也是概率但不附加任何條件。它們代表的是從樹的根節點出發、從最開始起算的概率,不假設已經選好了盒子正在取球而是把選盒子和取球兩步合在一起,得出一個從起點到終點的總概率。
P(R ∩ A) = P(A) . P(R | A) = 1/2 . 3/4 = 3/8
想想這個公式為什么成立呢?從盒子 A 中取到紅球的條件概率是 3/4,但現在還要考慮選中盒子 A 本身的概率是1/2。兩者相乘3/4 被縮減為 3/8。蒙眼人選中盒子 A 的概率 P(A) = 1/2,繼而在盒子 A 中摸到紅球的概率 P(R | A) = 3/4,兩步合起來 P(R ∩ A) = 3/8。由于兩個盒子各含 4 個球且等概率被選中,3/8 實際上等于盒子 A 中的紅球數除以全集中球的總數。
這個結果符合理論:所有條件概率都會因為前置的盒子選擇概率而按比例縮小,即按選中該盒子的概率做縮放。出發點也從樹的盒子節點退回到了根節點。
同理:
P(G ∩ A) = 1/8 = Green balls A contains / total number of balls in whole universe
P(R ∩ B) = 1/8, P(G ∩ B) = 3/8
到這里,整個全集已經被切分成了四個不重疊的概率塊:
P(R ∩ A) + P(G ∩ A) + P(R ∩ B) + P(G ∩ B) = 3/8 + 1/8 + 1/8 + 3/8 = 8/8 = 1
四個塊加起來剛好等于 1,說明全集中所有盒子與球的組合都已窮盡,不存在遺漏。圖示如下:
![]()
Universe-1
P(R | A) 描述的是紅球在盒子 A 內部占多大比例;P(R ∩ A) 描述的是盒子 A 中的紅球在整個全集中占多大比例。二者的區別至關重要。
現在換一個方向提問:隨機拿起一個紅球,它來自盒子 A 的概率是多少?即 P(A | R) = ?
這個問題的方向和樹形圖恰好相反。原先的邏輯是先選盒子再選球,"世界"從全集縮小到特定盒子,在盒子層面計算條件概率。現在的邏輯則是先假定取到的球是紅色的—— "世界"縮小到只有紅球——然后再看其中多大比例來自盒子 A。
一種理解方式是先構造一個"紅球星球",把全集中所有紅球聚在一起,再看盒子 A 貢獻了其中多少。
P(R) = P(R ∩ A) + P(R ∩ B) = 1/2
為什么這個值合理?全集被切成四個塊,其中兩個包含紅球 P(R ∩ A) 和 P(R ∩ B)。將它們合并就得到紅球的總概率。兩個值都是以全集為參考系的,所以 P(R) = 1/2 的含義是全集中一半的球是紅色的。
新的參考系如下:
![]()
Universe-2
同理:
P(G) = P(G ∩ A) + P(G ∩ B) = P(G | A) . P(A) + P(G | B) . P(B)
P(G) = 1/4 . 1/2 + 3/4 . 1/2 = 1/2
到這一步,"世界"的組織方式變了,從"盒子包含球"變成了"球攜帶來源盒子的標簽"。
為什么要做這個轉換?原來的概率鏈條是"先選盒子、再取球",但目標問題是反過來的:已知取到了紅球,想知道它來自哪個盒子,方向一反轉就需要從 P(R | A) 轉向計算 P(A | R):
P(A | R) = P(A ∩ R) / P(R) = (3/8) / (1/2) = 3/4
為什么不直接用 P(A ∩ R) = 3/8 來回答?因為 3/8 是站在全集視角看的——全集中盒子 A 紅球所占的比例。但問題要求站在"紅球星球"的視角,而不是全集的視角。紅球星球的總量比全集小,所以 3/8 按比例放大——除以 P(R) = 1/2,等價于乘以 2,得到 3/4。P(A ∩ R) 和 P(R) 的分母都是全集,度量單位一致,相除后結果就落在了紅球星球的尺度上。
換個角度看也行:紅球星球上共 4 個紅球,其中 3 個來自盒子 A。
P(A | R) = count of red balls from planet A / total red balls = 3/4
還可以這樣理解:紅球星球由兩個塊組成——P(A ∩ R) 和 P(B ∩ R),兩者之和即 P(R)。要求 P(A ∩ R) 在 P(R) 中的占比,直接做除法即可。
綠球方向的計算完全對稱:條件是綠球已被選中,求它來自盒子 B 的概率。
P(B | G) = P(B ∩ G) / P(G) = P(B ∩ G) / (P(A ∩ G) + P(B ∩ G))
P(B | G) = (3/8) / ((1/8) + (3/8)) = 3/4
小結一下整個過程:在全集 1 中,星球是盒子 A 和盒子 B,各自包含紅球和綠球的分區。經過重組后,全集 2 中的星球變成了紅球和綠球,各自包含盒子 A 和盒子 B 的分區。從一種劃分到另一種劃分的轉換——這就是貝葉斯定理的本質。
直接代入公式驗證:
P(A | R) = P(A ∩ R) / P(R)
= P(A ∩ R) / (P(A ∩ R) + P(B ∩ R))
= P(R | A) . P(A) / (P(R | A) . P(A) + P(R | B) . P(B))
= 3/4 (you can put values to confirm)
不過還需注意一點:
P(A ∩ R) = P(R | A) . P(A) [This is given in our problem. So we use this in our formula]
P(A ∩ R) = P(A | R) . P(R) [This is what we would find eventually. So we didn't use it in formula for calculation]
為什么這套全集轉換的邏輯能走通?為什么原本以盒子為視角的概率可以翻轉成以球為視角?根本原因在于全集能夠通過交集運算被拆解成互不重疊的概率塊。
"全集可以被分割成小的、帶標簽的塊(聯合概率)。"
這些小塊各自攜帶一個條件標簽,可以按需重新組合成新的"星球",從而以不同的視角審視同一個全集。P(R ∩ A)、P(R ∩ B)、P(G ∩ A)、P(G ∩ B)——這四個聯合概率就是構建一切的基本單元。
貝葉斯公式:
P(A | R) = P(A ∩ R) / P(R) = P(R | A) . P(A) / P(R)
從盒子出發提問"給定盒子顏色是什么"——答案是條件概率 P(R | A)、P(G | B) 等。將條件概率乘以降落在該盒子上的概率 P(A) 或 P(B),得到聯合概率 P(R ∩ A) 等。按顏色對聯合概率分組,得到邊緣概率 P(R) 和 P(G),進而就可以反轉提問方式:P(A | R) 或 P(B | G)。
從 P(R | A) 到 P(A | R) 的反轉:這正是貝葉斯定理所形式化的運算。
貝葉斯的思想之所以自然到幾乎不需要解釋,因為全集天然地可以被切分成帶標簽的小塊(聯合概率),這些小塊按盒子分組就得到盒子級別的概率,按顏色分組就得到顏色級別的概率。貝葉斯定理不過是一套以一致、歸一化的方式將"給定"方向從盒子→顏色翻轉為顏色→盒子的算術規則。
Syed Abdullah
by Syed Abdullah
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.