Rachunek_prawdopodobienstwa/Przewodnik_studenta_cwiczenia/03_przewodnik_studenta_aksjomaty.ipynb

23 KiB

Aksjomatyczna definicja prawdopodobieństwa. Przestrzenie produktowe i warunkowe

Treści kształcenia : Eksperymenty losowe. Klasyczna definicja prawdopodobieństwa. Aksjomatyczna definicja przestrzeni probabilistycznej. Podstawowe własności prawdopodobieństwa. Prawdopodobieństwo na iloczynach kartezjańskich. Prawdopodobieństwo warunkowe.

Efekty kształcenia: Student/ka potrafi konstruować przestrzenie probabilistyczne dla zadanych problemów rachunku prawdopodobieństwa; potrafi wyrazić podstawowe problemy w języku zdarzeń losowych; umie zastosować poznane twierdzenia i własności przestrzeni probabilistycznych do rozwiązywania prostych zagadnień rachunku prawdopodobieństwa.

Wstęp

Nasze rozważania dotyczące rachunku prawdopodobieństwa zaczęliśmy od modelu klasycznego, w którym zakładaliśmy, że w danym doświadczeniu losowym mamy skończoną liczbę możliwych wyników i wszystkie te wyniki są równo prawdopodobne. Nietrudno podać przykład eksperymentu losowego, którego nie da się opisać za pomocą modelu klasycznego. Weźmy chociażby eksperyment, w którym rzucamy monetą tak długo, aż wypadnie orzeł. W tej sytuacji możliwych wyników eksperymentu jest nieskończenie wiele, bo potencjalnie możemy nigdy nie wyrzucić orła (choć jest to bardzo mało prawdopodobne). Na tej lekcji dowiemy się, w jaki sposób konstruować modele dla eksperymentów losowych w ogólnym przypadku.

Aksjomatyczna definicja prawdopodobieństwa

Zanim podamy sposób, w jaki konstruujemy modele dla eksperymentów losowych, musimy zbudować formalne podstawy dla naszego modelu matematycznego. Będziemy bazować na pojęciach z teorii miary i przytoczymy tylko te definicje, które są dla nas niezbędne. Pierwszą z nich jest definicja $\sigma$-algebry.

Definicja ($\sigma$-algebra)

Niech $\mathcal{P}(\Omega)$ oznacza zbiór potęgowy zbioru $\Omega$. Rodzinę $\mathcal{F}\subseteq \mathcal{P}(\Omega)$ podzbiorów zbioru $\Omega$ nazywamy $\sigma$-algebrą jeśli spełnia poniższe warunki:

  • $\Omega\in\mathcal{F}$;
  • Jeśli $A\in\mathcal{F}$, to $A'\in\mathcal{F}$ ($\mathcal{F}$ jest zamknięta na dopełnienia);
  • Jeśli $A_1, A_2, \ldots \in \mathcal{F}$, to $\bigcup_{i=1}^{\infty} A_i \in \mathcal{F}$ ($\mathcal{F}$ jest zamknięta na przeliczalne sumy).

Ćwiczenie 1

Dwa najprostsze przykłady $\sigma$-algebr zbioru $\Omega$ to:

  • tzw. trywialna $\sigma$-algebra $\{\emptyset, \Omega\}$,

  • oraz $\sigma$-algebra zawierająca wszystkie podzbiory należące do $\mathcal{P}(\Omega)$.

    W ramach ćwiczenia proszę sprawdzić, że obie te rodziny są $\sigma$-algebrami.

Definicja (przestrzeń probabilistyczna)

Przestrzenią probabilistyczną nazywamy trójkę $(\Omega, \mathcal{F}, \mathbb{P})$, gdzie $\Omega$ jest zbiorem zdarzeń elementarnych, $\mathcal{F}$ jest pewną $\sigma$-algebrą podzbiorów zbioru $\Omega$, której elementy nazywamy zdarzeniami, natomiast $\mathbb{P}:\mathcal{F} \rightarrow [0,1]$ jest funkcją prawdopodobieństwa spełniającą następujące aksjomaty:

  • $0\leq \mathbb{P}(A) \leq 1$ dla każdego zdarzenia $A\in\mathcal{F}$;
  • $\mathbb{P}(\Omega) = 1$;
  • Dla dowolnego ciągu parami rozłącznych zdarzeń $A_1, A_2, \ldots$ zachodzi $\mathbb{P}(\bigcup_{i=1}^{\infty} A_i) = \sum_{i=1}^{\infty} \mathbb{P}(A_i)$ (przeliczalna addytywność).

Uwaga: W przypadku eksperymentów losowych o skończonym lub przeliczalnym zbiorze zdarzeń elementarnych $\Omega$ będziemy zawsze przyjmować, że $\mathcal{F}=\mathcal{P}(\Omega)$, a zatem wszsytkie podzbiory zbioru $\Omega$ są sensownymi zdarzeniami. Ponadto w takiej sytuacji wystarczy zdefiniować funkcję $\mathbb{P}$ na zdarzeniach elementarnych tak, aby zachodziło $$\sum_{\omega\in\Omega} \mathbb{P}(\omega) = 1.$$ Warunek ten jest konieczny aby spełnić aksjomat mówiący, że $\mathbb{P}(\Omega) = 1$. Następnie tę definicję możemy rozszerzyć na wszystkie zdarzenia $A\in\mathcal{F}$ przyjmując, że $$\mathbb{P}(A) = \sum_{\omega\in A}\mathbb{P}(\omega).$$

Przykład 1

W urnie znajdują się cztery kule czerwone i dwie kule niebieskie. Losujemy z urny po jednej kuli bez zwracania do momentu, aż wylosujemy kulę w kolorze niebieskim. Zbudujmy model przestrzeni probabilistycznej $(\Omega,\mathcal{F},\mathbb{P})$ dla tego eksperymentu. Możemy przyjąć, że $$\Omega = \{\omega_1 = N, \omega_2 = CN, \omega_3 = CCN, \omega_4 = CCCN, \omega_5 = CCCCN\}$$ oraz $\mathcal{F} = \mathcal{P}(\Omega)$. Następnie definiujemy funkcję prawdopodobieństwa dla zdarzeń elementarnych przyjmując, że $$\mathbb{P}(\omega_1) = \frac{2}{6} = \frac{1}{3},\quad \mathbb{P}(\omega_2) = \frac{4}{6}\cdot\frac{2}{5} = \frac{4}{15},\quad \mathbb{P}(\omega_3) = \frac{4}{6}\cdot\frac{3}{5}\cdot\frac{2}{4} = \frac{1}{5},\quad \mathbb{P}(\omega_4) = \frac{4}{6}\cdot\frac{3}{5}\cdot\frac{2}{4}\cdot\frac{2}{3} = \frac{2}{15},\quad \mathbb{P}(\omega_5) = \frac{4}{6}\cdot \frac{3}{5}\cdot \frac{2}{4}\cdot \frac{1}{3}\cdot \frac{2}{2} = \frac{1}{15}.$$ Proszę zwrócić uwagę, że $$ \frac{1}{3} + \frac{4}{15} + \frac{1}{5} + \frac{2}{15} + \frac{1}{15} = 1.$$ Rozważmy teraz zdarzenie $A$ polegające na tym, że wykonaliśmy nieparzystą liczbę losowań. Wówczas $A = \{\omega_1, \omega_3,\omega_5\}$ i prawdopodobieństwo tego zdarzenia liczy się w następujący sposób $$\mathbb{P}(A) = \mathbb{P}(\omega_1) + \mathbb{P}(\omega_3) + \mathbb{P}(\omega_5) = \frac{1}{3} + \frac{1}{5} + \frac{1}{15} = \frac{3}{5}.$$

Przykład 2

Rozważmy eksperyment, w którym z urny zawierającej 3 kule białe, 2 kule czerwone i 1 kulę niebieską losujemy równocześnie dwie kule. Jeśli przyjmiemy jako zbiór zdarzeń elementarnych $$\Omega = \{BB, BC, BN, CC, CN\},$$ to na pewno nie będziemy mieli do czynienia z modelem klasycznym, bo np. zdarzenie $BB$ jest bardziej prawdopodobne niż zdarzenie $CC$ (w końcu w urnie mamy więcej kul białych niż czarnych). Musimy zatem zbudować inny model. Jak zwykle przyjmujemy $\mathcal{F} = \mathcal{P}(\Omega)$ i definiujemy funkcję prawdopodobieństwa na zdarzeniach elementarnych $$\mathbb{P}(BB) = \frac{{3\choose 2}}{{6\choose 2}}=\frac{1}{5}, \quad \mathbb{P}(BC) = \frac{3\cdot 2}{{6\choose 2}}=\frac{2}{5}, \quad \mathbb{P}(BN) = \frac{3\cdot 1}{{6\choose 2}}=\frac{1}{5}, \quad \mathbb{P}(CC) = \frac{{2\choose 2}}{{6\choose 2}}=\frac{1}{15},\quad \mathbb{P}(CN) = \frac{2\cdot 1}{{6\choose 2}}=\frac{2}{15}.$$ Sprawdźmy jeszcze, czy powyższe prawdopodobieństwa sumują się do $1$. Mamy $$ \frac15 + \frac 25 + \frac15 + \frac2{15} + \frac1{15} = 1.$$ Niech $A$ będzie zdarzeniem polegającym na wylosowaniu kul w tym samym kolorze. Wówcza $A = \{BB, CC\}$ i dostajemy $$\mathbb{P}(A) = \mathbb{P}(BB) + \mathbb{P}(CC) = \frac15 + \frac1{15} = \frac4{15}.$$

Własności funkcji prawdopodobieństwa

Podamy teraz podstawowe własności funkcji prawdopodobieństwa, z których będziemy często korzystać na tym kursie. Proszę pamiętać, że zdarzenia są po prostu zbiorami, natomiast funkcja prawdopodobieństwa $\mathbb{P}$ przypisuje tym zbiorom pewną miarę (zwaną miarą probabilistyczną), czyli wartość liczbową z przedziału $[0,1]$. Okazuje się, że wiele z własności funkcji prawdopodobieństwa w pewnym sensie dziedziczy się z odpowiednich własności zbiorów w teorii zbiorów.

Twierdzenie (własności funkcji prawdopodobieństwa)

Dla dowolnej przestrzeni probabilistycznej $(\Omega, \mathcal{F}, \mathbb{P})$ oraz dowolnych zdarzeń $A, B, C\in\mathcal{F}$ zachodzi:

  • (W1) $\mathbb{P}(\emptyset) = 0$;
  • (W2) Jeśli zdarzenia $A_1, A_2, \ldots, A_n\in\mathcal{F}$ są parami rozłączne, to $\mathbb{P}(\bigcup_{i=1}^n A_i) = \sum_{i=1}^n \mathbb{P}(A_i)$ (skończona addytywność);
  • (W3) $\mathbb{P}(A') = 1 - \mathbb{P}(A)$ (prawdopodobieństwo zdarzenia przeciwnego);
  • (W4) Jeśli $A\subset B$, to $\mathbb{P}(B\setminus A) = \mathbb{P}(B) - \mathbb{P}(A)$;
  • (W5) Jeśli $A\subset B$, to $\mathbb{P}(A) \leq \mathbb{P}(B)$ (monotoniczność prawdopodobieństwa);
  • (W6) $\mathbb{P}(A\cup B) = \mathbb{P}(A) + \mathbb{P}(B) - \mathbb{P}(A\cap B)$ (odpowiednik zasady włączania i wyłączania dla dwóch zbiorów);
  • (W7) $\mathbb{P}(B\setminus A) = \mathbb{P}(B) - \mathbb{P}(A\cap B)$;
  • (W8) $\mathbb{P}(A\cup B\cup C) = \mathbb{P}(A) + \mathbb{P}(B) + \mathbb{P}(C) - \mathbb{P}(A\cap B) - \mathbb{P}(A\cap C) - \mathbb{P}(B\cap C) + \mathbb{P}(A\cap B\cap C)$ (odpowiednik zasady włączania i wyłączania dla trzech zbiorów).

Przykład 3

Powtarzamy eksperyment polegający na rzucie czworościenną kostką, zatem możliwe wyniki pojedynczego rzutu to $1$, $2$, $3$ lub cztery $4$.

  • Ile wynosi prawdopodobieństwo wyrzucenia czwórki dokładnie jeden raz w pierwszych trzech rzutach?

    Skorzystamy z modelu klasycznego z $\Omega = \{1,2,3,4\}^3$. Niech $A_i$ oznacza wyrzucenie czwórki tylko w $i$-tym rzucie, $i=1,2,3$. Wówczas chcemy policzyć prawdopodobieństwo zdarzenia $A_1\cup A_2\cup A_3$. Zauważmy, że zdarzenia $A_1$, $A_2$ i $A_3$ są parami rozłączne i z symetrii każde z nich ma takie samo prawdopodobieństwo. Zatem korzystając z własności (W2) mamy $$\mathbb(A_1\cup A_2\cup A_3) = \mathbb{P}(A_1) + \mathbb{P}(A_2) + \mathbb{P}(A_3) = 3 \cdot \frac{1 \cdot 3 \cdot 3}{4 \cdot 4 \cdot 4} = \frac{27}{64}.$$

  • Ile wynosi prawdopodobieństwo wyrzucenia czwórki co najmniej jeden raz w pierwszych dwóch rzutach?

    Teraz przyjmiemy, że $\Omega = \{1,2,3,4\}^2$. Niech $B_i$ oznacza zdarzenie polegające na wyrzuceniu czwórki w $i$-tym rzucie, $i=1,2$. Interesuje nas prawdopodobieństwo zdarzenia $B_1\cup B_2$, ale tym razem zdarzenia $B_1$ i $B_2$ nie są rozłączne, zatem musimy posłużyć się własnością (W6), z której otrzymujemy $$ \mathbb{P}(B_1\cup B_2) = \mathbb{P}(B_1) + \mathbb{P}(B_2) - \mathbb{P}(B_1\cap B_2) = 2\cdot \frac{1\cdot 4}{4\cdot 4} - \frac{1\cdot 1}{4\cdot 4} = \frac{7}{16}.$$ Oczywiście moglibyśmy też policzyć to prawdopodobieństwo inaczej, korzystając ze zdarzenia przeciwnego. Niech zatem $B$ będzie zdarzeniem polegającym na wyrzuceniu czwórki co najmniej jeden raz w dwóch rzutach czworościenną kostką. Korzystając z własności (W3) dostajemy $$\mathbb{P}(B) = 1 - \mathbb{P}(B') = 1 - \frac{3\cdot 3}{4\cdot 4} = \frac{7}{16}.$$

Przestrzenie produktowe

W wielu przypadkach będziemy konstruować przestrzenie probabilistyczne dla rozbudowanych eksperymentów korzystając z przestrzeni probabilistycznych dla prostszych doświadczeń. Jako przykład rozważmy $100$-krotny rzut kostką. Liczba wyników tego eksperymentu wynosi $6^{100}$, czyli bardzo dużo. Zatem pracując w takiej przestrzeni będziemy operować na ogromnych liczbach, co wydaje się być problematyczne. A jednak nasz eksperyment można potraktować jako doświadczenie losowe składające się ze $100$ mniejszych eksperymentów (pojedyncze rzuty kostką), których naturę doskonale rozumiemy. W tym miejscu z pomocą przychodzi nam przestrzeń produktowa, która jest w pewnym sensie uogólnieniem pojęcia iloczynu kartezjańskiego zbiorów, rozszerzonego na nasze trójki postaci $(\Omega, \mathcal{F},\mathbb{P})$.

Definicja (przestrzeń produktowa)

Niech $(\Omega_1, \mathcal{F}_1, \mathbb{P}_1)$ oraz $(\Omega_2, \mathcal{F}_2, \mathbb{P}_2)$ będą dwoma przestrzeniami probabilistycznymi. Iloczynem (produktem) tych przestrzeni nazywamy przestrzeń probabilistyczną $(\Omega,\mathcal{F},\mathbb{P})$, gdzie $\Omega = \Omega_1\times\Omega_2$, $\mathcal{F}$ zawiera wszystkie zbiory postaci $A_1\times A_2\in \mathcal{F}_1\times\mathcal{F}_2$, oraz funkcja prawdopodobieństwa $\mathbb{P}$ spełnia warunek $$\mathbb{P}(A_1\times A_2) = \mathbb{P}_1(A_1)\cdot\mathbb{P}_2(A_2).$$ Definicję tę można uogólnić na dowolną skończoną lub przeliczalną rodzinę przestrzeni probabilistycznych.

Uwaga: W powyższej definicji $\mathcal{F}$ jest $\sigma$-algebrą generowaną przez zbiory postaci $A_1\times A_2$, czyli najmniejszą $\sigma$-algebrą, która zawiera wszystkie takie zbiory.

Schemat Bernoulliego

Klasycznym przykładem zastosowania przestrzeni produktowych, który będzie się przewijał przez cały kurs, jest schemat Bernoulliego. Niech $p\in(0,1)$ oraz $n\in\mathbb{N}_+$. Przypuśćmy, że powtarzamy $n$ razy eksperyment losowy, w którym prawdopodobieństwo sukcesu wynosi $p$ (a porażki $1-p$) oraz wyniki poszczególnych prób nie mają na siebie nawzajem wpływu. Jeśli $\tau_k$ oznacza prawdopodobieństwo uzyskania dokładnie $k$ sukcesów w $n$ próbach, to $$\tau_k = {n\choose k}p^k(1-p)^{n-k} \ \text{ dla } \ k=0,1,\ldots,n.$$ Zatem w schemacie Bernoulliego powtarzamy ten sam eksperyment, tzw. próbę Bernoulliego, ustaloną liczbę razy $n$ przy założeniu, że poszczególne próby są niezależne. W tym wypadku korzystamy z przestrzeni probabilistycznej, która jest produktem $n$ przestrzeni odpowiadających pojedynczym próbom Bernoulliego.

Przykład 4

Losujemy z potasowanej talii jedną kartę, po czym wkładamy ją na miejsce i tasujemy talię jeszcze raz. Powtarzamy ten eksperyment $20$ razy.

  • Ile wynosi szansa wylosowania karty w kolorze pik dokładnie $5$ razy?

    Posłużymy się tutaj schematem Bernoulliego o liczbie prób $n=20$ oraz prawdopodobieństwie sukcesu $p=\frac{13}{52}=\frac14$. Interesuje nas prawdopodobieństwo uzyskania dokładnie pięciu sukcesów, które wynosi $$ \tau_5 = {20\choose 5}\left(\frac14\right)^5\left(\frac34\right)^{15} \approx 0{,}2023312.$$

  • Ile wynosi szansa wylosowania asa co najwyżej 2 razy?

    Tym razem zastosujemy schemat Bernoulliego o liczbie prób $n=20$ i prawdopodobieństwie sukcesu $p=\frac{4}{52} = \frac{1}{13}$. Szukane prawdopodobieństwo to $$ \tau_0 + \tau_1 + \tau_2 = {20\choose 0}\left(\frac1{13}\right)^0\left(\frac{12}{13}\right)^{20} + {20\choose 1}\left(\frac1{13}\right)^1\left(\frac{12}{13}\right)^{19} + {20\choose 2}\left(\frac1{13}\right)^2\left(\frac{12}{13}\right)^{18} \approx 0{,}8040948.$$

Oczywiście aby podać przybliżoną wartość powyższego prawdopodobieństwa w obu przypadkach musimy posłużyć się komputerem (np. możemy do tego wykorzystać R). Poniżej znajduje się kod, który pozwoli nam to zrobić.

# Liczymy prawdopodobieństwo uzyskania dokładnie 5 sukcesów w 20 próbach Bernoulliego o prawdopodobieństwie sukcesu równym 0.25
binom_prob <- dbinom(5, size = 20, prob = 0.25)
print(binom_prob)

# Liczymy prawdopodobieństwo uzyskania co najwyżej 2 sukcesów w 20 próbach Bernoulliego o prawdopodobieństwie sukcesu równym 1/13
binom_prob <- dbinom(0, size = 20, prob = 1/13) + dbinom(1, size = 20, prob = 1/13) + dbinom(2, size = 20, prob = 1/13)
print(binom_prob)
[1] 0.2023312
[1] 0.8040948

Rozkład geometryczny

Kolejnym klasycznym przykładem wykorzystania przestrzeni produktowych jest eksperyment, w którym powtarzamy niezależne próby Bernoulliego do momentu uzyskania pierwszego sukcesu. Tym razem mamy do czynienia z przestrzenią, która powstaje w wyniki wzięcia iloczynu kartezjańskiego nieskończonej liczby przestrzeni odpowiadających poszczególnym próbom. Zatem powtarzamy eksperyment losowy, w którym prawdopodobieństwo sukcesu wynosi $p\in(0,1)$, do momentu osiągnięcia pierwszego sukcesu. Jeśli przez $\sigma_k$ oznaczymy prawdopodobieństwo, że potrzebujemy na to $k$ prób, to $$\sigma_k=p(1-p)^{k-1} \ \text{ dla } \ k=1,2,\ldots$$ Powyższy model nazywamy rozkładem geometrycznym.

Przykład 5

Rzucamy czworościenną kostką tak długo, aż wyrzucimy jedynkę. Zatem mamy do czynienia z prawdopodobieństwem geometrycznym o prawdopodobieństwe sukcesu $p=\frac14$.

  • Ile wynosi prawdopodobieństwo, że do wyrzucenia jedynki po raz pierwszy wykonamy łącznie 5 rzutów? $$ \sigma_5 = \frac14\cdot \left(\frac34\right)^4 \approx 0{,}07910156.$$
  • Ile wynosi prawdopodobieństwo, że do wyrzucenia jedynki po raz pierwszy wykonamy łącznie co najwyżej 4 rzuty? $$ \sigma_1 + \sigma_2 + \sigma_3 + \sigma_4 = \frac14\cdot \left(\frac34\right)^0 + \frac14\cdot \left(\frac34\right)^1 + \frac14\cdot \left(\frac34\right)^2 + \frac14\cdot \left(\frac34\right)^3 \approx 0{,}6835938$$
# Liczymy prawdopodobieństwo, że w rozkładzie geometrycznym z prawdop. sukcesu p=0.25 będziemy porzebować dokładnie 5 prób do uzyskania pierwszego sukcesu
# Proszę zwrócić uwagę, na przesunięcie o 1 czyli dgeom(x, prob=p) zwraca p(1-p)^x
geom_prob <- dgeom(4, prob=0.25)
print(geom_prob)

# Liczymy prawdopodobieństwo, że w rozkładzie geometrycznym z prawdop. sukcesu p=0.25 będziemy porzebować co najwyżej 4 próby do uzyskania pierwszego sukcesu
geom_prob <- dgeom(0, prob=0.25) + dgeom(1, prob=0.25) + dgeom(2, prob=0.25) + dgeom(3, prob=0.25)
print(geom_prob)
[1] 0.07910156
[1] 0.6835938

Przestrzenie warunkowe

Definicja (przestrzenie warunkowe)

Jeśli $(\Omega, \mathcal{F}, \mathbb{P})$ jest przestrzenią probabilistyczną, a $B\in \mathcal{F}$ jest zdarzeniem, dla którego $\mathbb{P}(B)>0$, wtedy możemy skonstruować przestrzeń warunkową $(B, \mathcal{F}_B, \mathbb{P}_B)$ przyjmując $$\mathcal{F}_B=\{A\cap B: A\in \mathcal{F}\},$$ a dla każdego $A\in \mathcal{F}$ $$\mathbb{P}_B(A\cap B)=\frac{\mathbb{P}(A\cap B)}{\mathbb{P}(B)}.$$ Prawdopodobieństwo $\mathbb{P}_B(A)$ zwykle zapisujemy jako $\mathbb{P}(A|B)$ i czytamy jako prawdopodobieństwo (warunkowe) zdarzenia $A$ pod warunkiem (zajścia) zdarzenia $B$.

Uwaga: Jeśli zdarzenia $A$ i $B$ są niezależne, to $$\mathbb{P}(A|B)=\mathbb{P}(A)\quad\textrm{i}\quad \mathbb{P}(B|A)=\mathbb{P}(B),, $$ zakładając, że $\mathbb{P}(A), \mathbb{P}(B)>0$ (bez tego założenia prawdopodobieństwa warunkowe nie są dobrze zdefiniowane).

Przykład 6

W grze w pokera gracz dostaje $5$ kart z talii $24$ kart. Jaka jest szansa na uzyskanie pokera (pięć kolejnych kart w tym samym kolorze), jeśli wiemy, że gracz nie dostał żadnego asa?

Niech $B$ będzie zdarzeniem mówiącym, że gracz ma pokera, natomiast $A$ zdarzeniem polegającym na tym, że gracz nie dostał żadnego asa. Wówczas interesuje nas prawdopodobieństwo warunkowe zajścia zdarzenia $B$ pod warunkiem, że zaszło zdarzenie $A$, czyli $$\mathbb{P}(B|A)= \frac{\mathbb{P}(A\cap B)}{\mathbb{P}(A)} = \frac{\frac{4}{{24\choose 5}}}{\frac{{20\choose 5}}{{24\choose 5}}} = \frac{4}{{20\choose 5}} = \frac{1}{3876}.$$