Rachunek_prawdopodobienstwa/Przewdonik_studenta_cwiczenia/04_przewodnik_studenta_Bayes.ipynb

22 KiB

Prawdopodobieństwo całkowite. Wzór Bayesa.

Treści kształcenia : Prawdopodobieństwo warunkowe. Wzór na prawdopodobieństwo całkowite, twierdzenie Bayesa i wzór łańcuchowy.

Efekty kształcenia: Student/ka potrafi konstruować przestrzenie probabilistyczne dla zadanych problemów rachunku prawdopodobieństwa; potrafi wyrazić podstawowe problemy w języku zdarzeń losowych; umie zastosować poznane twierdzenia i własności przestrzeni probabilistycznych do rozwiązywania prostych zagadnień rachunku prawdopodobieństwa.

Wstęp

Na dzisiejszych zajęciach dowiemy się, jak możemy wykorzystywać omawiane tydzień wcześniej prawdopodobieństwo warunkowe, aby badać bardziej skomplikowane zdarzenia losowe, których prawdopodobieństwo zależy od realizacji innych zdarzeń.

Wzór łańcuchowy

Nasze rozważania rozpoczniemy od omówienia wzoru łańcuchowego, który stosujemy do obliczenia prawdopodobieństwa zajścia jednocześnie szeregu zdarzeń. Wzór ten przydaje się zwłaszcza w przypadku doświadczeń losowych wieloetapowych, w których wyniki danego etapu zależą od tego, co wydarzyło się w etapach wcześniejszych.

Twierdzenie (Wzór łańcuchowy)

Jeżeli zdarzenia $A_1, A_2, \ldots, A_n$ spełniają warunek $\mathbb{P}(A_1\cap A_2\cap \ldots\cap A_{n-1})> 0$, to

$$ \mathbb{P}(A_1\cap A_2\cap\ldots\cap A_n) = \mathbb{P}(A_1)\cdot\mathbb{P}(A_2|A_1)\cdot\ldots\cdot\mathbb{P}(A_n|A_1 \cap A_2 \cap \ldots \cap A_{n-1}).$$

Uwaga: W typowych zastosowaniach będziemy mieli do czynienia z eksperymentem, który ma $n$ etapów, a zdarzenia $A_i$ będzie odpowiadało temu, co zdarzyło się w $i$-tym etapie tego doświadczenia.

Przykład 1

Ania ma listę filmów, które chciałaby obejrzeć na pewnej platformie streamingowej. Na początku tygodnia na tej liście znajdują się dwa thrillery i trzy komedie. Ania codziennie losowo wybiera do obejrzenia jeden film z listy, przy czym wszystkie wybory są równo prawdopodobne. Po jego obejrzeniu platforma wyświetla jej przykładowe filmy z tego samego gatunku, co właśnie obejrzany film, które mogłyby ją zainteresować. Ania zawsze wybiera dwa z nich i zapisuje je na swojej liście. Jakie jest prawdopodobieństwo, że:

  • w ciągu pierwszych trzech dni tygodnia Ania będzie oglądać same komedie?

Dla $i=1,2,3$ niech $A_i$ oznacza zdarzenie, że $i$-tego dnia Ania obejrzała komedię. Zauważmy, że łatwo jest obliczyć szanse na wybór komedii danego dnia, jeśli wiemy, ile aktualnie komedii i thrillerów znajduje się na liście Ani, czyli jakie filmy oglądała w poprzednich dniach. Przykładowo, możemy zauważyć, że $\mathbb{P}(A_2|A_1)=\frac{4}{6}$, bo jeśli Ania pierwszego dnia obejrzała komedię, to ta komedia znika z jej listy, a w zamian pojawiają się na niej dwie inne komedie. Zatem w tej sytuacji aktualna liczba filmów na liście to dwa thrillery i cztery komedie. To sugeruje nam, że warto zastosować wzór łańcuchowy, aby obliczyć prawdopodobieństwo zdarzenia ,,Ania w ciągu pierwszych trzech dni tygodnia będzie oglądać same komedie", które można zapisać w postaci $A_1\cap A_2\cap A_3$. Zaczniemy od obliczenia prawdopodobieństw znajdujących się po prawej stronie wzoru łańcuchowego:

  • $\mathbb{P}(A_1)=\frac{3}{5}$ (bo pierwszego dnia na liście Ani znajdują się dwa thrillery i trzy komedie),
  • $\mathbb{P}(A_2|A_1)=\frac{4}{6}$ (to zauważyliśmy wcześniej),
  • $\mathbb{P}(A_3|A_1\cap A_2)=\frac{5}{7}$ (bo jeśli Ania przez pierwsze dwa dni oglądała komedie, to trzeciego dnia na jej liście są dwa thrillery i pięć komedii).

Zatem ostatecznie prawdopodobieństwo zdarzenia, że Ania w ciągu pierwszych trzech dni tygodnia będzie oglądać same komedie to:

$$\mathbb{P}(A_1\cap A_2\cap A_3)=\mathbb{P}(A_1)\cdot\mathbb{P}(A_2|A_1)\cdot \mathbb{P}(A_3|A_1\cap A_2)=\frac{3}{5}\cdot \frac{4}{6}\cdot \frac{5}{7}=\frac{2}{7}.$$

  • w ciągu pierwszych trzech dni tygodnia Ania dokładnie raz obejrzy komedię?

Zauważmy, że warto podzielić to zdarzenie na trzy parami rozłączne przypadki: Ania obejrzy komedię tylko pierwszego dnia, Ania obejrzy komedię tylko drugiego dnia i Ania obejrzy komedię tylko trzeciego dnia. W każdym z tych trzech przypadków wiemy dokładnie, co powinno się wydarzyć każdego dnia, a więc do obliczania jego szans będziemy mogli użyć wzoru łańcuchowego. Przykładowo, rozważmy zdarzenie ,,Ania obejrzy komedię tylko pierwszego dnia''. Zauważmy, że to zdarzenie możemy zapisać w postaci $A_1\cap A_2'\cap A_3'$, używając oznaczeń z poprzedniego podpunktu. Na podstawie wzoru łańcuchowego otrzymujemy:

$$\mathbb{P}(A_1\cap A_2'\cap A_3')=\mathbb{P}(A_1)\cdot\mathbb{P}(A_2'|A_1)\cdot \mathbb{P}(A_3'|A_1\cap A_2')=\frac{3}{5}\cdot \frac{2}{6}\cdot \frac{3}{7}=\frac{3}{35}.$$

W analogiczny sposób możemy obliczyć prawdopodobieństwo zdarzeń ,,Ania obejrzy komedię tylko drugiego dnia'' oraz ,,Ania obejrzy komedię tylko trzeciego dnia'', otrzymując odpowiednio $$\mathbb{P}(A_1'\cap A_2\cap A_3')=\frac{3}{35} \quad \text{oraz} \quad \mathbb{P}(A_1'\cap A_2'\cap A_3)=\frac{3}{35}.$$ Zatem ostatecznie prawdopodobieństwo zdarzenia, że w ciągu pierwszych trzech dni tygodnia Ania obejrzy komedię dokładnie raz wynosi $$\mathbb{P}(A_1\cap A_2'\cap A_3') + \mathbb{P}(A_1'\cap A_2\cap A_3') \mathbb{P}(A_1'\cap A_2'\cap A_3) = \frac{3}{35} + \frac{3}{35} + \frac{3}{35} = \frac{9}{35}.$$

Przykład 2

Bartek wielokrotnie gra w grę ,,Wichry losu''. Przy pierwszym podejściu jego szanse na wygraną wynosiły $5%$. Ale każda rozgrywka sprawia, że Bartek coraz lepiej rozumie mechanizmy gry, więc możemy przyjąć, że po każdym podejściu szanse Bartka na wygraną w kolejnej próbie rosną dwukrotnie. Ile wynosi prawdopodobieństwo, że Bartek wygra po raz pierwszy przy czwartym podejściu?

Podobnie jak w poprzednim przykładzie możemy zapisać to zdarzenie jako część wspólną zdarzeń określających co się dzieje w poszczególnych podejściach. Niech zatem $A_i$ dla $i=1,2,3,4$ oznacza zdarzenie, że Bartek wygra w $i$-tej rozgrywce. Wówczas interesujące nas zdarzenie to $A_1'\cap A_2'\cap A_3'\cap A_4$, a jego prawdopodobieństwo ponownie możemy obliczyć, używając wzoru łańcuchowego:

$$\mathbb{P}(A_1'\cap A_2'\cap A_3'\cap A_4)=\mathbb{P}(A_1')\cdot\mathbb{P}(A_2'|A_1')\cdot \mathbb{P}(A_3'|A_2' \cap A_1')\cdot \mathbb{P}(A_4|A_1'\cap A_2'\cap A_3')=0,95\cdot 0,9 \cdot 0,8 \cdot 0,4=0,2736.$$

Wzór na prawdopodobieństwo całkowite

Kolejnym wzorem, który będziemy omawiać jest wzór na prawdopodobieństwo całkowite. Wzór ten pomaga obliczyć szanse na otrzymanie danego wyniku w doświadczeniu losowym, jeśli wynik ten możemy otrzymać na podstawie różnych przypadków i dla każdego przypadku jesteśmy w stanie łatwo obliczyć jego prawdopodobieństwo. Zanim jednak podamy ten wzór, musimy najpierw wprowadzić definicję rozbicia przestrzeni.

Definicja (Rozbicie przestrzeni)

Rozbiciem przestrzeni $\Omega$ nazywamy rodzinę zdarzeń $\{A_i\}_{i\in I}$, które wykluczają się parami, zaś ich suma jest równa $\Omega$, tzn. dla każdych $i\neq j$ zachodzi $A_i\cap A_j=\emptyset$ oraz $\bigcup{i\in I}A_i = \Omega$.

Przykład 3

Załóżmy, że pewna firma ubezpieczeniowa ma $200$ klientów. Zastanawiamy się, jakie są szanse na to, że losowo wybrany klient tej firmy będzie miał w przyszłym roku wypadek samochodowy. Wówczas jako zbiór zdarzeń elementarnych $\Omega$ możemy przyjąć po prostu zbiór wszystkich klientów tej firmy. Możemy definiować różnorodne rozbicia tej przestrzeni:

  • rodzina zdarzeń $A_{[18,24]}, A_{[25,39]}, A_{[40,59]}, A_{[60,100]}$, gdzie $A_{[x,y]}$ oznacza zdarzenie, że losowo wybrany klient firmy będzie w wieku od $x$ do $y$ lat włącznie. Zakładamy tutaj, że wszyscy klienci firmy są pełnoletni i mają co najwyżej $100$ lat;
  • rodzina zdarzeń $B_0, B_1, B_2, \ldots$, gdzie $B_i$ oznacza zdarzenie, że losowo wybrany klient firmy w tym roku brał udział w $i$ wypadkach samochodowych;
  • rodzina zdarzeń $C_w, C_{mm}, C_{dm}$, gdzie zdarzenia te oznaczają, że losowo wybrany klient firmy mieszka odpowiednio na wsi, w małym mieście lub dużym mieście;
  • rodzina zdarzeń $\{D_{[x,y]}^k\}_{k,x,y}$, gdzie $D{[x,y]}^k=A_{[x,y]}\cap C_k$, czyli jest to rozbicie przestrzeni względem wieku i miejsca zamieszkania klientów firmy.

Dla każdej z tych rodzin zdarzeń właściciel firmy może na podstawie danych statystycznych oszacować, jakie jest prawdopodobieństwo, że osoba z danej grupy (czyli o określonym wieku / historii wypadkowej / miejscu zamieszkania) będzie miała w najbliższym roku wypadek samochodowy. Następnie, używając wzoru na prawdopodobieństwo całkowite, który podamy za chwilę, właściciel ten mógłby wyznaczyć szanse na to, że dowolny, losowo wybrany klient jego firmy będzie miał w przyszłym roku wypadek.

Twierdzenie (Wzór na prawdopodobieństwo całkowite)

Jeśli $A_1,A_2,\dots, A_n\in \mathcal{F}$ jest rozbiciem przestrzeni $\Omega$ na zdarzenia o dodatnim prawdopodobieństwie, to dla każdego zdarzenia $B\in \mathcal{F}$ mamy: $$ \mathbb{P}(B) = \sum_{i=1}^n \mathbb{P}(B|A_i)\mathbb{P}(A_i).$$

Uwaga: Analogiczny wzór działa również dla rozbicia przestrzeni $\Omega$ na przeliczalną rodzinę zdarzeń $\{A_i\}_{i\in I}$.

Przykład 3 (c.d.)

Załóżmy, że pewna firma ubezpieczeniowa ma $200$ klientów. Zastanawiamy się, jakie są szanse na to, że losowo wybrany klient tej firmy będzie miał w przyszłym roku wypadek samochodowy. Na podstawie danych statystycznych szacujemy, że losowo wybrana osoba w wieku od $x$ do $y$ lat ma następujące szanse na wypadek w ciągu najbliższego roku:

wiek prawdopodobieństwo wypadku
[18,24] 0,0017
[25,39] 0,001
[40,59] 0,0007
[60,100] 0,0004

Pokażemy, jak możemy obliczyć prawdopodobieństwo interesującego nas zdarzenia przy pomocy języka R, jeśli dany jest wektor $w$, który zawiera informacje o wieku każdego klienta.

# Najpierw wygenerujemy wektor w, losowo wybierając 200 liczb całkowitych z przedziału [18,100]
w <- sample(18:100, 200, replace = TRUE)
print('Wiek klientów:')
print(w)
# Skorzystamy z rozbicia zbioru klientów firmy względem wieku, czyli definiowanej wcześniej w przykładzie 3 rodziny {A_[18,24], A_[25,39], A_[40,59], A_[60,100]}
# Następnie wyznaczymy prawdopodobieństwa zdarzeń A_[18,24], A_[25,39], A_[40,59], A_[60,100], czyli policzymy, jakie są szanse, że losowo wybrany klient należy do danej grupy wiekowej
A1824 <- length(which(w %in% 18:24))/200
A2539 <- length(which(w %in% 25:39))/200
A4059 <- length(which(w %in% 40:59))/200
A60100 <- length(which(w %in% 60:100))/200
# Na koniec zastosujemy wzór na prawdopodobieństwo całkowite, aby obliczyć szanse, że losowo wybrany klient tej firmy ulegnie wypadkowi w przyszłym roku
# W tym celu musimy przemnożyć prawdopodobieństwa zdarzeń A_[x,y] przez prawdopodobieństwa wypadku w danej grupie wiekowej
p = c(0.0017, 0.001, 0.0007, 0.0004)
x = c(A1824, A2539, A4059, A60100)
wypadek = sum(p*x)
print(paste('Prawdopodobieństwo, że losowo wybrany klient firmy będzie mieć wypadek wynosi ', wypadek))
[1] "Wiek klientów:"
  [1]  24  94  44  89  50  48  61  87  88  43  95  98  63  77  74  20  23  34
 [19] 100  45  21  42  55  96  92  21  21  88  38  98  30  57  34  69 100  87
 [37]  76  33  44  71  81  81  24  99  70  89  46  76  23  64  44  53  21  22
 [55]  55  19  40  39  86  93  98  93  18  33  59  74  88  61  32  45  89  69
 [73]  61  47  30  54  92  62 100  71  52  31  46  20  45  59  40  18  60  32
 [91]  73  69  42  45  78  87  95  43  53  76  98  51  61  91  18  38  49  25
[109]  41  92  91  24  69  92  70  98  82  27  71  97  51  79  78  89  91  98
[127]  85  54  87  69  74  62  78  71  23  95  97  18  29  37  56  74  86  50
[145]  90  56  30  55  32  56  37  34  24  29  33  30  97  85  21  75  70  80
[163]  83  71  45  62  31  36  60  94  85  94  19  87  59  82  45  60  88  76
[181]  49  76  21  52  93  99  86  21  92  53  96  89  26  47  55  47  23  21
[199]  67  64
[1] "Prawdopodobieństwo, że losowo wybrany klient firmy będzie mieć wypadek wynosi  0.0007095"

Przykład 4

Ania ma listę filmów, które chciałaby obejrzeć na pewnej platformie streamingowej. Na początku tygodnia na tej liście znajdują się dwa thrillery i trzy komedie. Ania codziennie losowo wybiera do obejrzenia jeden film z listy, przy czym wszystkie wybory są równo prawdopodobne. Po jego obejrzeniu platforma wyświetla jej przykładowe filmy z tego samego gatunku, co właśnie obejrzany film, które mogłyby ją zainteresować. Ania zawsze wybiera dwa z nich i zapisuje je na swojej liście. Jakie jest prawdopodobieństwo, że trzeciego dnia Ania wybierze komedię?

Niech $B$ oznacza zdarzenie, że trzeciego dnia Ania wybierze komedię. Szanse na ten wybór zależą oczywiście od tego, jakie filmy są aktualnie na liście Ani, czyli od tego, jakie filmy Ania wybierała w poprzednich dniach. Zdefiniujmy zatem rodzinę zdarzeń $\{A_1, A_2, A_3, A_4\}$ w następujący sposób:

  • $A_1$ - w dwóch pierwszych dniach Ania wybierała tylko thrillery,
  • $A_2$ - w dwóch pierwszych dniach Ania wybierała tylko komedie,
  • $A_3$ - w dwóch pierwszych dniach Ania wybierała kolejno komedię i thriller,
  • $A_4$ - w dwóch pierwszych dniach Ania wybierała kolejno thriller i komedię.

Wówczas ta rodzina stanowi rozbicie przestrzeni na zdarzenia o dodatnim prawdopodobieństwie. Ponadto, korzystając ze wzoru łańcuchowego możemy łatwo obliczyć prawdopodobieństwa tych zdarzeń:

  • $\mathbb{P}(A_1)=\frac25 \cdot \frac36 = \frac15$,
  • $\mathbb{P}(A_2)=\frac35 \cdot \frac46 = \frac25$,
  • $\mathbb{P}(A_3)=\frac35 \cdot \frac26 = \frac15$,
  • $\mathbb{P}(A_4)=\frac25 \cdot \frac36 = \frac15$.

Wiedząc, jakie filmy obejrzała Ania przez pierwsze dwa dni jesteśmy w stanie bez problemu obliczyć prawdopodobieństwo obejrzenia przez nią komedii trzeciego dnia, np. $\mathbb{P}(B|A_1)=\frac37$ (bo po obejrzeniu dwóch thrillerów trzeciego dnia Ania ma na liście cztery thrillery i trzy komedie). Na koniec możemy skorzystać ze wzoru na prawdopodobieństwo całkowite:

$$ \mathbb{P}(B)=\mathbb{P}(B|A_1)\cdot \mathbb{P}(A_1)+\mathbb{P}(B|A_2)\cdot \mathbb{P}(A_2)+\mathbb{P}(B|A_3)\cdot \mathbb{P}(A_3)+\mathbb{P}(B|A_4)\cdot \mathbb{P}(A_4)= \frac37\cdot \frac15+\frac57\cdot\frac25+\frac47\cdot\frac15+\frac47\cdot\frac15=\frac{21}{35}=\frac{3}{5}.$$

Wzór Bayesa

Na koniec zaprezentujemy wzór Bayesa, który stosujemy najczęściej wtedy, gdy mamy do czynienia z wieloetapowym doświadczeniem losowym i wiemy, jaki jest jego końcowy wynik, ale chcemy oszacować szanse na to, że całe doświadczenie miało pewien ustalony przebieg.

Twierdzenie (Wzór Bayesa) Jeśli $A_1,A_2,\dots, A_n\in \mathcal{F}$ jest rozbiciem przestrzeni $\Omega$ na zdarzenia o dodatnim prawdopodobieństwie oraz zdarzenie $B\in \mathcal{F}$ ma również dodatnie prawdopodobieństwo, to dla każdego $i=1,2,\dots, n$ zachodzi: $$\mathbb{P}(A_i|B)=\frac{\mathbb{P}(B|A_i)\cdot\mathbb{P}(A_i)}{\mathbb{P}(B)} =\frac{\mathbb{P}(B|A_i)\cdot\mathbb{P}(A_i)}{\sum_{j=1}^n \mathbb{P}(B|A_j)\cdot\mathbb{P}(A_j)},.$$

Przykład 5

Ania ma listę filmów, które chciałaby obejrzeć na pewnej platformie streamingowej. Na początku tygodnia na tej liście znajdują się dwa thrillery i trzy komedie. Ania codziennie losowo wybiera do obejrzenia jeden film z listy, przy czym wszystkie wybory są równo prawdopodobne. Po jego obejrzeniu platforma wyświetla jej przykładowe filmy z tego samego gatunku, co właśnie obejrzany film, które mogłyby ją zainteresować. Ania zawsze wybiera dwa z nich i zapisuje je na swojej liście. Okazuje się, że trzeciego dnia Ania obejrzała komedię. Jakie są szanse, że przez pierwsze dwa dni również oglądała komedie?

Niech zdarzenia $B, A_1, A_2, A_3, A_4$ będą definiowane tak, jak w przykładzie 4. Interesuje nas prawdopodobieństwo zdarzenia, że przez pierwsze dwa dni Ania oglądała tylko komedię. Wiemy natomiast, że trzeciego dnia Ania obejrzała komedię, więc tak naprawdę chcemy obliczyć prawdopodobieństwo warunkowe $\mathbb{P}(A_2|B)$. Ponieważ zdecydowanie łatwiej byłoby obliczyć prawdopodobieństwo warunkowe $\mathbb{P}(B|A_2)$, to wykorzystamy wzór Bayesa. Skorzystamy ponadto z obliczeń z przykładu 4. Otrzymujemy

$$\mathbb{P}(A_2|B)=\frac{\mathbb{P}(B|A_2)\cdot\mathbb{P}(A_2)}{\mathbb{P}(B)}=\frac{\frac57 \cdot \frac25}{\frac35}=\frac{10}{21}.$$

Zauważmy, że $\mathbb{P}(A_2|B)>\mathbb{P}(A_2)$, co nie powinno nas dziwić. Jeśli każda obejrzana komedia zwiększa liczbę komedii na liście, to fakt, że Ania trzeciego dnia obejrzała komedię może sugerować, że wcześniej też chętniej wybierała filmy z tego gatunku.

Przykład 6

Rafał wysyła do Adama wiadomość w postaci ciągu binarnego. Niestety w trakcie komunikacji mogą pojawić się błędy. Szansa na to, że zamiast $0$ zostanie wysłana $1$ wynosi $10%$, a szansa na wysłanie $0$ zamiast $1$ to $5%$. Ponadto wiemy, że w wiadomościach wysyłanych przez Rafała częstość wysyłania $0$ w stosunku do częstości wysyłania $1$ to $1:9$. W pewnym momencie Adam otrzymał $0$. Jaka jest szansa, że ten bit jest poprawny (tzn. Rafał faktycznie wysłał $0$)?

Niech $B$ oznacza zdarzenie, że Adam otrzymał $0$. Wiemy, że szanse na to zależą od tego, co wysłał Rafał, więc wprowadzamy rozbicie przestrzeni na dwa zdarzenia o dodatnim prawdopodobieństwie:

  • $A_0$ - Rafał wysłał zero,
  • $A_1$ - Rafał wysłał jedynkę.

Na podstawie danych z zadania dotyczących częstości wysyłania poszczególnych bitów możemy stwierdzić, że $\mathbb{P}(A_0)=0{,}1$, a $\mathbb{P}(A_1)=0{,}9$. Znamy też szanse na błędny przekaz, więc jesteśmy w stanie wyznaczyć prawdopodobieństwo otrzymania $0$ w każdym przypadku: $\mathbb{P}(B|A_0)=0{,}9$ i $\mathbb{P}(B|A_1)=0{,}05$. Naszym celem jest obliczenie szans na to, że Rafał wysłał $0$, jeśli wiemy, że Adam otrzymał $0$, czyli $\mathbb{P}(A_0|B)$. Ponownie skorzystamy z wzoru Bayesa:

$$\mathbb{P}(A_0|B)=\frac{\mathbb{P}(B|A_0)\cdot\mathbb{P}(A_0)}{ \mathbb{P}(B|A_0)\cdot\mathbb{P}(A_0)+\mathbb{P}(B|A_1)\cdot \mathbb{P}(A_1)}=\frac{0{,}9\cdot 0{,}1}{0{,}9\cdot 0{,}1+0{,}05\cdot 0{,}9}=\frac{0{,}09}{0{,}135}=\frac23.$$