{ "cells": [ { "cell_type": "markdown", "id": "67e767", "metadata": { "collapsed": false }, "source": [ "# Prawdopodobieństwo całkowite. Wzór Bayesa." ] }, { "cell_type": "markdown", "id": "4d43b7", "metadata": { "collapsed": false }, "source": [ "**Treści kształcenia** : Prawdopodobieństwo warunkowe. Wzór na prawdopodobieństwo całkowite, twierdzenie Bayesa i wzór łańcuchowy. \n", "\n", "**Efekty kształcenia**: Student/ka potrafi konstruować przestrzenie probabilistyczne dla zadanych problemów rachunku prawdopodobieństwa; potrafi wyrazić podstawowe problemy w języku zdarzeń losowych; umie zastosować poznane twierdzenia i własności przestrzeni probabilistycznych do rozwiązywania prostych zagadnień rachunku prawdopodobieństwa." ] }, { "cell_type": "markdown", "id": "a0dc8f", "metadata": { "collapsed": false }, "source": [ "## Wstęp \n", "\n", "Na dzisiejszych zajęciach dowiemy się, jak możemy wykorzystywać omawiane tydzień wcześniej prawdopodobieństwo warunkowe, aby badać bardziej skomplikowane zdarzenia losowe, których prawdopodobieństwo zależy od realizacji innych zdarzeń. " ] }, { "cell_type": "markdown", "id": "5798df", "metadata": { "collapsed": false }, "source": [ "## Wzór łańcuchowy\n", "\n", "Nasze rozważania rozpoczniemy od omówienia wzoru łańcuchowego, który stosujemy do obliczenia prawdopodobieństwa zajścia **jednocześnie** szeregu zdarzeń. Wzór ten przydaje się zwłaszcza w przypadku doświadczeń losowych wieloetapowych, w których wyniki danego etapu zależą od tego, co wydarzyło się w etapach wcześniejszych.\n", "\n", "**Twierdzenie (Wzór łańcuchowy)**\n", "\n", "Jeżeli zdarzenia $A_1, A_2, \\ldots, A_n$ spełniają warunek $\\mathbb{P}(A_1\\cap A_2\\cap \\ldots\\cap A_{n-1})> 0$, to \n", "\n", "$$ \\mathbb{P}(A_1\\cap A_2\\cap\\ldots\\cap A_n) = \\mathbb{P}(A_1)\\cdot\\mathbb{P}(A_2|A_1)\\cdot\\ldots\\cdot\\mathbb{P}(A_n|A_1 \\cap A_2 \\cap \\ldots \\cap A_{n-1}).$$\n", "\n", "**Uwaga:** W typowych zastosowaniach będziemy mieli do czynienia z eksperymentem, który ma $n$ etapów, a zdarzenia $A_i$ będzie odpowiadało temu, co zdarzyło się w $i$-tym etapie tego doświadczenia.\n", "\n", "**Przykład 1**\n", "\n", "Ania ma listę filmów, które chciałaby obejrzeć na pewnej platformie streamingowej. Na początku tygodnia na tej liście znajdują się dwa thrillery i trzy komedie. Ania codziennie losowo wybiera do obejrzenia jeden film z listy, przy czym wszystkie wybory są równo prawdopodobne. Po jego obejrzeniu platforma wyświetla jej przykładowe filmy z tego samego gatunku, co właśnie obejrzany film, które mogłyby ją zainteresować. Ania zawsze wybiera dwa z nich i zapisuje je na swojej liście. Jakie jest prawdopodobieństwo, że:\n", "\n", "- w ciągu pierwszych trzech dni tygodnia Ania będzie oglądać same komedie?\n", "\n", "Dla $i=1,2,3$ niech $A_i$ oznacza zdarzenie, że $i$-tego dnia Ania obejrzała komedię. Zauważmy, że łatwo jest obliczyć szanse na wybór komedii danego dnia, jeśli wiemy, ile aktualnie komedii i thrillerów znajduje się na liście Ani, czyli jakie filmy oglądała w poprzednich dniach. Przykładowo, możemy zauważyć, że $\\mathbb{P}(A_2|A_1)=\\frac{4}{6}$, bo jeśli Ania pierwszego dnia obejrzała komedię, to ta komedia znika z jej listy, a w zamian pojawiają się na niej dwie inne komedie. Zatem w tej sytuacji aktualna liczba filmów na liście to dwa thrillery i cztery komedie. To sugeruje nam, że warto zastosować wzór łańcuchowy, aby obliczyć prawdopodobieństwo zdarzenia ,,Ania w ciągu pierwszych trzech dni tygodnia będzie oglądać same komedie\", które można zapisać w postaci $A_1\\cap A_2\\cap A_3$. \n", "Zaczniemy od obliczenia prawdopodobieństw znajdujących się po prawej stronie wzoru łańcuchowego:\n", "\n", "* $\\mathbb{P}(A_1)=\\frac{3}{5}$ (bo pierwszego dnia na liście Ani znajdują się dwa thrillery i trzy komedie),\n", "* $\\mathbb{P}(A_2|A_1)=\\frac{4}{6}$ (to zauważyliśmy wcześniej),\n", "* $\\mathbb{P}(A_3|A_1\\cap A_2)=\\frac{5}{7}$ (bo jeśli Ania przez pierwsze dwa dni oglądała komedie, to trzeciego dnia na jej liście są dwa thrillery i pięć komedii).\n", "\n", "Zatem ostatecznie prawdopodobieństwo zdarzenia, że Ania w ciągu pierwszych trzech dni tygodnia będzie oglądać same komedie to:\n", "\n", "$$\\mathbb{P}(A_1\\cap A_2\\cap A_3)=\\mathbb{P}(A_1)\\cdot\\mathbb{P}(A_2|A_1)\\cdot \\mathbb{P}(A_3|A_1\\cap A_2)=\\frac{3}{5}\\cdot \\frac{4}{6}\\cdot \\frac{5}{7}=\\frac{2}{7}.$$\n", "\n", "- w ciągu pierwszych trzech dni tygodnia Ania dokładnie raz obejrzy komedię?\n", "\n", "Zauważmy, że warto podzielić to zdarzenie na trzy parami rozłączne przypadki: Ania obejrzy komedię tylko pierwszego dnia, Ania obejrzy komedię tylko drugiego dnia i Ania obejrzy komedię tylko trzeciego dnia. W każdym z tych trzech przypadków wiemy dokładnie, co powinno się wydarzyć każdego dnia, a więc do obliczania jego szans będziemy mogli użyć wzoru łańcuchowego. Przykładowo, rozważmy zdarzenie ,,Ania obejrzy komedię tylko pierwszego dnia''. Zauważmy, że to zdarzenie możemy zapisać w postaci $A_1\\cap A_2'\\cap A_3'$, używając oznaczeń z poprzedniego podpunktu. Na podstawie wzoru łańcuchowego otrzymujemy:\n", "\n", "$$\\mathbb{P}(A_1\\cap A_2'\\cap A_3')=\\mathbb{P}(A_1)\\cdot\\mathbb{P}(A_2'|A_1)\\cdot \\mathbb{P}(A_3'|A_1\\cap A_2')=\\frac{3}{5}\\cdot \\frac{2}{6}\\cdot \\frac{3}{7}=\\frac{3}{35}.$$\n", "\n", "W analogiczny sposób możemy obliczyć prawdopodobieństwo zdarzeń ,,Ania obejrzy komedię tylko drugiego dnia'' oraz ,,Ania obejrzy komedię tylko trzeciego dnia'', otrzymując odpowiednio \n", "$$\\mathbb{P}(A_1'\\cap A_2\\cap A_3')=\\frac{3}{35} \\quad \\text{oraz} \\quad \\mathbb{P}(A_1'\\cap A_2'\\cap A_3)=\\frac{3}{35}.$$ \n", "Zatem ostatecznie prawdopodobieństwo zdarzenia, że w ciągu pierwszych trzech dni tygodnia Ania obejrzy komedię dokładnie raz wynosi \n", "$$\\mathbb{P}(A_1\\cap A_2'\\cap A_3') + \\mathbb{P}(A_1'\\cap A_2\\cap A_3') \\mathbb{P}(A_1'\\cap A_2'\\cap A_3) = \\frac{3}{35} + \\frac{3}{35} + \\frac{3}{35} = \\frac{9}{35}.$$\n", "\n", "**Przykład 2**\n", "\n", "Bartek wielokrotnie gra w grę ,,Wichry losu''. Przy pierwszym podejściu jego szanse na wygraną wynosiły $5\\%$. Ale każda rozgrywka sprawia, że Bartek coraz lepiej rozumie mechanizmy gry, więc możemy przyjąć, że po każdym podejściu szanse Bartka na wygraną w kolejnej próbie rosną dwukrotnie. Ile wynosi prawdopodobieństwo, że Bartek wygra po raz pierwszy przy czwartym podejściu?\n", "\n", "Podobnie jak w poprzednim przykładzie możemy zapisać to zdarzenie jako część wspólną zdarzeń określających co się dzieje w poszczególnych podejściach. Niech zatem $A_i$ dla $i=1,2,3,4$ oznacza zdarzenie, że Bartek wygra w $i$-tej rozgrywce. Wówczas interesujące nas zdarzenie to $A_1'\\cap A_2'\\cap A_3'\\cap A_4$, a jego prawdopodobieństwo ponownie możemy obliczyć, używając wzoru łańcuchowego:\n", "\n", "$$\\mathbb{P}(A_1'\\cap A_2'\\cap A_3'\\cap A_4)=\\mathbb{P}(A_1')\\cdot\\mathbb{P}(A_2'|A_1')\\cdot \\mathbb{P}(A_3'|A_2' \\cap A_1')\\cdot \\mathbb{P}(A_4|A_1'\\cap A_2'\\cap A_3')=0,95\\cdot 0,9 \\cdot 0,8 \\cdot 0,4=0,2736.$$\n", "\n" ] }, { "cell_type": "markdown", "id": "68fbc2", "metadata": { "collapsed": false }, "source": [ "## Wzór na prawdopodobieństwo całkowite\n", "\n", "Kolejnym wzorem, który będziemy omawiać jest wzór na prawdopodobieństwo całkowite. Wzór ten pomaga obliczyć szanse na otrzymanie danego wyniku w doświadczeniu losowym, jeśli wynik ten możemy otrzymać na podstawie różnych przypadków i dla każdego przypadku jesteśmy w stanie łatwo obliczyć jego prawdopodobieństwo. Zanim jednak podamy ten wzór, musimy najpierw wprowadzić definicję rozbicia przestrzeni. \n", "\n", "**Definicja (Rozbicie przestrzeni)**\n", "\n", "**Rozbiciem przestrzeni** $\\Omega$ nazywamy rodzinę zdarzeń $\\{A_i\\}_{i\\in I}$, które wykluczają się parami, zaś ich suma jest równa $\\Omega$, tzn. dla każdych $i\\neq j$ zachodzi $A_i\\cap A_j=\\emptyset$ oraz $\\bigcup_{i\\in I}A_i = \\Omega$.\n", "\n", "**Przykład 3**\n", "\n", "Załóżmy, że pewna firma ubezpieczeniowa ma $200$ klientów. Zastanawiamy się, jakie są szanse na to, że losowo wybrany klient tej firmy będzie miał w przyszłym roku wypadek samochodowy. Wówczas jako zbiór zdarzeń elementarnych $\\Omega$ możemy przyjąć po prostu zbiór wszystkich klientów tej firmy. Możemy definiować różnorodne rozbicia tej przestrzeni:\n", "\n", "* rodzina zdarzeń $A_{[18,24]}, A_{[25,39]}, A_{[40,59]}, A_{[60,100]}$, gdzie $A_{[x,y]}$ oznacza zdarzenie, że losowo wybrany klient firmy będzie w wieku od $x$ do $y$ lat włącznie. Zakładamy tutaj, że wszyscy klienci firmy są pełnoletni i mają co najwyżej $100$ lat;\n", "* rodzina zdarzeń $B_0, B_1, B_2, \\ldots$, gdzie $B_i$ oznacza zdarzenie, że losowo wybrany klient firmy w tym roku brał udział w $i$ wypadkach samochodowych;\n", "* rodzina zdarzeń $C_w, C_{mm}, C_{dm}$, gdzie zdarzenia te oznaczają, że losowo wybrany klient firmy mieszka odpowiednio na wsi, w małym mieście lub dużym mieście;\n", "* rodzina zdarzeń $\\{D_{[x,y]}^k\\}_{k,x,y}$, gdzie $D_{[x,y]}^k=A_{[x,y]}\\cap C_k$, czyli jest to rozbicie przestrzeni względem wieku i miejsca zamieszkania klientów firmy.\n", "\n", "Dla każdej z tych rodzin zdarzeń właściciel firmy może na podstawie danych statystycznych oszacować, jakie jest prawdopodobieństwo, że osoba z danej grupy (czyli o określonym wieku / historii wypadkowej / miejscu zamieszkania) będzie miała w najbliższym roku wypadek samochodowy. Następnie, używając wzoru na prawdopodobieństwo całkowite, który podamy za chwilę, właściciel ten mógłby wyznaczyć szanse na to, że dowolny, losowo wybrany klient jego firmy będzie miał w przyszłym roku wypadek. \n", "\n", "**Twierdzenie (Wzór na prawdopodobieństwo całkowite)**\n", "\n", "Jeśli $A_1,A_2,\\dots, A_n\\in \\mathcal{F}$ jest rozbiciem przestrzeni $\\Omega$ na zdarzenia o dodatnim prawdopodobieństwie, to dla każdego zdarzenia $B\\in \\mathcal{F}$ mamy:\n", "$$ \\mathbb{P}(B) = \\sum_{i=1}^n \\mathbb{P}(B|A_i)\\mathbb{P}(A_i).$$\n", "\n", "**Uwaga:** Analogiczny wzór działa również dla rozbicia przestrzeni $\\Omega$ na przeliczalną rodzinę zdarzeń $\\{A_i\\}_{i\\in I}$.\n", "\n", "**Przykład 3 (c.d.)**\n", "\n", "Załóżmy, że pewna firma ubezpieczeniowa ma $200$ klientów. Zastanawiamy się, jakie są szanse na to, że losowo wybrany klient tej firmy będzie miał w przyszłym roku wypadek samochodowy. Na podstawie danych statystycznych szacujemy, że losowo wybrana osoba w wieku od $x$ do $y$ lat ma następujące szanse na wypadek w ciągu najbliższego roku:\n", "\n", "| wiek | prawdopodobieństwo wypadku |\n", "| --- | --- |\n", "| [18,24] | 0,0017 |\n", "| [25,39] | 0,001 |\n", "| [40,59] | 0,0007|\n", "| [60,100] | 0,0004 |\n", "\n", "Pokażemy, jak możemy obliczyć prawdopodobieństwo interesującego nas zdarzenia przy pomocy języka R, jeśli dany jest wektor $w$, który zawiera informacje o wieku każdego klienta." ] }, { "cell_type": "code", "execution_count": 3, "id": "08ce84", "metadata": { "collapsed": false }, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "[1] \"Wiek klientów:\"\n" ] }, { "name": "stdout", "output_type": "stream", "text": [ " [1] 24 94 44 89 50 48 61 87 88 43 95 98 63 77 74 20 23 34\n", " [19] 100 45 21 42 55 96 92 21 21 88 38 98 30 57 34 69 100 87\n", " [37] 76 33 44 71 81 81 24 99 70 89 46 76 23 64 44 53 21 22\n", " [55] 55 19 40 39 86 93 98 93 18 33 59 74 88 61 32 45 89 69\n", " [73] 61 47 30 54 92 62 100 71 52 31 46 20 45 59 40 18 60 32\n", " [91] 73 69 42 45 78 87 95 43 53 76 98 51 61 91 18 38 49 25\n", "[109] 41 92 91 24 69 92 70 98 82 27 71 97 51 79 78 89 91 98\n", "[127] 85 54 87 69 74 62 78 71 23 95 97 18 29 37 56 74 86 50\n", "[145] 90 56 30 55 32 56 37 34 24 29 33 30 97 85 21 75 70 80\n", "[163] 83 71 45 62 31 36 60 94 85 94 19 87 59 82 45 60 88 76\n", "[181] 49 76 21 52 93 99 86 21 92 53 96 89 26 47 55 47 23 21\n", "[199] 67 64\n" ] }, { "name": "stdout", "output_type": "stream", "text": [ "[1] \"Prawdopodobieństwo, że losowo wybrany klient firmy będzie mieć wypadek wynosi 0.0007095\"\n" ] } ], "source": [ "# Najpierw wygenerujemy wektor w, losowo wybierając 200 liczb całkowitych z przedziału [18,100]\n", "w <- sample(18:100, 200, replace = TRUE)\n", "print('Wiek klientów:')\n", "print(w)\n", "# Skorzystamy z rozbicia zbioru klientów firmy względem wieku, czyli definiowanej wcześniej w przykładzie 3 rodziny {A_[18,24], A_[25,39], A_[40,59], A_[60,100]}\n", "# Następnie wyznaczymy prawdopodobieństwa zdarzeń A_[18,24], A_[25,39], A_[40,59], A_[60,100], czyli policzymy, jakie są szanse, że losowo wybrany klient należy do danej grupy wiekowej\n", "A1824 <- length(which(w %in% 18:24))/200\n", "A2539 <- length(which(w %in% 25:39))/200\n", "A4059 <- length(which(w %in% 40:59))/200\n", "A60100 <- length(which(w %in% 60:100))/200\n", "# Na koniec zastosujemy wzór na prawdopodobieństwo całkowite, aby obliczyć szanse, że losowo wybrany klient tej firmy ulegnie wypadkowi w przyszłym roku\n", "# W tym celu musimy przemnożyć prawdopodobieństwa zdarzeń A_[x,y] przez prawdopodobieństwa wypadku w danej grupie wiekowej\n", "p = c(0.0017, 0.001, 0.0007, 0.0004)\n", "x = c(A1824, A2539, A4059, A60100)\n", "wypadek = sum(p*x)\n", "print(paste('Prawdopodobieństwo, że losowo wybrany klient firmy będzie mieć wypadek wynosi ', wypadek))" ] }, { "cell_type": "markdown", "id": "2120a9", "metadata": { "collapsed": false }, "source": [ "**Przykład 4**\n", "\n", "Ania ma listę filmów, które chciałaby obejrzeć na pewnej platformie streamingowej. Na początku tygodnia na tej liście znajdują się dwa thrillery i trzy komedie. Ania codziennie losowo wybiera do obejrzenia jeden film z listy, przy czym wszystkie wybory są równo prawdopodobne. Po jego obejrzeniu platforma wyświetla jej przykładowe filmy z tego samego gatunku, co właśnie obejrzany film, które mogłyby ją zainteresować. Ania zawsze wybiera dwa z nich i zapisuje je na swojej liście. Jakie jest prawdopodobieństwo, że trzeciego dnia Ania wybierze komedię?\n", "\n", "Niech $B$ oznacza zdarzenie, że trzeciego dnia Ania wybierze komedię. Szanse na ten wybór zależą oczywiście od tego, jakie filmy są aktualnie na liście Ani, czyli od tego, jakie filmy Ania wybierała w poprzednich dniach. Zdefiniujmy zatem rodzinę zdarzeń $\\{A_1, A_2, A_3, A_4\\}$ w następujący sposób:\n", "\n", "* $A_1$ - w dwóch pierwszych dniach Ania wybierała tylko thrillery,\n", "* $A_2$ - w dwóch pierwszych dniach Ania wybierała tylko komedie,\n", "* $A_3$ - w dwóch pierwszych dniach Ania wybierała kolejno komedię i thriller,\n", "* $A_4$ - w dwóch pierwszych dniach Ania wybierała kolejno thriller i komedię.\n", "\n", "Wówczas ta rodzina stanowi rozbicie przestrzeni na zdarzenia o dodatnim prawdopodobieństwie. Ponadto, korzystając ze wzoru łańcuchowego możemy łatwo obliczyć prawdopodobieństwa tych zdarzeń:\n", "\n", "* $\\mathbb{P}(A_1)=\\frac25 \\cdot \\frac36 = \\frac15$,\n", "* $\\mathbb{P}(A_2)=\\frac35 \\cdot \\frac46 = \\frac25$,\n", "* $\\mathbb{P}(A_3)=\\frac35 \\cdot \\frac26 = \\frac15$,\n", "* $\\mathbb{P}(A_4)=\\frac25 \\cdot \\frac36 = \\frac15$.\n", "\n", "Wiedząc, jakie filmy obejrzała Ania przez pierwsze dwa dni jesteśmy w stanie bez problemu obliczyć prawdopodobieństwo obejrzenia przez nią komedii trzeciego dnia, np. $\\mathbb{P}(B|A_1)=\\frac37$ (bo po obejrzeniu dwóch thrillerów trzeciego dnia Ania ma na liście cztery thrillery i trzy komedie). Na koniec możemy skorzystać ze wzoru na prawdopodobieństwo całkowite:\n", "\n", "$$ \\mathbb{P}(B)=\\mathbb{P}(B|A_1)\\cdot \\mathbb{P}(A_1)+\\mathbb{P}(B|A_2)\\cdot \\mathbb{P}(A_2)+\\mathbb{P}(B|A_3)\\cdot \\mathbb{P}(A_3)+\\mathbb{P}(B|A_4)\\cdot \\mathbb{P}(A_4)= \\frac37\\cdot \\frac15+\\frac57\\cdot\\frac25+\\frac47\\cdot\\frac15+\\frac47\\cdot\\frac15=\\frac{21}{35}=\\frac{3}{5}.$$" ] }, { "cell_type": "markdown", "id": "40da12", "metadata": { "collapsed": false }, "source": [ "## Wzór Bayesa\n", "\n", "Na koniec zaprezentujemy wzór Bayesa, który stosujemy najczęściej wtedy, gdy mamy do czynienia z wieloetapowym doświadczeniem losowym i wiemy, jaki jest jego końcowy wynik, ale chcemy oszacować szanse na to, że całe doświadczenie miało pewien ustalony przebieg.\n", "\n", "**Twierdzenie (Wzór Bayesa)**\n", "Jeśli $A_1,A_2,\\dots, A_n\\in \\mathcal{F}$ jest rozbiciem przestrzeni $\\Omega$ na zdarzenia o dodatnim prawdopodobieństwie oraz zdarzenie $B\\in \\mathcal{F}$ ma również dodatnie prawdopodobieństwo, to dla każdego $i=1,2,\\dots, n$ zachodzi:\n", "$$\\mathbb{P}(A_i|B)=\\frac{\\mathbb{P}(B|A_i)\\cdot\\mathbb{P}(A_i)}{\\mathbb{P}(B)} =\\frac{\\mathbb{P}(B|A_i)\\cdot\\mathbb{P}(A_i)}{\\sum_{j=1}^n \\mathbb{P}(B|A_j)\\cdot\\mathbb{P}(A_j)}\\,.$$\n", "\n", "**Przykład 5**\n", "\n", "Ania ma listę filmów, które chciałaby obejrzeć na pewnej platformie streamingowej. Na początku tygodnia na tej liście znajdują się dwa thrillery i trzy komedie. Ania codziennie losowo wybiera do obejrzenia jeden film z listy, przy czym wszystkie wybory są równo prawdopodobne. Po jego obejrzeniu platforma wyświetla jej przykładowe filmy z tego samego gatunku, co właśnie obejrzany film, które mogłyby ją zainteresować. Ania zawsze wybiera dwa z nich i zapisuje je na swojej liście. Okazuje się, że trzeciego dnia Ania obejrzała komedię. Jakie są szanse, że przez pierwsze dwa dni również oglądała komedie?\n", "\n", "Niech zdarzenia $B, A_1, A_2, A_3, A_4$ będą definiowane tak, jak w przykładzie 4. Interesuje nas prawdopodobieństwo zdarzenia, że przez pierwsze dwa dni Ania oglądała tylko komedię. Wiemy natomiast, że trzeciego dnia Ania obejrzała komedię, więc tak naprawdę chcemy obliczyć prawdopodobieństwo warunkowe $\\mathbb{P}(A_2|B)$. Ponieważ zdecydowanie łatwiej byłoby obliczyć prawdopodobieństwo warunkowe $\\mathbb{P}(B|A_2)$, to wykorzystamy wzór Bayesa. Skorzystamy ponadto z obliczeń z przykładu 4. Otrzymujemy\n", "\n", "$$\\mathbb{P}(A_2|B)=\\frac{\\mathbb{P}(B|A_2)\\cdot\\mathbb{P}(A_2)}{\\mathbb{P}(B)}=\\frac{\\frac57 \\cdot \\frac25}{\\frac35}=\\frac{10}{21}.$$\n", "\n", "Zauważmy, że $\\mathbb{P}(A_2|B)>\\mathbb{P}(A_2)$, co nie powinno nas dziwić. Jeśli każda obejrzana komedia zwiększa liczbę komedii na liście, to fakt, że Ania trzeciego dnia obejrzała komedię może sugerować, że wcześniej też chętniej wybierała filmy z tego gatunku.\n", "\n", "**Przykład 6**\n", "\n", "Rafał wysyła do Adama wiadomość w postaci ciągu binarnego. Niestety w trakcie komunikacji mogą pojawić się błędy. Szansa na to, że zamiast $0$ zostanie wysłana $1$ wynosi $10\\%$, a szansa na wysłanie $0$ zamiast $1$ to $5\\%$. Ponadto wiemy, że w wiadomościach wysyłanych przez Rafała częstość wysyłania $0$ w stosunku do częstości wysyłania $1$ to $1:9$. W pewnym momencie Adam otrzymał $0$. Jaka jest szansa, że ten bit jest poprawny (tzn. Rafał faktycznie wysłał $0$)?\n", "\n", "Niech $B$ oznacza zdarzenie, że Adam otrzymał $0$. Wiemy, że szanse na to zależą od tego, co wysłał Rafał, więc wprowadzamy rozbicie przestrzeni na dwa zdarzenia o dodatnim prawdopodobieństwie: \n", "\n", "* $A_0$ - Rafał wysłał zero,\n", "* $A_1$ - Rafał wysłał jedynkę.\n", "\n", "Na podstawie danych z zadania dotyczących częstości wysyłania poszczególnych bitów możemy stwierdzić, że $\\mathbb{P}(A_0)=0{,}1$, a $\\mathbb{P}(A_1)=0{,}9$. Znamy też szanse na błędny przekaz, więc jesteśmy w stanie wyznaczyć prawdopodobieństwo otrzymania $0$ w każdym przypadku: $\\mathbb{P}(B|A_0)=0{,}9$ i $\\mathbb{P}(B|A_1)=0{,}05$. Naszym celem jest obliczenie szans na to, że Rafał wysłał $0$, jeśli wiemy, że Adam otrzymał $0$, czyli $\\mathbb{P}(A_0|B)$. Ponownie skorzystamy z wzoru Bayesa:\n", "\n", "$$\\mathbb{P}(A_0|B)=\\frac{\\mathbb{P}(B|A_0)\\cdot\\mathbb{P}(A_0)}{ \\mathbb{P}(B|A_0)\\cdot\\mathbb{P}(A_0)+\\mathbb{P}(B|A_1)\\cdot \\mathbb{P}(A_1)}=\\frac{0{,}9\\cdot 0{,}1}{0{,}9\\cdot 0{,}1+0{,}05\\cdot 0{,}9}=\\frac{0{,}09}{0{,}135}=\\frac23.$$" ] }, { "cell_type": "code", "execution_count": 0, "id": "5d1051", "metadata": { "collapsed": false }, "outputs": [ ], "source": [ ] } ], "metadata": { "kernelspec": { "argv": [ "/usr/bin/R", "-e", "IRkernel::main()", "--args", "{connection_file}" ], "display_name": "R (system-wide)", "env": { }, "language": "r", "metadata": { "cocalc": { "description": "R statistical programming language", "priority": 10, "url": "https://www.r-project.org/" } }, "name": "ir", "resource_dir": "/ext/jupyter/kernels/ir" }, "language_info": { "codemirror_mode": "r", "file_extension": ".r", "mimetype": "text/x-r-source", "name": "R", "pygments_lexer": "r", "version": "4.4.1" } }, "nbformat": 4, "nbformat_minor": 4 }