Upload files to "Przewodnik_studenta_cwiczenia"

This commit is contained in:
xcjajx 2024-11-09 17:10:10 +01:00
parent 83b36dbf60
commit 1113311de9

View File

@ -0,0 +1,309 @@
{
"cells": [
{
"cell_type": "markdown",
"id": "67e767",
"metadata": {
"collapsed": false
},
"source": [
"# Prawdopodobieństwo całkowite. Wzór Bayesa."
]
},
{
"cell_type": "markdown",
"id": "4d43b7",
"metadata": {
"collapsed": false
},
"source": [
"**Treści kształcenia** : Prawdopodobieństwo warunkowe. Wzór na prawdopodobieństwo całkowite, twierdzenie Bayesa i wzór łańcuchowy. \n",
"\n",
"**Efekty kształcenia**: Student/ka potrafi konstruować przestrzenie probabilistyczne dla zadanych problemów rachunku prawdopodobieństwa; potrafi wyrazić podstawowe problemy w języku zdarzeń losowych; umie zastosować poznane twierdzenia i własności przestrzeni probabilistycznych do rozwiązywania prostych zagadnień rachunku prawdopodobieństwa."
]
},
{
"cell_type": "markdown",
"id": "a0dc8f",
"metadata": {
"collapsed": false
},
"source": [
"## Wstęp \n",
"\n",
"Na dzisiejszych zajęciach dowiemy się, jak możemy wykorzystywać omawiane tydzień wcześniej prawdopodobieństwo warunkowe, aby badać bardziej skomplikowane zdarzenia losowe, których prawdopodobieństwo zależy od realizacji innych zdarzeń. "
]
},
{
"cell_type": "markdown",
"id": "5798df",
"metadata": {
"collapsed": false
},
"source": [
"## Wzór łańcuchowy\n",
"\n",
"Nasze rozważania rozpoczniemy od omówienia wzoru łańcuchowego, który stosujemy do obliczenia prawdopodobieństwa zajścia **jednocześnie** szeregu zdarzeń. Wzór ten przydaje się zwłaszcza w przypadku doświadczeń losowych wieloetapowych, w których wyniki danego etapu zależą od tego, co wydarzyło się w etapach wcześniejszych.\n",
"\n",
"**Twierdzenie (Wzór łańcuchowy)**\n",
"\n",
"Jeżeli zdarzenia $A_1, A_2, \\ldots, A_n$ spełniają warunek $\\mathbb{P}(A_1\\cap A_2\\cap \\ldots\\cap A_{n-1})> 0$, to \n",
"\n",
"$$ \\mathbb{P}(A_1\\cap A_2\\cap\\ldots\\cap A_n) = \\mathbb{P}(A_1)\\cdot\\mathbb{P}(A_2|A_1)\\cdot\\ldots\\cdot\\mathbb{P}(A_n|A_1 \\cap A_2 \\cap \\ldots \\cap A_{n-1}).$$\n",
"\n",
"**Uwaga:** W typowych zastosowaniach będziemy mieli do czynienia z eksperymentem, który ma $n$ etapów, a zdarzenia $A_i$ będzie odpowiadało temu, co zdarzyło się w $i$-tym etapie tego doświadczenia.\n",
"\n",
"**Przykład 1**\n",
"\n",
"Ania ma listę filmów, które chciałaby obejrzeć na pewnej platformie streamingowej. Na początku tygodnia na tej liście znajdują się dwa thrillery i trzy komedie. Ania codziennie losowo wybiera do obejrzenia jeden film z listy, przy czym wszystkie wybory są równo prawdopodobne. Po jego obejrzeniu platforma wyświetla jej przykładowe filmy z tego samego gatunku, co właśnie obejrzany film, które mogłyby ją zainteresować. Ania zawsze wybiera dwa z nich i zapisuje je na swojej liście. Jakie jest prawdopodobieństwo, że:\n",
"\n",
"- w ciągu pierwszych trzech dni tygodnia Ania będzie oglądać same komedie?\n",
"\n",
"Dla $i=1,2,3$ niech $A_i$ oznacza zdarzenie, że $i$-tego dnia Ania obejrzała komedię. Zauważmy, że łatwo jest obliczyć szanse na wybór komedii danego dnia, jeśli wiemy, ile aktualnie komedii i thrillerów znajduje się na liście Ani, czyli jakie filmy oglądała w poprzednich dniach. Przykładowo, możemy zauważyć, że $\\mathbb{P}(A_2|A_1)=\\frac{4}{6}$, bo jeśli Ania pierwszego dnia obejrzała komedię, to ta komedia znika z jej listy, a w zamian pojawiają się na niej dwie inne komedie. Zatem w tej sytuacji aktualna liczba filmów na liście to dwa thrillery i cztery komedie. To sugeruje nam, że warto zastosować wzór łańcuchowy, aby obliczyć prawdopodobieństwo zdarzenia ,,Ania w ciągu pierwszych trzech dni tygodnia będzie oglądać same komedie\", które można zapisać w postaci $A_1\\cap A_2\\cap A_3$. \n",
"Zaczniemy od obliczenia prawdopodobieństw znajdujących się po prawej stronie wzoru łańcuchowego:\n",
"\n",
"* $\\mathbb{P}(A_1)=\\frac{3}{5}$ (bo pierwszego dnia na liście Ani znajdują się dwa thrillery i trzy komedie),\n",
"* $\\mathbb{P}(A_2|A_1)=\\frac{4}{6}$ (to zauważyliśmy wcześniej),\n",
"* $\\mathbb{P}(A_3|A_1\\cap A_2)=\\frac{5}{7}$ (bo jeśli Ania przez pierwsze dwa dni oglądała komedie, to trzeciego dnia na jej liście są dwa thrillery i pięć komedii).\n",
"\n",
"Zatem ostatecznie prawdopodobieństwo zdarzenia, że Ania w ciągu pierwszych trzech dni tygodnia będzie oglądać same komedie to:\n",
"\n",
"$$\\mathbb{P}(A_1\\cap A_2\\cap A_3)=\\mathbb{P}(A_1)\\cdot\\mathbb{P}(A_2|A_1)\\cdot \\mathbb{P}(A_3|A_1\\cap A_2)=\\frac{3}{5}\\cdot \\frac{4}{6}\\cdot \\frac{5}{7}=\\frac{2}{7}.$$\n",
"\n",
"- w ciągu pierwszych trzech dni tygodnia Ania dokładnie raz obejrzy komedię?\n",
"\n",
"Zauważmy, że warto podzielić to zdarzenie na trzy parami rozłączne przypadki: Ania obejrzy komedię tylko pierwszego dnia, Ania obejrzy komedię tylko drugiego dnia i Ania obejrzy komedię tylko trzeciego dnia. W każdym z tych trzech przypadków wiemy dokładnie, co powinno się wydarzyć każdego dnia, a więc do obliczania jego szans będziemy mogli użyć wzoru łańcuchowego. Przykładowo, rozważmy zdarzenie ,,Ania obejrzy komedię tylko pierwszego dnia''. Zauważmy, że to zdarzenie możemy zapisać w postaci $A_1\\cap A_2'\\cap A_3'$, używając oznaczeń z poprzedniego podpunktu. Na podstawie wzoru łańcuchowego otrzymujemy:\n",
"\n",
"$$\\mathbb{P}(A_1\\cap A_2'\\cap A_3')=\\mathbb{P}(A_1)\\cdot\\mathbb{P}(A_2'|A_1)\\cdot \\mathbb{P}(A_3'|A_1\\cap A_2')=\\frac{3}{5}\\cdot \\frac{2}{6}\\cdot \\frac{3}{7}=\\frac{3}{35}.$$\n",
"\n",
"W analogiczny sposób możemy obliczyć prawdopodobieństwo zdarzeń ,,Ania obejrzy komedię tylko drugiego dnia'' oraz ,,Ania obejrzy komedię tylko trzeciego dnia'', otrzymując odpowiednio \n",
"$$\\mathbb{P}(A_1'\\cap A_2\\cap A_3')=\\frac{3}{35} \\quad \\text{oraz} \\quad \\mathbb{P}(A_1'\\cap A_2'\\cap A_3)=\\frac{3}{35}.$$ \n",
"Zatem ostatecznie prawdopodobieństwo zdarzenia, że w ciągu pierwszych trzech dni tygodnia Ania obejrzy komedię dokładnie raz wynosi \n",
"$$\\mathbb{P}(A_1\\cap A_2'\\cap A_3') + \\mathbb{P}(A_1'\\cap A_2\\cap A_3') \\mathbb{P}(A_1'\\cap A_2'\\cap A_3) = \\frac{3}{35} + \\frac{3}{35} + \\frac{3}{35} = \\frac{9}{35}.$$\n",
"\n",
"**Przykład 2**\n",
"\n",
"Bartek wielokrotnie gra w grę ,,Wichry losu''. Przy pierwszym podejściu jego szanse na wygraną wynosiły $5\\%$. Ale każda rozgrywka sprawia, że Bartek coraz lepiej rozumie mechanizmy gry, więc możemy przyjąć, że po każdym podejściu szanse Bartka na wygraną w kolejnej próbie rosną dwukrotnie. Ile wynosi prawdopodobieństwo, że Bartek wygra po raz pierwszy przy czwartym podejściu?\n",
"\n",
"Podobnie jak w poprzednim przykładzie możemy zapisać to zdarzenie jako część wspólną zdarzeń określających co się dzieje w poszczególnych podejściach. Niech zatem $A_i$ dla $i=1,2,3,4$ oznacza zdarzenie, że Bartek wygra w $i$-tej rozgrywce. Wówczas interesujące nas zdarzenie to $A_1'\\cap A_2'\\cap A_3'\\cap A_4$, a jego prawdopodobieństwo ponownie możemy obliczyć, używając wzoru łańcuchowego:\n",
"\n",
"$$\\mathbb{P}(A_1'\\cap A_2'\\cap A_3'\\cap A_4)=\\mathbb{P}(A_1')\\cdot\\mathbb{P}(A_2'|A_1')\\cdot \\mathbb{P}(A_3'|A_2' \\cap A_1')\\cdot \\mathbb{P}(A_4|A_1'\\cap A_2'\\cap A_3')=0,95\\cdot 0,9 \\cdot 0,8 \\cdot 0,4=0,2736.$$\n",
"\n"
]
},
{
"cell_type": "markdown",
"id": "68fbc2",
"metadata": {
"collapsed": false
},
"source": [
"## Wzór na prawdopodobieństwo całkowite\n",
"\n",
"Kolejnym wzorem, który będziemy omawiać jest wzór na prawdopodobieństwo całkowite. Wzór ten pomaga obliczyć szanse na otrzymanie danego wyniku w doświadczeniu losowym, jeśli wynik ten możemy otrzymać na podstawie różnych przypadków i dla każdego przypadku jesteśmy w stanie łatwo obliczyć jego prawdopodobieństwo. Zanim jednak podamy ten wzór, musimy najpierw wprowadzić definicję rozbicia przestrzeni. \n",
"\n",
"**Definicja (Rozbicie przestrzeni)**\n",
"\n",
"**Rozbiciem przestrzeni** $\\Omega$ nazywamy rodzinę zdarzeń $\\{A_i\\}_{i\\in I}$, które wykluczają się parami, zaś ich suma jest równa $\\Omega$, tzn. dla każdych $i\\neq j$ zachodzi $A_i\\cap A_j=\\emptyset$ oraz $\\bigcup_{i\\in I}A_i = \\Omega$.\n",
"\n",
"**Przykład 3**\n",
"\n",
"Załóżmy, że pewna firma ubezpieczeniowa ma $200$ klientów. Zastanawiamy się, jakie są szanse na to, że losowo wybrany klient tej firmy będzie miał w przyszłym roku wypadek samochodowy. Wówczas jako zbiór zdarzeń elementarnych $\\Omega$ możemy przyjąć po prostu zbiór wszystkich klientów tej firmy. Możemy definiować różnorodne rozbicia tej przestrzeni:\n",
"\n",
"* rodzina zdarzeń $A_{[18,24]}, A_{[25,39]}, A_{[40,59]}, A_{[60,100]}$, gdzie $A_{[x,y]}$ oznacza zdarzenie, że losowo wybrany klient firmy będzie w wieku od $x$ do $y$ lat włącznie. Zakładamy tutaj, że wszyscy klienci firmy są pełnoletni i mają co najwyżej $100$ lat;\n",
"* rodzina zdarzeń $B_0, B_1, B_2, \\ldots$, gdzie $B_i$ oznacza zdarzenie, że losowo wybrany klient firmy w tym roku brał udział w $i$ wypadkach samochodowych;\n",
"* rodzina zdarzeń $C_w, C_{mm}, C_{dm}$, gdzie zdarzenia te oznaczają, że losowo wybrany klient firmy mieszka odpowiednio na wsi, w małym mieście lub dużym mieście;\n",
"* rodzina zdarzeń $\\{D_{[x,y]}^k\\}_{k,x,y}$, gdzie $D_{[x,y]}^k=A_{[x,y]}\\cap C_k$, czyli jest to rozbicie przestrzeni względem wieku i miejsca zamieszkania klientów firmy.\n",
"\n",
"Dla każdej z tych rodzin zdarzeń właściciel firmy może na podstawie danych statystycznych oszacować, jakie jest prawdopodobieństwo, że osoba z danej grupy (czyli o określonym wieku / historii wypadkowej / miejscu zamieszkania) będzie miała w najbliższym roku wypadek samochodowy. Następnie, używając wzoru na prawdopodobieństwo całkowite, który podamy za chwilę, właściciel ten mógłby wyznaczyć szanse na to, że dowolny, losowo wybrany klient jego firmy będzie miał w przyszłym roku wypadek. \n",
"\n",
"**Twierdzenie (Wzór na prawdopodobieństwo całkowite)**\n",
"\n",
"Jeśli $A_1,A_2,\\dots, A_n\\in \\mathcal{F}$ jest rozbiciem przestrzeni $\\Omega$ na zdarzenia o dodatnim prawdopodobieństwie, to dla każdego zdarzenia $B\\in \\mathcal{F}$ mamy:\n",
"$$ \\mathbb{P}(B) = \\sum_{i=1}^n \\mathbb{P}(B|A_i)\\mathbb{P}(A_i).$$\n",
"\n",
"**Uwaga:** Analogiczny wzór działa również dla rozbicia przestrzeni $\\Omega$ na przeliczalną rodzinę zdarzeń $\\{A_i\\}_{i\\in I}$.\n",
"\n",
"**Przykład 3 (c.d.)**\n",
"\n",
"Załóżmy, że pewna firma ubezpieczeniowa ma $200$ klientów. Zastanawiamy się, jakie są szanse na to, że losowo wybrany klient tej firmy będzie miał w przyszłym roku wypadek samochodowy. Na podstawie danych statystycznych szacujemy, że losowo wybrana osoba w wieku od $x$ do $y$ lat ma następujące szanse na wypadek w ciągu najbliższego roku:\n",
"\n",
"| wiek | prawdopodobieństwo wypadku |\n",
"| --- | --- |\n",
"| [18,24] | 0,0017 |\n",
"| [25,39] | 0,001 |\n",
"| [40,59] | 0,0007|\n",
"| [60,100] | 0,0004 |\n",
"\n",
"Pokażemy, jak możemy obliczyć prawdopodobieństwo interesującego nas zdarzenia przy pomocy języka R, jeśli dany jest wektor $w$, który zawiera informacje o wieku każdego klienta."
]
},
{
"cell_type": "code",
"execution_count": 3,
"id": "08ce84",
"metadata": {
"collapsed": false
},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"[1] \"Wiek klientów:\"\n"
]
},
{
"name": "stdout",
"output_type": "stream",
"text": [
" [1] 24 94 44 89 50 48 61 87 88 43 95 98 63 77 74 20 23 34\n",
" [19] 100 45 21 42 55 96 92 21 21 88 38 98 30 57 34 69 100 87\n",
" [37] 76 33 44 71 81 81 24 99 70 89 46 76 23 64 44 53 21 22\n",
" [55] 55 19 40 39 86 93 98 93 18 33 59 74 88 61 32 45 89 69\n",
" [73] 61 47 30 54 92 62 100 71 52 31 46 20 45 59 40 18 60 32\n",
" [91] 73 69 42 45 78 87 95 43 53 76 98 51 61 91 18 38 49 25\n",
"[109] 41 92 91 24 69 92 70 98 82 27 71 97 51 79 78 89 91 98\n",
"[127] 85 54 87 69 74 62 78 71 23 95 97 18 29 37 56 74 86 50\n",
"[145] 90 56 30 55 32 56 37 34 24 29 33 30 97 85 21 75 70 80\n",
"[163] 83 71 45 62 31 36 60 94 85 94 19 87 59 82 45 60 88 76\n",
"[181] 49 76 21 52 93 99 86 21 92 53 96 89 26 47 55 47 23 21\n",
"[199] 67 64\n"
]
},
{
"name": "stdout",
"output_type": "stream",
"text": [
"[1] \"Prawdopodobieństwo, że losowo wybrany klient firmy będzie mieć wypadek wynosi 0.0007095\"\n"
]
}
],
"source": [
"# Najpierw wygenerujemy wektor w, losowo wybierając 200 liczb całkowitych z przedziału [18,100]\n",
"w <- sample(18:100, 200, replace = TRUE)\n",
"print('Wiek klientów:')\n",
"print(w)\n",
"# Skorzystamy z rozbicia zbioru klientów firmy względem wieku, czyli definiowanej wcześniej w przykładzie 3 rodziny {A_[18,24], A_[25,39], A_[40,59], A_[60,100]}\n",
"# Następnie wyznaczymy prawdopodobieństwa zdarzeń A_[18,24], A_[25,39], A_[40,59], A_[60,100], czyli policzymy, jakie są szanse, że losowo wybrany klient należy do danej grupy wiekowej\n",
"A1824 <- length(which(w %in% 18:24))/200\n",
"A2539 <- length(which(w %in% 25:39))/200\n",
"A4059 <- length(which(w %in% 40:59))/200\n",
"A60100 <- length(which(w %in% 60:100))/200\n",
"# Na koniec zastosujemy wzór na prawdopodobieństwo całkowite, aby obliczyć szanse, że losowo wybrany klient tej firmy ulegnie wypadkowi w przyszłym roku\n",
"# W tym celu musimy przemnożyć prawdopodobieństwa zdarzeń A_[x,y] przez prawdopodobieństwa wypadku w danej grupie wiekowej\n",
"p = c(0.0017, 0.001, 0.0007, 0.0004)\n",
"x = c(A1824, A2539, A4059, A60100)\n",
"wypadek = sum(p*x)\n",
"print(paste('Prawdopodobieństwo, że losowo wybrany klient firmy będzie mieć wypadek wynosi ', wypadek))"
]
},
{
"cell_type": "markdown",
"id": "2120a9",
"metadata": {
"collapsed": false
},
"source": [
"**Przykład 4**\n",
"\n",
"Ania ma listę filmów, które chciałaby obejrzeć na pewnej platformie streamingowej. Na początku tygodnia na tej liście znajdują się dwa thrillery i trzy komedie. Ania codziennie losowo wybiera do obejrzenia jeden film z listy, przy czym wszystkie wybory są równo prawdopodobne. Po jego obejrzeniu platforma wyświetla jej przykładowe filmy z tego samego gatunku, co właśnie obejrzany film, które mogłyby ją zainteresować. Ania zawsze wybiera dwa z nich i zapisuje je na swojej liście. Jakie jest prawdopodobieństwo, że trzeciego dnia Ania wybierze komedię?\n",
"\n",
"Niech $B$ oznacza zdarzenie, że trzeciego dnia Ania wybierze komedię. Szanse na ten wybór zależą oczywiście od tego, jakie filmy są aktualnie na liście Ani, czyli od tego, jakie filmy Ania wybierała w poprzednich dniach. Zdefiniujmy zatem rodzinę zdarzeń $\\{A_1, A_2, A_3, A_4\\}$ w następujący sposób:\n",
"\n",
"* $A_1$ - w dwóch pierwszych dniach Ania wybierała tylko thrillery,\n",
"* $A_2$ - w dwóch pierwszych dniach Ania wybierała tylko komedie,\n",
"* $A_3$ - w dwóch pierwszych dniach Ania wybierała kolejno komedię i thriller,\n",
"* $A_4$ - w dwóch pierwszych dniach Ania wybierała kolejno thriller i komedię.\n",
"\n",
"Wówczas ta rodzina stanowi rozbicie przestrzeni na zdarzenia o dodatnim prawdopodobieństwie. Ponadto, korzystając ze wzoru łańcuchowego możemy łatwo obliczyć prawdopodobieństwa tych zdarzeń:\n",
"\n",
"* $\\mathbb{P}(A_1)=\\frac25 \\cdot \\frac36 = \\frac15$,\n",
"* $\\mathbb{P}(A_2)=\\frac35 \\cdot \\frac46 = \\frac25$,\n",
"* $\\mathbb{P}(A_3)=\\frac35 \\cdot \\frac26 = \\frac15$,\n",
"* $\\mathbb{P}(A_4)=\\frac25 \\cdot \\frac36 = \\frac15$.\n",
"\n",
"Wiedząc, jakie filmy obejrzała Ania przez pierwsze dwa dni jesteśmy w stanie bez problemu obliczyć prawdopodobieństwo obejrzenia przez nią komedii trzeciego dnia, np. $\\mathbb{P}(B|A_1)=\\frac37$ (bo po obejrzeniu dwóch thrillerów trzeciego dnia Ania ma na liście cztery thrillery i trzy komedie). Na koniec możemy skorzystać ze wzoru na prawdopodobieństwo całkowite:\n",
"\n",
"$$ \\mathbb{P}(B)=\\mathbb{P}(B|A_1)\\cdot \\mathbb{P}(A_1)+\\mathbb{P}(B|A_2)\\cdot \\mathbb{P}(A_2)+\\mathbb{P}(B|A_3)\\cdot \\mathbb{P}(A_3)+\\mathbb{P}(B|A_4)\\cdot \\mathbb{P}(A_4)= \\frac37\\cdot \\frac15+\\frac57\\cdot\\frac25+\\frac47\\cdot\\frac15+\\frac47\\cdot\\frac15=\\frac{21}{35}=\\frac{3}{5}.$$"
]
},
{
"cell_type": "markdown",
"id": "40da12",
"metadata": {
"collapsed": false
},
"source": [
"## Wzór Bayesa\n",
"\n",
"Na koniec zaprezentujemy wzór Bayesa, który stosujemy najczęściej wtedy, gdy mamy do czynienia z wieloetapowym doświadczeniem losowym i wiemy, jaki jest jego końcowy wynik, ale chcemy oszacować szanse na to, że całe doświadczenie miało pewien ustalony przebieg.\n",
"\n",
"**Twierdzenie (Wzór Bayesa)**\n",
"Jeśli $A_1,A_2,\\dots, A_n\\in \\mathcal{F}$ jest rozbiciem przestrzeni $\\Omega$ na zdarzenia o dodatnim prawdopodobieństwie oraz zdarzenie $B\\in \\mathcal{F}$ ma również dodatnie prawdopodobieństwo, to dla każdego $i=1,2,\\dots, n$ zachodzi:\n",
"$$\\mathbb{P}(A_i|B)=\\frac{\\mathbb{P}(B|A_i)\\cdot\\mathbb{P}(A_i)}{\\mathbb{P}(B)} =\\frac{\\mathbb{P}(B|A_i)\\cdot\\mathbb{P}(A_i)}{\\sum_{j=1}^n \\mathbb{P}(B|A_j)\\cdot\\mathbb{P}(A_j)}\\,.$$\n",
"\n",
"**Przykład 5**\n",
"\n",
"Ania ma listę filmów, które chciałaby obejrzeć na pewnej platformie streamingowej. Na początku tygodnia na tej liście znajdują się dwa thrillery i trzy komedie. Ania codziennie losowo wybiera do obejrzenia jeden film z listy, przy czym wszystkie wybory są równo prawdopodobne. Po jego obejrzeniu platforma wyświetla jej przykładowe filmy z tego samego gatunku, co właśnie obejrzany film, które mogłyby ją zainteresować. Ania zawsze wybiera dwa z nich i zapisuje je na swojej liście. Okazuje się, że trzeciego dnia Ania obejrzała komedię. Jakie są szanse, że przez pierwsze dwa dni również oglądała komedie?\n",
"\n",
"Niech zdarzenia $B, A_1, A_2, A_3, A_4$ będą definiowane tak, jak w przykładzie 4. Interesuje nas prawdopodobieństwo zdarzenia, że przez pierwsze dwa dni Ania oglądała tylko komedię. Wiemy natomiast, że trzeciego dnia Ania obejrzała komedię, więc tak naprawdę chcemy obliczyć prawdopodobieństwo warunkowe $\\mathbb{P}(A_2|B)$. Ponieważ zdecydowanie łatwiej byłoby obliczyć prawdopodobieństwo warunkowe $\\mathbb{P}(B|A_2)$, to wykorzystamy wzór Bayesa. Skorzystamy ponadto z obliczeń z przykładu 4. Otrzymujemy\n",
"\n",
"$$\\mathbb{P}(A_2|B)=\\frac{\\mathbb{P}(B|A_2)\\cdot\\mathbb{P}(A_2)}{\\mathbb{P}(B)}=\\frac{\\frac57 \\cdot \\frac25}{\\frac35}=\\frac{10}{21}.$$\n",
"\n",
"Zauważmy, że $\\mathbb{P}(A_2|B)>\\mathbb{P}(A_2)$, co nie powinno nas dziwić. Jeśli każda obejrzana komedia zwiększa liczbę komedii na liście, to fakt, że Ania trzeciego dnia obejrzała komedię może sugerować, że wcześniej też chętniej wybierała filmy z tego gatunku.\n",
"\n",
"**Przykład 6**\n",
"\n",
"Rafał wysyła do Adama wiadomość w postaci ciągu binarnego. Niestety w trakcie komunikacji mogą pojawić się błędy. Szansa na to, że zamiast $0$ zostanie wysłana $1$ wynosi $10\\%$, a szansa na wysłanie $0$ zamiast $1$ to $5\\%$. Ponadto wiemy, że w wiadomościach wysyłanych przez Rafała częstość wysyłania $0$ w stosunku do częstości wysyłania $1$ to $1:9$. W pewnym momencie Adam otrzymał $0$. Jaka jest szansa, że ten bit jest poprawny (tzn. Rafał faktycznie wysłał $0$)?\n",
"\n",
"Niech $B$ oznacza zdarzenie, że Adam otrzymał $0$. Wiemy, że szanse na to zależą od tego, co wysłał Rafał, więc wprowadzamy rozbicie przestrzeni na dwa zdarzenia o dodatnim prawdopodobieństwie: \n",
"\n",
"* $A_0$ - Rafał wysłał zero,\n",
"* $A_1$ - Rafał wysłał jedynkę.\n",
"\n",
"Na podstawie danych z zadania dotyczących częstości wysyłania poszczególnych bitów możemy stwierdzić, że $\\mathbb{P}(A_0)=0{,}1$, a $\\mathbb{P}(A_1)=0{,}9$. Znamy też szanse na błędny przekaz, więc jesteśmy w stanie wyznaczyć prawdopodobieństwo otrzymania $0$ w każdym przypadku: $\\mathbb{P}(B|A_0)=0{,}9$ i $\\mathbb{P}(B|A_1)=0{,}05$. Naszym celem jest obliczenie szans na to, że Rafał wysłał $0$, jeśli wiemy, że Adam otrzymał $0$, czyli $\\mathbb{P}(A_0|B)$. Ponownie skorzystamy z wzoru Bayesa:\n",
"\n",
"$$\\mathbb{P}(A_0|B)=\\frac{\\mathbb{P}(B|A_0)\\cdot\\mathbb{P}(A_0)}{ \\mathbb{P}(B|A_0)\\cdot\\mathbb{P}(A_0)+\\mathbb{P}(B|A_1)\\cdot \\mathbb{P}(A_1)}=\\frac{0{,}9\\cdot 0{,}1}{0{,}9\\cdot 0{,}1+0{,}05\\cdot 0{,}9}=\\frac{0{,}09}{0{,}135}=\\frac23.$$"
]
},
{
"cell_type": "code",
"execution_count": 0,
"id": "5d1051",
"metadata": {
"collapsed": false
},
"outputs": [
],
"source": [
]
}
],
"metadata": {
"kernelspec": {
"argv": [
"/usr/bin/R",
"-e",
"IRkernel::main()",
"--args",
"{connection_file}"
],
"display_name": "R (system-wide)",
"env": {
},
"language": "r",
"metadata": {
"cocalc": {
"description": "R statistical programming language",
"priority": 10,
"url": "https://www.r-project.org/"
}
},
"name": "ir",
"resource_dir": "/ext/jupyter/kernels/ir"
}
},
"nbformat": 4,
"nbformat_minor": 4
}