{ "cells": [ { "cell_type": "markdown", "id": "c46ab9", "metadata": { "collapsed": false }, "source": [ "# Klasyczna definicja prawdopodobieństwa" ] }, { "cell_type": "markdown", "id": "315838", "metadata": { "collapsed": false }, "source": [ "**Treści kształcenia**: Eksperymenty losowe. Klasyczna definicja prawdopodobieństwa. Aksjomatyczna definicja przestrzeni probabilistycznej. Podstawowe własności prawdopodobieństwa. \n", "\n", "**Efekty kształcenia**: Student/ka potrafi konstruować przestrzenie probabilistyczne dla zadanych problemów rachunku prawdopodobieństwa; potrafi wyrazić podstawowe problemy w języku zdarzeń losowych; umie zastosować poznane twierdzenia i własności przestrzeni probabilistycznych do rozwiązywania prostych zagadnień rachunku prawdopodobieństwa." ] }, { "cell_type": "markdown", "id": "7d51a9", "metadata": { "collapsed": false }, "source": [ "## Wstęp\n", "\n", "Podstawowym obiektem zainteresowania rachunku prawdopodobieństwa są tzw. **eksperymenty losowe**. Mogą to być np. rzuty kostką, rzuty monetą, losowania w grze totolotek, wyniki ruletki czy innych gier hazardowych, itp. Zasadniczą cechą tych eksperymentów jest fakt, że nie da się w sposób jednoznaczny przewidzieć ich rezultatu, a co najwyżej można oszacować szanse na otrzymanie konkretnego wyniku. I tym właśnie zajmuje się rachunek prawdopodobieństwa. Jest to matematyczna teoria, która pozwala tworzyć odpowiednie modele do badania zjawisk, które są z natury losowe lub, innymi słowy, nie są deterministyczne. Mogą to być względnie proste eksperymenty, takie jak wspomniane wyżej rzuty kostką czy monetą, mogą to być też modele obejmujące duże zbiory danych, na których prosta arytmetyka przestaje działać ze względu na wielkość badanego obiektu.\n", "\n", "Na tym kursie poznamy podstawy rachunku prawdopodobieństwa. Dowiemy się w jaki sposób budować proste modele eksperymentów losowych, które w dobry sposób obrazują rzeczywistość. Poznamy aksjomatyczne pojęcie prawdopodobieństwa oraz zmiennych losowych, czyli funkcji, które wiążą wyniki eksperymentów losowych z pewnymi wartościami liczbowymi. Nauczymy się szacować średnie wartości takich funkcji i ich bardziej ogólne zachowanie (tzw. rozkłady prawdopodobieństwa).\n", "\n" ] }, { "cell_type": "markdown", "id": "c053a2", "metadata": { "collapsed": false }, "source": [ "## Zbiór zdarzeń elementarnych, czyli czym jest $\\Omega$\n", "\n", "Z każdym eksperymentem losowym związane jest pojęcie tzw. zdarzenia elementarnego, które należy rozumieć po prostu jako potencjalny wynik eksperymentu losowego.\n", "\n", "**Definicja (zbiór zdarzeń elementarnych):**\n", "\n", "**Zbiorem zdarzeń elementarnych**, oznaczonym przez $\\Omega$, nazywamy zbiór wszystkich możliwych wyników doświadczenia losowego. Elementy $\\omega\\in\\Omega$ nazywamy **zdarzeniami elementarnymi**, natomiast podzbiory $A\\subseteq \\Omega$ nazywamy **zdarzeniami**. Dla danego zdarzenia $A\\subseteq \\Omega$, przez $A'=\\Omega\\setminus A$ oznaczamy **zdarzenie przeciwne** do zdarzenia $A$.\n", "\n", "**Przykład 1**\n", "\n", "Jeśli rozważamy eksperyment losowy polegający na trzykrotnym rzucie czworościenną kostką \\(na której ściankach znajdują się odpowiednio $1$, $2$, $3$ i $4$\\), to zdarzeniami elementarnymi związanymi z tym eksperymentem są po prostu **możliwe wyniki naszego eksperymentu**. Natomiast co przyjmiemy jako zbiór takich wyników nie jest jednoznaczne. Możemy np. przyjąć, że wynikiem eksperymentu jest ciąg wyników poszczególnych rzutów kostką. Wówczas zbiorem zdarzeń elementarnych jest \n", "$$\\Omega_1 = \\{ (1,1,1), (1,1,2), (1,1,3), \\ldots, (4,4,4)\\}.$$ \n", "Jeśli natomiast nie interesuje nas szczegółowy przebieg eksperymentu, a jedynie liczba wyrzuconych jedynek, możemy przyjąć inny zbiór zdarzeń elementarnych, mianowicie \n", "$$\\Omega_2 = \\{0, 1, 2, 3\\}.$$\n", "\n", "Proszę zwrócić uwagę, że zdarzenie elementarne $(1,1,1) \\in \\Omega_1$ odpowiada zdarzeniu $3 \\in \\Omega_2$, z kolei zdarzenie $1\\in \\Omega_2$ odpowiada 27 zdarzeniom elementarnym w $\\Omega_1$, tzn. zdarzeniu $\\{(1,2,2), (1,2,3), (1,2,4), \\ldots, (4,4,1) \\} \\subset \\Omega_1$. O ile zatem wszystkie zdarzenia elementarne w $\\Omega_1$ mają równe szanse wystąpienia, o tyle widzimy, że w przypadku $\\Omega_2$ sytuacja jest odmienna i niektóre z elementów tego zbioru są bardziej prawdopodobne od innych.\n", "\n", "Na tych zajęciach skupimy się na modelach zbiorów zdarzeń elementarnych pierwszego typu, czyli takich, w których wszystkie zdarzenia elementarne są **równo prawdopodobne**.\n", "\n", "**Przykład 2**\n", "\n", "Rozważmy eksperyment losowy polegający na jednoczesnym rzucie trzema identycznymi czworościennymi kostkami. Wówczas taki eksperyment jest równoważny eksperymentowi z poprzedniego przykładu. Wystarczy, że ponumerujemy kostki od $1$ do $3$ i utożsamimy wynik rzutu $i$-tą kostką, $i=1,2,3$, z wynikiem $i$-tego rzutu w trzykrotnym rzucie pojedynczą kostką.\n", "\n" ] }, { "cell_type": "markdown", "id": "fa6959", "metadata": { "collapsed": false }, "source": [ "**Przykład 3 \\(R\\)** \n", "\n", "Rozważmy eksperyment losowy polegający na grze w ruletce w wersji europejskiej. Przypomnijmy, że koło ruletki zawiera \\$37\\$ pól ponumerowanych liczbami całkowitymi od \\$0\\$ do \\$36\\$. Ponadto pola są pokolorowane za pomocą trzech kolorów: czerwonego, czarnego i zielonego. Poniżej pokażemy, jak można wygenerować przestrzeń probabilistyczną odpowiadającą temu doświadczeniu losowemu używając języka R. \n", "\n", "**Uwaga:** Wszystkie przykłady, które będą pojawiać się w tym przewodniku i będą używać języka R, wymagają zainstalowania i załadowania pakietu `probs`. \n" ] }, { "cell_type": "code", "execution_count": 0, "id": "afdde2", "metadata": { "collapsed": false }, "outputs": [ ], "source": [ "# Zbiór zdarzeń elementarnych odpowiadający grze w ruletce możemy wygenerować za pomocą polecenia roulette\n", "Omega_1 = roulette(european=TRUE)\n", "print(Omega_1)\n", "# Warto zwrócić uwagę, że zdarzenia elementarne odpowiadają tutaj parom postaci (x, k), gdzie x oznacza numer, a k kolor pola\n", "# Ponadto kolejność, w jakiej zdarzenia elementarne wpisane są do ramki danych odpowiada kolejności pól na kole ruletki\n", "\n", "# Możemy też zaproponować inne zbiory zdarzeń elementarnych np. zawierające tylko informacje o wylosowanym numerze lub kolorze\n", "\n", "Omega_2 = 0:36\n", "print(Omega_2)\n", "\n", "Omega_3 = c('czerwony','czarny','zielony')\n", "print(Omega_3)\n", "\n", "# Zwróćmy uwagę, że w przypadku zbiorów Omega_1 i Omega_2 możemy przyjąć, że zdarzenia elementarne są równoprawdopodobne\n", "# Natomiast w przypadku zbioru Omega_3 tak nie jest, bo mamy tylko jedno zielone pole i po 18 pól czerwonych i czarnych" ] }, { "cell_type": "markdown", "id": "6f30b8", "metadata": { "collapsed": false }, "source": [ "## Klasyczny model prawdopodobieństwa\n", "\n", "W szkole średniej spotkaliśmy się już z pojęciem prawdopodobieństwa. Rozważaliśmy wówczas prawdopodobieństwo jako stosunek liczby elementów (zdarzeń elementarnych) odpowiadających rozpatrywanemu zdarzeniu do liczby wszystkich możliwych wyników eksperymentu (liczby elementów $\\Omega$). Innymi słowy prawdopodobieństwo zdarzenia można tutaj rozumieć jako prostą proporcję. Okazuje się, że jest to dobre podejście w sytuacji, gdy wszystkie wyniki naszego eksperymentu losowego mają takie same szanse pojawienia się. Mamy wówczas do czynienia z tzw. modelem klasycznym prawdopodobieństwa.\n", "\n", "**Definicja (prawdopodobieństwo klasyczne):**\n", "\n", "Załóżmy, że $0<|\\Omega| < \\infty$ i oznaczmy przez $2^{\\Omega}$ rodzinę wszystkich podzbiorów zbioru $\\Omega$ (czyli wszystkich zdarzeń). **Funkcją prawdopodobieństwa** nazywamy funkcję $\\mathbb{P}:2^{\\Omega}\\rightarrow[0,1]$, która przyporządkowuje każdemu zdarzeniu jego prawdopodobieństwo. Jeśli wszystkie wyniki doświadczenia są równoprawdopodobne, wówczas dla każdego zdarzenia elementarnego $\\omega\\in\\Omega$ mamy \n", "$$\\mathbb{P}(\\omega) := \\mathbb{P}(\\{\\omega\\}) = \\frac{1}{|\\Omega|}$$\n", "i ogólniej, dla każdego zdarzenia $A\\subseteq \\Omega$ zachodzi \n", "$$\\mathbb{P}(A)=\\frac{|A|}{|\\Omega|}.$$\n", "Taki model prawdopodobieństwa nazywamy **modelem klasycznym**.\n", "\n", "**Uwaga:** Proszę pamiętać, że $\\Omega$ jest **zbiorem**, a nie liczbą. Częstym błędem popełnianym przez studentów jest przyjęcie, że zbiór zdarzeń elementarych $\\Omega$ to po prostu liczba, co nie ma sensu. Np. w eksperymencie polegającym na rzucie dwiema kostkami stwierdzenie, że $\\Omega=36$ jest błędne. Należy przyjąć tutaj, że $\\Omega$ jest np. zbiorem par liczb od $1$ do $6$, tzn. $\\Omega = \\{ (1,1), (1,2), \\ldots, (6,6)\\}$ i wówczas $|\\Omega|=36$.\n", "\n", "**Przykład 4**\n", "\n", "Jakie są szanse na to, że w trzech rzutach monetą orzeł wypadnie parzyście wiele razy?\n", "\n", "Zauważmy, że jeśli przyjmiemy $\\Omega = \\{ OOO, OOR, ORO, ROO, ORR, ROR, RRO, RRR\\}$ jako zbiór zdarzeń elementarnych, to będziemy mieć do czynienia z modelem klasycznym prawdopodobieństwa. Niech zatem $A$ będzie zdarzeniem polegającym na wyrzuceniu parzystej liczby orłów. Wówczas $A = \\{OOR, ORO, ROO, RRR\\}$ i otrzymujemy\n", "$$\\mathbb{P}(A) = \\frac{|A|}{|\\Omega|} = \\frac{4}{8} = \\frac{1}{2}.$$\n", "\n", "Sprytna osoba mogłaby zauważyć, że w tym przykładzie zdarzenie $A$ jest równoważne zdarzeniu polegającemy na wyrzuceniu nieparzystej liczby reszek. Z kolei nie ma znaczenia czy rozważamy parzystość liczby reszek, czy też orłów, bo oba te wyniki są do siebie wzajemnie **symetryczne**. A zatem $\\mathbb{P}(A) = \\mathbb{P}(A')$, gdzie zdarzenie $A'$ jest zdarzeniem przeciwnym do zdarzenia $A$ i polega ono na wyrzuceniu nieparzystej liczby orłów (czyli parzystej liczby reszek). Teraz wystarczyłoby wiedzieć, że $\\mathbb{P}(A) + \\mathbb{P}(A') = 1$, aby uzyskać odpowiedź, ale tę własność funkcji prawdopodobieństwa poznamy dopiero przy kolejnym temacie.\n", "\n" ] }, { "cell_type": "markdown", "id": "8a20b3", "metadata": { "collapsed": false }, "source": [ "## Prawa przeliczania i schematy wyboru - krótkie przypomnienie z Matematyki dyskretnej\n", "\n", "Zanim przejdziemy do dalszych przykładów, przypomnijmy sobie proste prawa przeliczania i schematy wyboru, które poznaliśmy na kursie Matematyki dyskretnej. Załóżmy, że mamy do czynienia ze skończonymi zbiorami $A_1, A_2, \\ldots, A_n$. **Prawo mnożenia** mówi, że liczba ciągów postaci $(a_1, a_2, \\ldots, a_n)$, gdzie dla $i=1,2,\\ldots,n$ mamy $a_i \\in A_i$, wynosi\n", "$$|A_1| \\cdot |A_2| \\cdot \\ldots \\cdot |A_n|.$$ \n", "Z kolei **prawo dodawania** można wyrazić prostym wzorem\n", "$$ |A_1 \\cup A_2 \\cup \\ldots \\cup A_n| = |A_1| + |A_2| + \\ldots + |A_n|, $$\n", "przy dodatkowym założeniu, że zbiory $A_1, A_2, \\ldots, A_n$ są **parami rozłączne**. Jeśli nie mamy tego założenia, musimy skorzystać z **zasady włączania i wyłączania**, która dla dwóch zbiorów wygląda następująco\n", "$$ |A_1 \\cup A_2| = |A_1| + |A_2| - |A_1 \\cap A_2|, $$\n", "a dla trzech zbiorów przybiera postać\n", "$$ |A_1 \\cup A_2 \\cup A_3| = |A_1| + |A_2| + |A_3| - |A_1 \\cap A_2| - |A_1 \\cap A_3| - |A_2 \\cap A_3| + |A_1 \\cap A_2 \\cap A_3|. $$\n", "Ogólny przypadek, jak pamiętamy, jest bardziej skomplikowany.\n", "\n", "Ponadto korzystać będziemy ze wzorów na liczbę:\n", "\n", "- $k$\\-elementowych **wariacji bez powtórzeń** ze zbioru $n$\\-elementowego, czyli $k$\\-elementowych ciągów bez powtórzeń o wyrazach ze zbioru $n$\\-elementowego, która wynosi $n\\cdot (n-1) \\cdot \\ldots \\cdot (n-k+1) = \\frac{n!}{(n-k)!} = (n)_k$,\n", "- $k$\\-elementowych **wariacji z powtórzeniami** ze zbioru $n$\\-elementowego, czyli $k$\\-elementowych ciągów z powtórzeniami o wyrazach ze zbioru $n$\\-elementowego, która wynosi $n^k$,\n", "- $n$\\-elementowych **permutacji**, czyli sposobów ustawienia w ciąg $n$ elementów; liczba ta to $n\\cdot (n-1) \\cdot \\ldots \\cdot 1 = n!$,\n", "- $k$\\-elementowych **kombinacji bez powtórzeń** ze zbioru $n$\\-elementowego, czyli $k$\\-elementowych podzbiorów zbioru $n$\\-elementowego, których mamy ${n\\choose k} = \\frac{n!}{k!(n-k)!}$,\n", "- $k$\\-elementowych **kombinacji z powtórzeniami** ze zbioru $n$\\-elementowego, czyli $k$\\-elementowych pseudozbiorów lub multizbiorów zbioru $n$\\-elementowego, których mamy ${n+k-1\\choose k}$.\n", "\n", "**Przykład 5**\n", "\n", " Jaka jest szansa, że w rozdaniu pokerowym gracz uzyska karetę, czyli pięć kart wśród których są cztery o tej samej figurze? \n", "\n", "Przyjmijmy, że wyjściowa talia składa się z $24$ kart. Mamy w niej karty o sześciu różnych figurach \\(**as**, **król**, **dama**, **walet**, **10**, **9**\\) i czterech różnych kolorach \\(**pik**, **kier**, **trefl**, **karo**\\). Każda karta stanowi kombinację jednej figury i jednego koloru. Gracz podczas rozdania dostaje $5$ kart. Możemy zatem przyjąć, że zbiór zdarzeń elementarnych składa się ze wszystkich $5$\\-elementowych podzbiorów zbioru $24$\\-elementowego. Możemy też wybrać inny zbiór zdarzeń elementarnych, gdzie uwzględnimy kolejność, w jakiej gracz dostaje swoje karty. Wówczas zdarzeniami elementarnymi będą $5$\\-elementowe ciągi bez powtórzeń o wyrazach ze zbioru $24$\\-elementowego. Przeprowadzimy obliczenia dla obu tych modeli.\n", "\n", " Przyjmijmy zatem pierwszy scenariusz, gdzie $\\Omega_1$ składa się z $5$-elementowych podzbiorów zbioru $24$-elementowego, czyli \n", " $$|\\Omega_1| = {24\\choose 5}.$$ \n", " Nietrudno przekonać się, że przy tak dobranym zbiorze $\\Omega_1$, wszystkie zdarzenia elementarne są równoprawdopodobne. Niech $A\\subset \\Omega_1$ będzie zdarzeniem oznaczającym uzyskanie karety w rozdaniu. Wówczas \n", " $$|A| = 6\\cdot 20 = 120,$$ \n", " ponieważ na $6$ sposobów wybieramy która figura znajdzie się cztery razy wśród rozdanych pięciu kart i spośród pozostałych $24-4=20$ kart o innych figurach musimy dobrać jedną. Otrzymujemy zatem\n", " $$\\mathbb{P}(A) = \\frac{|A|}{|\\Omega_1|} = \\frac{120}{{24\\choose 5}} = \\frac{120}{42504} = \\frac{5}{1771}.$$\n", "\n", "Rozważmy teraz drugi model, gdzie $\\Omega_2$ składa się z $5$\\-elementowych ciągów bez powtórzeń ze zbioru $24$\\-elementowego. Zatem $|\\Omega_2|=(24)_5$ i znów mamy do czynienia z modelem klasyczny, bo każdy taki układ jest równoprawdopodobny. Oznaczmy ponownie przez $A$ zdarzenie polegające na uzyskaniu karety. Tym razem jednak $A \\subset \\Omega_2$ i mamy\n", "$$|A| = 6\\cdot 20 \\cdot 5! = 120 \\cdot 5!,$$\n", "ponieważ poza wyborem kart w karecie musimy jeszcze uwzględnić kolejność, w jakiej gracz dostał te karty. Liczymy teraz prawdopodobieństwo zdarzenia $A$ \n", "$$\\mathbb{P}(A) = \\frac{|A|}{|\\Omega_2|} = \\frac{120\\cdot 5!}{(24)_5} = \\frac{14400}{5100480} = \\frac{5}{1771}.$$\n", "\n", "**Uwaga:** W powyższym przykładzie nie powinno nas dziwić, że uzyskaliśmy ten sam wynik. Jeśli tylko zbudowany przez nas model jest poprawny, czyli odpowiada rzeczywistości, a ponadto wszystkie obliczenia wykonaliśmy również poprawnie, to niezależnie od wybranej metody uzyskamy właściwy wynik.\n", "\n", "**Przykład 6 \\(R\\)** \n", "\n", "Na koniec zobaczymy jeszcze, jak można rozwiązać analogiczne zadanie używając języka R. W celu przyspieszenia obliczeń założymy, że karty losujemy z mniejszej talii, która zawiera tylko cztery figury \\- walety, damy, króle i asy. Przyjmiemy też, że losujemy pięć kart jednocześnie. \n" ] }, { "cell_type": "code", "execution_count": 7, "id": "b2c6f9", "metadata": { "collapsed": false }, "outputs": [ { "ename": "ERROR", "evalue": "Error in cards(): could not find function \"cards\"\n", "output_type": "error", "traceback": [ "Error in cards(): could not find function \"cards\"\nTraceback:\n" ] } ], "source": [ "# Zaczniemy od wygenerowania przestrzeni zdarzeń elementarnych\n", "karty = cards() # to polecenie generuje ramkę danych z talią 52 kart\n", "talia = subset(karty, rank=='J'|rank=='Q'|rank=='K'|rank=='A') # generujemy talię 16 kart wybierając odpowiednie wartości figur (ang. rank)\n", "Omega = probspace(urnsamples(talia16, 5)) # Generujemy przestrzeń probabilistyczną, jako zdarzenia elementarne podając kombinacje 5-elementowe kart z talii\n", "\n", "# Teraz chcemy wygenerować zdarzenie A - wylosujemy karetę. Oznacza to, że w danym układzie figura (rank) musi powtarzać się dokładnie 4 razy\n", "# Użyjemy funkcji countrep(x,nrep=n), która zlicza, ile wartości w obiekcie x występuje dokładnie n razy. Jako x możemy podać odpowiednią kolumnę ramki danych\n", "A = subset(Omega, countrep(rank, nrep=4) == 1)\n", "print(A)\n", "\n", "# Na koniec liczymy prawdopodobieństwo\n", "\n", "Prob(A)" ] }, { "cell_type": "markdown", "id": "36da69", "metadata": { "collapsed": false }, "source": [ ] } ], "metadata": { "kernelspec": { "argv": [ "/usr/bin/R", "-e", "IRkernel::main()", "--args", "{connection_file}" ], "display_name": "R (system-wide)", "env": { }, "language": "r", "metadata": { "cocalc": { "description": "R statistical programming language", "priority": 10, "url": "https://www.r-project.org/" } }, "name": "ir", "resource_dir": "/ext/jupyter/kernels/ir" } }, "nbformat": 4, "nbformat_minor": 4 }