Rachunek_prawdopodobienstwa/Przewodnik_studenta_cwiczenia/02_przewodnik_studenta_geometryczne_niezaleznosc.ipynb

53 KiB

Prawdopodobieństwo geometryczne. Niezależność zdarzeń

Treści kształcenia: Prawdopodobieństwo geometryczne. Niezależność zdarzeń. Prawdopodobieństwo na iloczynach kartezjańskich.

Efekty kształcenia: Student/ka potrafi konstruować przestrzenie probabilistyczne dla zadanych problemów rachunku prawdopodobieństwa; potrafi wyrazić podstawowe problemy w języku zdarzeń losowych; umie zastosować poznane twierdzenia i własności przestrzeni probabilistycznych do rozwiązywania prostych zagadnień rachunku prawdopodobieństwa.

Prawdopodobieństwo geometryczne

Do tej pory rozważaliśmy eksperymenty losowe o skończonym zbiorze zdarzeń elementarnych. Nietrudno jednak wymyślić eksperyment, w którym potencjalnych wyników jest nieskończenie wiele, czy wręcz nieprzeliczalnie wiele.

Przykład 1 (dart)

Rozważmy eksperyment losowy, w którym gracz rzuca do tarczy lotką. Załóżmy idealistycznie, że gracz zawsze trafia w tarczę i że każdy z punktów tej tarczy jest równo prawdopodobny. Jako wynik tego eksperymentu możemy przyjąć punkt, w który trafi lotka. Zatem sensownym założeniem jest przyjęcie jako $\Omega$ zbioru wszystkich punktów tarczy, skąd oczywiście otrzymujemy $|\Omega| = \infty$. Gdybyśmy teraz chcieli policzyć prawdopodobieństwo zdarzenia $A$ polegającego na trafienie w górną połowę tarczy, to w pierwszej kolejności powinniśmy zauważyć, że $|A| = \infty$, zatem porównanie $|A|$ do $|\Omega|$ nie ma sensu (otrzymujemy symbol nieoznaczony $\frac{\infty}{\infty}$).

Powyższy przykład pokazuje, że w pewnych doświadczeniach losowych model klasyczny niekoniecznie dobrze odzwierciedla rzeczywistość, a raczej po prostu się nie przydaje. Jaki model w takim razie przyjąć? Intuicja podpowiada nam, że prawdopodobieństwo trafienia w górną połowę tarczy powinno wynosić $1/2$, ponieważ górna połowa tarczy stanowi połowę całej tarczy. Zamiast porównywać liczbę punktów odpowiadających obydwu zdarzeniom, możemy w tym przypadku porównać pola obszarów, które im odpowiadają, tzn. możemy porównać pola dwóch obiektów geometrycznych (tarczy, którą utożsamiamy z kołem i górnej połowy tarczy, która odpowiadać będzie połówce koła). Taki model nazywać będziemy modelem prawdopodobieństwa geometrycznego, ponieważ rozważane w nim zdarzenia odpowiadają pewnym obiektom geometrycznym.

Zanim przejdziemy do formalnego zdefiniowania modelu prawdopodobieństwa geometrycznego, zatrzymajmy się na chwilę przy sposobie mierzenia wielkości różnych obiektów geometrycznych. Dla uproszczenia skupimy się tylko na obiektach jednowymiarowych, dwuwymiarowych i trójwymiarowych. Przez miarę zbioru $A$, oznaczaną jako $\lambda(A)$, rozumieć będziemy odpowiednio:

  • w przypadku jednowymiarowym: długość odcinka $A$ lub sumę długości odcinków, które stanowią zbiór $A$,
  • w przypadku dwuwymiarowym: pole powierzchni obszaru $A$ lub sumę pól powierzchni obszarów stanowiących zbiór $A$,
  • w przypadku trójwymiarowym: objętość bryły $A$ lub sumę brył stanowiących zbiór $A$.

Oczywiście nic nie stoi na przeszkodzie, żebyśmy rozważali również przypadki wyżej wymiarowe. My natomiast skupimy się tylko na tych trzech. Co więcej, w naszych rozważaniach będziemy zawsze przyjmować, że rodzina wszystkich zdarzeń $\mathcal{F} \subset \mathcal{P}(\Omega)$, gdzie $\mathcal{P}(\Omega)$ to zbiór potęgowy zbioru $\Omega$, obejmuje dokładnie te zbiory, dla których istnieje ich miara (czyli odpowiednio długość, pole lub objętość). Są to tzw. zbiory mierzalne. Jest to założenie konieczne ze względów formalnych - okazuje się bowiem, że istnieją zbiory wymykające się pojęciu miary. W tym miejscu odsyłamy zainteresowane osoby do kursu z Teorii miary, gdzie znajdziecie formalną definicję pojęcia miary, zbiorów mierzalnych oraz zbiorów niemierzalnych.

Definicja (prawdopodobieństwo geometryczne)

Dla zbioru $\Omega\subset \mathbb{R}^n$ o skończonej mierze, czyli spełniającego $\lambda(\Omega) < \infty$, prawdopodobieństwo zdarzenia $A\subseteq \Omega$ nazywamy prawdopodobieństwem geometrycznym i definiujemy jako $$\mathbb{P}(A) = \frac{\lambda(A)}{\lambda(\Omega)}. $$

Uwaga: Warto podkreślić, że podzbiór $A\subset \Omega$, który jest wymiaru niższego niż $\Omega$, ma zawsze miarę $\lambda(A)=0$, np.:

  • jeśli $\Omega$ jest odcinkiem, a $A$ jest punktem, to $\lambda(A)=0$,

  • jeśli $\Omega$ jest zbiorem dwuwymiarowym, np. kwadratem jednostkowym, a $A$ jest odcinkiem, np. przekątną kwadratu lub bokiem kwadratu, to $\lambda(A)=0$,

  • jeśli $\Omega$ jest bryłą, np. walcem, a $A$ jest obiektem dwuwymiarowym, np. podstawą walca, albo częścią wspólną pewnej płaszczyzny i walca, to $\lambda(A)=0$.

    Co więcej w zależności od kontekstu miara $\lambda$ będzie zawsze dobierana względem wymiaru zbioru $\Omega$.

Przykład 2

Losujemy punkt $x$ z odcinka jednostkowego. Punkt $x$ dzieli odcinek jednostkowy na dwa krótsze odcinki o długościach odpowiednio $a$ i $b$. Następnie konstruujemy prostokąt o bokach długości $a$ i $b$. Ile wynosi prawdopodobieństwo, że pole otrzymanego prostokąta jest większe niż $\frac29$?

Jako zbiór zdarzeń elementarnych przyjmijmy odcinek jednostkowy $\Omega = [0,1]$. Następnie niech $A$ oznacza zdarzenie, prawdopodobieństwo którego chcemy wyznaczyć. Zauważmy, że dwa uzyskane odcinki mają długość odpowiednio $$a=x \quad \text{oraz} \quad b=1-x.$$ Zatem interesuje nas, dla jakich punktów $x$ zachodzi nierówność $$x(1-x) > \frac29.$$ Powyższa nierówność po przekształceniu daje nam $$\left(x - \frac13\right)\left(x - \frac23\right) < 0.$$ (Oczywiście możemy też wyznaczyć pierwiastki odpowiedniego równania kwadratowego obliczając najpierw $\Delta$). Po rozwiązaniu powyższej nierówności otrzymujemy $x\in \left(\frac13, \frac23\right)$. Zatem $A = \left(\frac13, \frac23\right)$ i szukane prawdopodobieństwo wynosi $$\mathbb{P}(A) = \frac{\lambda(A)}{\lambda(\Omega)} = \frac{\frac23-\frac13}{1-0} = \frac13.$$

Przykład 3

Losujemy punkt z kwadratu o wierzchołkach $(0,0), (2,0), (2,2), (0,2)$. Ile wynosi prawdopodobieństwo, że wylosowany punkt znajduje się na brzegu kwadratu? Ile wynosi prawdopodobieństwo, że współrzędne wylosowanego punktu różnią się o co najwyżej $0{,}5$?

Tym razem przyjmujemy $\Omega = [0,2]\times [0,2]$, z kolei miarą $\lambda$ jest pole figury. Zatem mamy $\lambda(\Omega)=4$. Niech $A$ będzie zdarzeniem polegającym na trafieniu w brzeg kwadratu. Wówczas $A$ składa się ze wszystkich punktów leżących na brzegu kwadratu i możemy ten zbiór potraktować jako sumę czterech odcinków. Ponieważ miara odcinka w zbiorze dwuwymiarowym wynosi zero, otrzymujemy $\lambda(A) = 0$ oraz $$\mathbb{P}(A) = \frac{\lambda(A)}{\lambda(\Omega)} = \frac{0}{4} = 0.$$

Rozważmy teraz zdarzenie $B$ polegające na wylosowaniu punktu, którego współrzędne różnią się o co najwyżej $0{,}5$. Jak wygląda zbiór $B$? Jest to zbiór punktów $(x,y)\in\Omega$ spełniających nierówność $$|x-y| \leq 0{,}5.$$ Nierówność ta sprowadza się z kolei do $$x-y \leq 0{,}5 \quad \land \quad x-y \geq -0{,}5,$$ czyli $$ y \geq x - 0{,}5 \quad \land \quad y \leq x + 0{,}5.$$ Na poniższym rysunku kolorem czerwonym zaznaczono obszar odpowiadający zdarzeniu $B$. Jest to część wspólna kwadratu $\Omega$ oraz pasa znajdującego się pomiędzy prostymi $y = x - 0{,}5$ i $y = x + 0{,}5$. image Teraz wystarczy policzyć jego pole. Zauważmy, że po usunięciu czerwonego sześciokąta z wyjściowego kwadratu otrzymamy dwa trójkąty prostokątne, równoramienne, o przyprostokątnych długości $1{,}5$. Dadzą nam one łącznie kwadrat o boku $1{,}5$, skąd otrzymujemy $\lambda(B) = 1{,}5 \cdot 1{,}5 = 2{,}25$ oraz $$\mathbb{P}(B) = \frac{\lambda(B)}{\lambda(\Omega)} = \frac{2{,}25}{4} = 0{,}5625.$$

Przykład 4 (R)

Mamy do dyspozycji prostokątną deskę o wymiarach $5m\times 2m$. Wybieramy losowo dwa punkty: punkt $x$ na dolnym i punkt $y$ na lewym boku deski. Następnie przycinamy deskę w wybranych punktach (prostopadle do boku deski), otrzymując mniejszą deseczkę o wymiarach $x\times y$. Jakie są szanse na to, że otrzymana deseczka ma pole mniejsze niż $4 m^2$?

Zauważmy, że w tym przypadku jako zbiór zdarzeń elementarnych możemy przyjąć prostokąt $\Omega=[0,5]\times [0,2]$. Aby pole otrzymanej deseczki było mniejsze niż $4 m^2$ musi zachodzić nierówność $xy<4$, czyli $y<\frac4x$. Zobaczymy, jak możemy rozwiązać to zadanie, wspomagając się językiem R.

# Zaczniemy od wykonania rysunku pomocniczego
# Rysujemy funkcję y=4/x
f<-function(x) 4/x
curve(f, from=0, to=5.5, ylim=c(0,2.2)) 

# Dorysowujemy odcinki, które ograniczają zbiór zdarzeń elementarnych Omega
segments(0, 0, 0, 2) # polecenie segments(x0, y0, x1, y1) rysuje odcinek o końcach w punktach (x0, y0) i (x1, y1)
segments(0, 0, 5, 0)
segments(5, 0, 5, 2)
segments(0, 2, 5, 2)

# Możemy teraz obliczyć miarę zbioru Omega
pole_omega = 2*5

# Zauważmy, że interesujące nas zdarzenie odpowiada obszarowi, który jest częścią prostokąta znajdującą się poniżej krzywej y=4/x
# Można łatwo zauważyć, że ten obszar warto podzielić na dwie części: na lewo od prostej x=2 i na prawo od tej prostej
segments(2, 0, 2, 2, lty=2)

# Miara lewej części tego obszaru odpowiada polu prostokąta o wymiarach 2x2
pole1 = 2*2

# Natomiast aby wyznaczyć miarę prawej części obszaru, warto sobie przypomnieć, że do obliczania pól powierzchni pod wykresem funkcji możemy używać całek oznaczonych
pole2 = integrate(f, 2, 5) # polecenie integrate(f, a, b) w sposób numeryczny szacuje wartość całki oznaczonej z funkcji f na przedziale [a,b] - w odpowiedzi dostaniemy listę. Interesująca nas wartość to pierwszy element tej listy

# Możemy teraz obliczyć prawdopodobieństwo interesującego nas zdarzenia
p = (pole1 + pole2[[1]])/pole_omega
paste('Prawdopodobieństwo otrzymania deseczki o polu mniejszym niż 4 to', p)
'Prawdopodobieństwo otrzymania deseczki o polu mniejszym niż 4 to 0.766516292749662'

Niezależność zdarzeń

Jednym z kluczowych pojęć rachunku prawdopodobieństwa jest pojęcie niezależności zdarzeń. Intuicyjnie zdarzenia niezależne to takie, które na siebie nie wpływają, to znaczy fakt, że jedno z nich zajdzie nie wpływa na prawdopodobieństwo tego, czy zajdzie drugie z nich. Natomiast formalna definicja niezależności przedstawia się następująco.

Definicja (niezależność zdarzeń)

Zbiór zdarzeń $\{A_i:i\in I\}$ jest niezależny, jeśli dla każdego (skończonego) podzbioru $J\subseteq I$ mamy $$\mathbb{P}\left(\bigcap_{j\in J} A_j\right) = \prod_{j\in J}\mathbb{P}(A_j). $$ W szczególności zdarzenia $A$ i $B$ są niezależne jeśli $\mathbb{P}(A\cap B) = \mathbb{P}(A)\cdot \mathbb{P}(B)$. Z kolei zdarzenia $A$, $B$ i $C$ są niezależne, jeśli jednocześnie zachodzą poniższe cztery równania $$\mathbb{P}(A\cap B) = \mathbb{P}(A)\cdot \mathbb{P}(B),$$ $$\mathbb{P}(A\cap C) = \mathbb{P}(A)\cdot \mathbb{P}(C),$$ $$\mathbb{P}(B\cap C) = \mathbb{P}(B)\cdot \mathbb{P}(C),$$ $$\mathbb{P}(A\cap B\cap C) = \mathbb{P}(A)\cdot \mathbb{P}(B) \cdot \mathbb{P}(C).$$

Definicja (niezależność parami)

Zbiór zdarzeń $\{A_i:i\in I\}$ jest parami niezależny jeśli dla każdych $i, j\in I$ zachodzi $\mathbb{P}(A_i)\cdot\mathbb{P}(A_j) = \mathbb{P}(A_i\cap A_j)$.

Przykład 5

Rzucamy cztery razy monetą. Niech $A$ będzie zdarzeniem polegającym na wyrzuceniu parzystej liczby orłów, a $B$ zdarzeniem polegającym na wyrzuceniu co najmniej trzech reszek. Czy zdarzenia $A$ i $B$ są niezależne?

Przyjmijmy model klasyczny ze zbiorem zdarzeń elementarnych $\Omega$ składającym się ze wszystkich ciągów długości cztery o wyrazach ze zbioru $\{O, R\}$. Zatem $|\Omega| = 2^4 = 16$. Następnie zauważmy, że $$|A| = {4\choose 0} + {4\choose 2} + {4\choose 4} = 8,$$ $$|B| = {4\choose 3} + {4\choose 4} = 5$$ oraz $$|A\cap B| = {4\choose 4} = 1.$$ Zatem otrzymujemy $$\mathbb{P}(A) \cdot \mathbb{P}(B) = \frac{8}{16}\cdot \frac{5}{16} = \frac{5}{32} \neq \frac{1}{16} = \mathbb{P}(A\cap B),$$ czyli zdarzenia $A$ i $B$ nie są niezależne.

Przykład 6 (R)

Rzucamy $n$-krotnie symetryczną monetą. Niech $A$ oznacza zdarzenie, że wypadnie co najwyżej jeden orzeł, a $B$ zdarzenie, że moneta nie będzie upadać zawsze na tę samą stronę. Czy zdarzenia te są niezależne?

Rozwiążemy to zadanie przy pomocy języka R i pakietu probs dla $n\in\{2,3,4,5\}$.

# Napiszemy funkcję argumentu n, która będzie sprawdzać niezależność zdarzeń A i B
niezaleznosc <- function(n) {moneta = tosscoin(n, makespace=TRUE) # generujemy przestrzeń probabilistyczną związaną z n-krotnym rzutem monetą (interpretujemy T jako reszki, a H jako orły)
                          xA = c()
                          xB = c()
                          for (i in 1:nrow(moneta)) {x = length(which(moneta[i,]=='H')) # Zliczamy liczbę orłów w danym zdarzeniu elementarnym
                                                    if (x<=1) {xA = c(xA, i)}
                                                    if (x==0 | x==n) {xB = c(xB, i)}}
                           A = moneta[xA,] # Generujemy zdarzenie A
                           B = moneta[xB,] # Generujemy zdarzenie B
                           AB = intersect(A, B) # Generujemy część wspólną zdarzeń A i B
                           pA = Prob(A) # Obliczamy prawdopodobieństwo zdarzenia A
                           pB = Prob(B) # Obliczamy prawdopodobieństwo zdarzenia B
                           pAB = Prob(AB) # Obliczamy prawdopodobieństwo części wspólnej zdarzeń A i B
                           y = (pA*pB==pAB) # Sprawdzamy warunek na niezależność
                           p = c(pA, pB, pAB, y)}

# Następnie sprawdzamy niezależność zdarzeń A i B dla różnych wartości n

for (n in 2:5) {
    x = niezaleznosc(n)
    print(paste('P(A)=', x[1]))
    print(paste('P(B)=', x[2]))
    print(paste('Prawdopodobieństwo części wspólnej zdarzeń A i B:', x[3]))
    if (x[4]) {print('Zdarzenia A i B są niezależne')
              } else {print('Zdarzenia A i B nie są niezależne')}
}
Error in tosscoin(n, makespace = TRUE): could not find function "tosscoin"
Traceback:

1. niezaleznosc(n)

Przykład 7

Rzucamy trzy razy sześcienną kostką. Rozważmy trzy zdarzenia:

  • $A$ - w pierwszym rzucie wypadła parzysta liczba oczek,

  • $B$ - w drugim rzucie wypadły co najwyżej dwa oczka,

  • $C$ - suma trzech wyników jest parzysta.

    Czy te zdarzenia są niezależne? Czy są parami niezależne?

    Intuicja podpowiada nam, że pierwsze dwa zdarzenia powinny być niezależne, bo dotyczą innego rzutu kostką. Z kolei trzecie zdarzenie wydaje się być niezależne od pierwszych dwóch, bo bez względu na to co wypadło w pierwszych dwóch rzutach, mamy $50%$ szans aby wynik trzeciego rzutu dopełnił sumę dwóch pierwszych do liczby parzystej. Co możemy natomiast powiedzieć o niezależności wszystkich trzech zdarzeń?

Sprawdzimy niezależność zdarzeń zgodnie z definicją. W tym celu zaczynamy od ustalenia modelu. Możemy przyjąć jako zbiór zdarzeń elementarnych $\Omega$ zbiór wszystkich ciągów długości trzy o wyrazach ze zbioru $\{1, 2, 3, 4, 5, 6\}$. Mamy zatem do czynienia z modelem klasycznym, bo każde takie zdarzenie elementarne ma równe szanse pojawić się w wyniku naszego eksperymentu. Ponadto mamy $$ |\Omega| = 6^3 = 216, \quad |A| = 3\cdot6\cdot 6 = 108, \quad |B| = 6\cdot 2\cdot 6 = 72,\quad |C| = 6\cdot 6\cdot 3 = 108,$$ gdzie ostatnia równość wynika z faktu, że dla dowolnego wyniku pierwszych dwóch rzutów mamy dokładnie trzy możliwości w trzecim rzucie, które dadzą nam parzystą sumę wszystkich trzech (jeśli suma dwóch pierwszych rzutów jest nieparzysta, to w ostatnim rzucie musi wypaść nieparzysta liczba oczek, a jeśli jest parzysta, to w ostatnim musi wypaść parzysta liczba oczek). Dalej $$|A\cap B| = 3\cdot 2 \cdot 6 = 36, \quad |A\cap C| = 3\cdot 6\cdot 3 = 54, \quad |B\cap C| = 6\cdot 2\cdot 3 = 36,\quad |A\cap B\cap C| = 3\cdot 2\cdot 3 = 18.$$ Zatem $$\mathbb{P}(A)\cdot \mathbb{P}(B) = \frac{108}{216}\cdot \frac{72}{216} = \frac16 = \frac{36}{216} = \mathbb{P}(A\cap B),$$ $$\mathbb{P}(A)\cdot \mathbb{P}(C) = \frac{108}{216}\cdot \frac{108}{216} = \frac14 = \frac{54}{216} = \mathbb{P}(A\cap C),$$ $$\mathbb{P}(B)\cdot \mathbb{P}(C) = \frac{72}{216}\cdot \frac{108}{216} = \frac16 = \frac{36}{216} = \mathbb{P}(B\cap C),$$ z czego wynika, że zdarzenia $A$, $B$ i $C$ są parami niezależne. Ponadto mamy $$\mathbb{P}(A)\cdot \mathbb{P}(B)\cdot \mathbb{P}(C) = \frac{108}{216} \cdot \frac{72}{216} \cdot \frac{108}{216} = \frac{1}{12} = \frac{18}{216} = \mathbb{P}(A\cap B\cap C),$$ zatem zdarzenia $A$, $B$ i $C$ są też niezależne.

Uwaga: Nawet mając dobrą intuicję musimy i tak formalnie uzasadnić, czy definicja niezależności jest spełniona!

Uwaga: Proszę pamiętać, że aby pokazać niezależność trzech zdarzeń ($A$, $B$, $C$ w powyższym przykładzie), musimy sprawdzić cztery różne warunki. Wystarczy, żeby choć jeden z nich nie zachodził, a niezależności nie będzie.