wygładzanie

This commit is contained in:
szymonj98 2022-05-17 01:12:04 +02:00
parent 6b5a68e900
commit b866af4aa7
1 changed files with 42 additions and 0 deletions

View File

@ -88,6 +88,48 @@
"\n"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"<b>Naiwna klasyfikacja bayesowska przy wielu cechach</b>\n",
"<br><br><br>\n",
"Klasyfikator bayesowski możemy stosować na wielu cechach, wykonuje się to w następujący sposób:\n",
"\n",
"W naszym przypadku obiekt X posiada wiele cech $X = (x1, x2, x3, ... xn)$ wtedy stosując znany już wzór:\n",
"\n",
"$P(K|X) = \\frac{P(X|K) P(K)}{P(X)}$ \n",
"\n",
"$P(K)$ pozostaje niezmienne jest to $\\frac{liczba\\ elementów\\ klasy\\ K}{wszystkie\\ elementy\\ zbioru}$\n",
"\n",
"Element X posiada wiele cech więc:\n",
"\n",
"$P(X|K) = P(x1|K)*P(x2|K)*...*P(xn|K)$\n",
"\n",
"$P(xk|K) = \\frac{Liczba\\ elementów\\ klasy\\ K\\ dla\\ których\\ wartość\\ cechy\\ Ak\\ jest\\ równa\\ xk}{liczba\\ wszystkich\\ obiektów\\ klasy\\ K}$\n",
"<br><br><br><br>\n",
"<b>Powyższy wzór ma jedna pewne problemy z zerowymi prawdopodobieństwami</b>\n",
"<br><br><br>\n",
"Co w przypadku gdy dla którejś cechy $P(xk|K) = 0$\n",
"\n",
"Może się tak zdarzyć gdy cecha $Ak$ nie będzie przyjmowała wartości $xk$ danego obiektu $X$ wtedy zgodnie ze wzorem otrzymamy $\\frac{0}{liczba\\ wszystkich\\ obiektów\\ klasy\\ K}$\n",
"Gdy tak się stanie obliczone prawdopodobieństwo będzie równe 0, a przecież brak wartości xk dla cechy Ak klasy K nie musi wcale oznaczać śe dany obiekt nie może należeć do klasy K. Aby temu zaradzić stosuje się wygładzanie\n",
"<br><br><br>\n",
"<b>Wygładzanie Laplace'a</b>\n",
"<br><br><br>\n",
"Wygładzanie Laplace'a zwane jest również wygładzaniem + 1, jest to bardzo prosty sposób wystarczy dla każdego $P(xK|K)$ dodać do licznika 1 a do mianownika dodać liczbę cech obiektu $X = (x1,x2,...,xn)$:\n",
"\n",
"$P(xk|K) = \\frac{(Liczba\\ elementów\\ klasy\\ K\\ dla\\ których\\ wartość\\ cechy\\ Ak\\ jest\\ równa\\ xk\\\\)\\ + 1}{(liczba\\ wszystkich\\ obiektów\\ klasy\\ K\\\\) + n}$\n",
"\n",
"Łatwo można zauważyć że samo dodanie 1 do licznika nie jest wystarczające ponieważ wtedy $P(xK|K)$ mogłoby być $> 1$\n",
"<br><br><br>\n",
"Dzięki wygładzaniu Laplace'a $P(X|K)$ nigdy nie bęzie zerowe minimalna wartość to\n",
"\n",
"$\\frac{n}{(liczba\\ wszystkich\\ obiektów\\ klasy\\ K\\\\) + n}$\n",
"<br><br><br>\n",
"\n"
]
},
{
"cell_type": "markdown",
"metadata": {},