Zaktualizuj 'Natalia_Wiśniewska_drzewa_decyzyjne.md'

This commit is contained in:
Natalia Wiśniewska 2020-06-03 16:49:10 +00:00
parent e426cb9e46
commit 59a0858ac4

View File

@ -47,6 +47,7 @@ class Question:
header[self.column], condition, str(self.value)) header[self.column], condition, str(self.value))
``` ```
Funkcja **partition** tworzy kolejne gałęzie poprzez podział odpowiedzi na fałszywe i prawdziwe. Funkcja **partition** tworzy kolejne gałęzie poprzez podział odpowiedzi na fałszywe i prawdziwe.
Następnie obliczamy wartość gini oraz przyrost informacji: Następnie obliczamy wartość gini oraz przyrost informacji:
``` ```
def gini(rows): def gini(rows):
@ -57,7 +58,6 @@ def gini(rows):
impurity -= prob_of_lbl**2 impurity -= prob_of_lbl**2
return impurity return impurity
def info_gain(left, right, current_uncertainty): def info_gain(left, right, current_uncertainty):
p = float(len(left)) / (len(left) + len(right)) p = float(len(left)) / (len(left) + len(right))
return current_uncertainty - p * gini(left) - (1 - p) * gini(right) return current_uncertainty - p * gini(left) - (1 - p) * gini(right)