From 60c2cbc17ad804a28adc72d0dc95d92a5142edfe Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?Wojciech=20=C5=81ukasik?= Date: Tue, 19 May 2020 21:41:26 +0000 Subject: [PATCH] Zaktualizuj 'Raporty/raport_444428.md' --- Raporty/raport_444428.md | 15 ++++++++------- 1 file changed, 8 insertions(+), 7 deletions(-) diff --git a/Raporty/raport_444428.md b/Raporty/raport_444428.md index f99651d..7f9d0b9 100644 --- a/Raporty/raport_444428.md +++ b/Raporty/raport_444428.md @@ -10,8 +10,11 @@ dane uczące znajdują się w pliku data.py w liście learning_data ### Tworzenie drzewa decyzyjnego -Główną funkcją jest build_tree(rows), która jak wskazuje nazwa tworzy drzewo. Funkcja przyjmuje -jako argument listę zawierającą zestaw danych, w tym przypadku będą to słodycze o różnych właściwościach. +Główną funkcją jest + +`build_tree(rows)` która jak wskazuje nazwa tworzy drzewo. + +Funkcja przyjmuje jako argument listę zawierającą zestaw danych, w tym przypadku będą to słodycze o różnych właściwościach. ```python def build_tree(rows): @@ -79,14 +82,12 @@ def gini(rows): impurity -= prob_of_lbl ** 2 return impurity ``` -`class_counts(rows)` to funkcja, która dla danego zestawu danych zwraca wszystkie unikalne klasy oraz liczbę ich wystąpień. +`class_counts(rows)` to funkcja, która dla danego zestawu danych zwraca wszystkie unikalne 'kategorie' oraz liczbę ich wystąpień. -Dla przykładu, dla zestawu w którym wszystkie elementy podchodzą pod tę samą kategorię wartość Gini będzie równa zero, -natomiast dla zbioru w którym znajdują się dwie kategorie wartość ta wyniesie 0,5. +Dla przykładu, w zestawie w którym wszystkie elementy podchodzą pod tę samą kategorię wartość Gini Impurity będzie równa zero, natomiast w zbiorze w którym znajdują się dwie kategorie wartość ta wyniesie 0,5. Im więcej różnych kategorii tym bardziej wartość Gini Impurity będzie zbliżała się do 1. Po znalezieniu najbardziej optymalnego pytania, algorytm dzieli zestaw na elementy, dla których pytanie jest prawdziwe -(true_rows), oraz te dla których jest fałszywe (false_rows). Następnie wykonuje rekurencyjnie procedurę build_tree dla -obu poddrzew tak długo aż nie dojdzie do liści. +(true_rows), oraz te dla których jest fałszywe (false_rows). Następnie wykonuje rekurencyjnie procedurę `build_tree` dla obu poddrzew tak długo aż nie dojdzie do liści. Element o zadanym zestawie cech, zostaje odnaleziony w drzewie dzięki prostej procedurze