forked from s444420/AL-2020
Zaktualizuj 'Raporty/raport_444428.md'
This commit is contained in:
parent
b02e90ebcf
commit
60c2cbc17a
@ -10,8 +10,11 @@ dane uczące znajdują się w pliku data.py w liście learning_data
|
||||
|
||||
### Tworzenie drzewa decyzyjnego
|
||||
|
||||
Główną funkcją jest build_tree(rows), która jak wskazuje nazwa tworzy drzewo. Funkcja przyjmuje
|
||||
jako argument listę zawierającą zestaw danych, w tym przypadku będą to słodycze o różnych właściwościach.
|
||||
Główną funkcją jest
|
||||
|
||||
`build_tree(rows)` która jak wskazuje nazwa tworzy drzewo.
|
||||
|
||||
Funkcja przyjmuje jako argument listę zawierającą zestaw danych, w tym przypadku będą to słodycze o różnych właściwościach.
|
||||
|
||||
```python
|
||||
def build_tree(rows):
|
||||
@ -79,14 +82,12 @@ def gini(rows):
|
||||
impurity -= prob_of_lbl ** 2
|
||||
return impurity
|
||||
```
|
||||
`class_counts(rows)` to funkcja, która dla danego zestawu danych zwraca wszystkie unikalne klasy oraz liczbę ich wystąpień.
|
||||
`class_counts(rows)` to funkcja, która dla danego zestawu danych zwraca wszystkie unikalne 'kategorie' oraz liczbę ich wystąpień.
|
||||
|
||||
Dla przykładu, dla zestawu w którym wszystkie elementy podchodzą pod tę samą kategorię wartość Gini będzie równa zero,
|
||||
natomiast dla zbioru w którym znajdują się dwie kategorie wartość ta wyniesie 0,5.
|
||||
Dla przykładu, w zestawie w którym wszystkie elementy podchodzą pod tę samą kategorię wartość Gini Impurity będzie równa zero, natomiast w zbiorze w którym znajdują się dwie kategorie wartość ta wyniesie 0,5. Im więcej różnych kategorii tym bardziej wartość Gini Impurity będzie zbliżała się do 1.
|
||||
|
||||
Po znalezieniu najbardziej optymalnego pytania, algorytm dzieli zestaw na elementy, dla których pytanie jest prawdziwe
|
||||
(true_rows), oraz te dla których jest fałszywe (false_rows). Następnie wykonuje rekurencyjnie procedurę build_tree dla
|
||||
obu poddrzew tak długo aż nie dojdzie do liści.
|
||||
(true_rows), oraz te dla których jest fałszywe (false_rows). Następnie wykonuje rekurencyjnie procedurę `build_tree` dla obu poddrzew tak długo aż nie dojdzie do liści.
|
||||
|
||||
Element o zadanym zestawie cech, zostaje odnaleziony w drzewie dzięki prostej procedurze
|
||||
|
||||
|
Loading…
Reference in New Issue
Block a user