From 84c416cc75eec7310eb814da0a9e93ee73dde842 Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?Jaros=C5=82aw=20Zb=C4=85ski?= Date: Tue, 19 May 2020 20:33:17 +0000 Subject: [PATCH 1/5] =?UTF-8?q?Prze=C5=9Blij=20pliki=20do=20''?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- Main.cpp | 160 ++++++++-- RaportJaroslawZbaski.md | 204 +++++++++++++ dane.txt | 625 ++++++++++++++++++++++++++++++++++++++++ decyzje.txt | 625 ++++++++++++++++++++++++++++++++++++++++ drzewaDecyzyjne.py | 165 +++++++++++ 5 files changed, 1752 insertions(+), 27 deletions(-) create mode 100644 RaportJaroslawZbaski.md create mode 100644 dane.txt create mode 100644 decyzje.txt create mode 100644 drzewaDecyzyjne.py diff --git a/Main.cpp b/Main.cpp index b087e21..d6a794c 100644 --- a/Main.cpp +++ b/Main.cpp @@ -7,6 +7,7 @@ #include #include #include +#include using namespace std; @@ -21,7 +22,7 @@ struct cell double f, g, h; }; -char pole[27][27][2]; +char pole[27][27][6]; int pozycjaTraktoraX = 1, pozycjaTraktoraY = 1; char currentWay = 'S'; @@ -130,6 +131,10 @@ void updatePola() { color("purple", "dark_yellow"); }break; + case 'Z': + { + color("cyan", "dark_yellow"); + }break; case 'T': { color("red", "dark_yellow"); @@ -161,33 +166,33 @@ void correctMovement(char wantedWay) { switch (currentWay) { - case 'N': - { - if (wantedWay == 'S') - currentWay = wantedWay; - else - currentWay = 'W'; + case 'N': + { + if (wantedWay == 'S') + currentWay = wantedWay; + else + currentWay = 'W'; }break; - case 'S': - { - if (wantedWay == 'N') - currentWay = wantedWay; - else - currentWay = 'W'; + case 'S': + { + if (wantedWay == 'N') + currentWay = wantedWay; + else + currentWay = 'W'; }break; - case 'W': - { - if (wantedWay == 'E') - currentWay = wantedWay; - else - currentWay = 'N'; + case 'W': + { + if (wantedWay == 'E') + currentWay = wantedWay; + else + currentWay = 'N'; }break; - case 'E': - { - if (wantedWay == 'W') - currentWay = wantedWay; - else - currentWay = 'N'; + case 'E': + { + if (wantedWay == 'W') + currentWay = wantedWay; + else + currentWay = 'N'; }break; } } @@ -501,7 +506,7 @@ void test1() { pole[1][3][0] = 'B'; pole[1][3][1] = '9'; - pole[3][1][0] = 'B'; + pole[3][1][0] = 'Z'; pole[3][1][1] = '9'; } void test2() @@ -518,15 +523,116 @@ void test2() updatePola(); } +void testSI1() +{ + for (int i = 1; i < 26; i++) + { + for (int j = 1; j < 26; j++) + { + if (j % 3 == 0) + { + pole[i][j][2] = 'z'; //zyzne + pole[i][j][3] = 'n'; //nawodnione + pole[i][j][4] = 'c'; //w cieniu + pole[i][j][5] = 'k'; //kwasne + } + else + { + if (j % 3 == 1) + { + pole[i][j][2] = 'j'; //jalowe + pole[i][j][3] = 'n'; //nawodnione + pole[i][j][4] = 's'; //w sloncu + pole[i][j][5] = 'n'; //neutralne + } + else + { + pole[i][j][2] = 'z'; //zyzne + pole[i][j][3] = 's'; //suche + pole[i][j][4] = 's'; //sloneczne + pole[i][j][5] = 'z'; //zasadowe + } + } + } + } +} + +void sendState() +{ + ofstream write("dane.txt"); + for (int i = 1; i < 26; i++) + { + for (int j = 1; j < 26; j++) + { + string a; + a += pole[i][j][2]; + a += ' '; + a += pole[i][j][3]; + a += ' '; + a += pole[i][j][4]; + a += ' '; + a += pole[i][j][5]; + write << a << endl; + } + } + write.close(); +} +void reciveState() +{ + ifstream read("decyzje.txt"); + if (read.is_open()) + { + char plant; + int i = 1; + int j = 1; + while (read >> plant) + { + if (j == 25) + { + gogo(1, i+1); + } + else + { + gogo(j+1 , i ); + } + pole[i][j][0] = plant; + if (plant == '.') + { + pole[i][j][1] = '1'; + } + else + { + pole[i][j][1] = '9'; + } + if (j == 25) + { + j = 1; + i += 1; + } + else + { + j += 1; + } + } + } +} + void start1() { int goalX = 3, goalY = 4; test1(); + testSI1(); pole[1][1][0] = 'T'; pole[1][1][1] = '1'; pole[goalY][goalX][0] = 'G'; pole[goalY][goalX][1] = '9'; gogo(goalX, goalY); + gogo(goalX - 1, goalY); + pole[goalY][goalX][0] = 'Z'; + pole[goalY][goalX][1] = '9'; + updatePola(); + //sendState(); //trzeba ręcznie zmieniać między wysyłaniem stanu a pobieraniem stanu pola + reciveState(); } void start2() { @@ -581,7 +687,7 @@ int main() updatePola(); - start3(); // testy start 1-3 + start1(); // testy start 1-3 //---------start---------// bool traktorDziala = true; diff --git a/RaportJaroslawZbaski.md b/RaportJaroslawZbaski.md new file mode 100644 index 0000000..02f36cc --- /dev/null +++ b/RaportJaroslawZbaski.md @@ -0,0 +1,204 @@ +##Jarosław Zbąski – raport z podprojektu +--- + #Wybrana metoda: + --- +Do realizacji podprojektu wykorzystano drzewa decyzyjne wskazujące którą roślinę (jeśli w ogóle) należy posadzić na danym polu. Drzewo decyzję podejmuje na podstawie poszczególnych parametrów gleby: + +-żyzność (‘z’-żyzna, ‘j’-jałowa) +-nawodnienie (‘n’ - nawodniona, ‘s’ - sucha) +-nasłonecznienie (‘s’ - w słońcu, ‘c’ – w cieniu) +-kwasowość gleby (‘k’ – kwasowa, ‘n’ – neutralna, ‘z’ - zasadowa) + + #Uczenie modelu: +Dane treningowe: +``` +training_data = [ + #zyznosc, nawodnienie, cien, kwasowość, grupa + ['z', 'n', 's', 'z', 1], + ['z', 'n', 's', 'n', 1], + ['j', 'n', 's', 'z', 1], + ['z', 's', 's', 'n', 1], + ['j', 'n', 'c', 'n', 1], + ['z', 'n', 's', 'k', 1], + ['z', 'n', 'c', 'k', 2], + ['z', 's', 's', 'k', 2], + ['z', 's', 'c', 'k', 2], + ['j', 'n', 's', 'k', 2], + ['z', 's', 'c', 'z', 3], + ['j', 'n', 's', 'n', 3] +] +``` +Budowanie drzewa decyzyjnego opiera się na podziale gałęzi względem algorytmu CART. Ma ono postać ciągu pytań, na które odpowiedzi determinują kolejne pytania, bądź kończą etap. W wyniku otrzymujemy strukturę drzewa, która w węzłach końcowych nie zawiera już pytań, lecz same odpowiedzi. Dodatkowo wypisuje liczbę zestawów danych pasujących do liścia z zestawu treningowego. +``` +def build_tree(rows): + gain, question = find_best_split(rows) + if gain == 0: + return Leaf(rows) + true_rows, false_rows = partition(rows, question) + true_branch = build_tree(true_rows) + false_branch = build_tree(false_rows) + return Decision_Node(question, true_branch, false_branch) +``` +Znajdowanie najlepszego podziału opiera się głównie na Współczynniku Giniego, który mierzy stopień niejednorodności i dzieli ją przez ilość pozostałych zestawów testowych. +``` +def find_best_split(rows): + best_gain = 0 + best_question = None + current_uncertainty = gini(rows) + n_features = len(rows[0]) - 1 + for col in range(n_features): + values = set([row[col] for row in rows]) + for val in values: + question = Question(col, val) + true_rows, false_rows = partition(rows, question) + if len(true_rows) == 0 or len(false_rows) == 0: + continue + gain = info_gain(true_rows, false_rows, current_uncertainty) + if gain >= best_gain: + best_gain, best_question = gain, question + return best_gain, best_question +``` + +Drzewo powstałe poprzez wykonanie metody print_tree(node,spacing) na zestawie testowym: +``` +Czy kwasowosc == k? +--> True: + Czy cien == s? + --> True: + Czy nawodnienie == n? + --> True: + Czy zyznosc == j? + --> True: + Predict {2: 1} + --> False: + Predict {1: 1} + --> False: + Predict {2: 1} + --> False: + Predict {2: 2} +--> False: + Czy cien == s? + --> True: + Czy zyznosc == j? + --> True: + Czy kwasowosc == n? + --> True: + Predict {3: 1} + --> False: + Predict {1: 1} + --> False: + Predict {1: 3} + --> False: + Czy kwasowosc == n? + --> True: + Predict {1: 1} + --> False: + Predict {3: 1} +``` +#Implementacja w C++: +--- +Komunikacja między pythonem a cpp zachodzi przez pliki dane.txt i decyzje.txt. W pliku dane.txt cpp wypisuje stan całego pola w oddzielonych spacją kolumnach począwszy od indeksu x=1,y=1 aż po x=25,y=25. Decyzje podjęte przez drzewo decyzyjne wypisane w pliku decyzje.txt zawierają symbol rośliny lub pola jakie mają się znajdować na polu (również w całej przestrzeni pola). + +Zestaw testowych danych: +``` +void testSI1() +{ + for (int i = 1; i < 26; i++) + { + for (int j = 1; j < 26; j++) + { + if (j % 3 == 0) + { + pole[i][j][2] = 'z'; //zyzne + pole[i][j][3] = 'n'; //nawodnione + pole[i][j][4] = 'c'; //w cieniu + pole[i][j][5] = 'k'; //kwasne + } + else + { + if (j % 3 == 1) + { + pole[i][j][2] = 'j'; //jalowe + pole[i][j][3] = 'n'; //nawodnione + pole[i][j][4] = 's'; //w sloncu + pole[i][j][5] = 'n'; //neutralne + } + else + { + pole[i][j][2] = 'z'; //zyzne + pole[i][j][3] = 's'; //suche + pole[i][j][4] = 's'; //sloneczne + pole[i][j][5] = 'z'; //zasadowe + } + } + } + } +} +``` + +Funkcja wysyłająca stan pola: +``` +void sendState() +{ + ofstream write("dane.txt"); + for (int i = 1; i < 26; i++) + { + for (int j = 1; j < 26; j++) + { + string a; + a += pole[i][j][2]; + a += ' '; + a += pole[i][j][3]; + a += ' '; + a += pole[i][j][4]; + a += ' '; + a += pole[i][j][5]; + write << a << endl; + } + } + write.close(); +} +``` + +Funkcja kierująca traktorem (decyzja co zasiać): +``` +void reciveState() +{ + ifstream read("decyzje.txt"); + if (read.is_open()) + { + char plant; + int i = 1; + int j = 1; + while (read >> plant) + { + if (j == 25) + { + gogo(1, i+1); + } + else + { + gogo(j+1 , i ); + } + pole[i][j][0] = plant; + if (plant == '.') + { + pole[i][j][1] = '1'; + } + else + { + pole[i][j][1] = '9'; + } + if (j == 25) + { + j = 1; + i += 1; + } + else + { + j += 1; + } + } + } +} +``` \ No newline at end of file diff --git a/dane.txt b/dane.txt new file mode 100644 index 0000000..cb1c363 --- /dev/null +++ b/dane.txt @@ -0,0 +1,625 @@ +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n +z s s z +z n c k +j n s n diff --git a/decyzje.txt b/decyzje.txt new file mode 100644 index 0000000..abd4232 --- /dev/null +++ b/decyzje.txt @@ -0,0 +1,625 @@ +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. +B +Z +. diff --git a/drzewaDecyzyjne.py b/drzewaDecyzyjne.py new file mode 100644 index 0000000..cb6ea39 --- /dev/null +++ b/drzewaDecyzyjne.py @@ -0,0 +1,165 @@ +training_data = [ + #zyznosc, nawodnienie, cien, kwasowosc + ['z', 'n', 's', 'z', 1], + ['z', 'n', 's', 'n', 1], + ['j', 'n', 's', 'z', 1], + ['z', 's', 's', 'n', 1], + ['j', 'n', 'c', 'n', 1], + ['z', 'n', 's', 'k', 1], + ['z', 'n', 'c', 'k', 2], + ['z', 's', 's', 'k', 2], + ['z', 's', 'c', 'k', 2], + ['j', 'n', 's', 'k', 2], + ['z', 's', 'c', 'z', 3], + ['j', 'n', 's', 'n', 3] +] + +header = ["zyznosc", "nawodnienie", "cien", "kwasowosc", "wybor"] + +def class_counts(rows): + counts = {} + for row in rows: + label = row[-1] + if label not in counts: + counts[label] = 0 + counts[label] += 1 + return counts + + +def is_numeric(value): + return isinstance(value, int) or isinstance(value, float) + + +class Question: + def __init__(self, column, value): + self.column = column + self.value = value + + def match(self, example): + val = example[self.column] + if is_numeric(val): + return val >= self.value + else: + return val == self.value + + def __repr__(self): + condition = "==" + if is_numeric(self.value): + condition = ">=" + return "Czy %s %s %s?" % ( + header[self.column], condition, str(self.value)) + +def partition(rows, question): + true_rows, false_rows = [], [] + for row in rows: + if question.match(row): + true_rows.append(row) + else: + false_rows.append(row) + return true_rows, false_rows + + +def gini(rows): + counts = class_counts(rows) + impurity = 1 + for lbl in counts: + prob_of_lbl = counts[lbl] / float(len(rows)) + impurity -= prob_of_lbl**2 + return impurity + + +def info_gain(left, right, current_uncertainty): + p = float(len(left)) / (len(left) + len(right)) + return current_uncertainty - p * gini(left) - (1 - p) * gini(right) + + +def find_best_split(rows): + best_gain = 0 + best_question = None + current_uncertainty = gini(rows) + n_features = len(rows[0]) - 1 + for col in range(n_features): + values = set([row[col] for row in rows]) + for val in values: + question = Question(col, val) + true_rows, false_rows = partition(rows, question) + if len(true_rows) == 0 or len(false_rows) == 0: + continue + gain = info_gain(true_rows, false_rows, current_uncertainty) + if gain >= best_gain: + best_gain, best_question = gain, question + return best_gain, best_question + + +class Leaf: + def __init__(self, rows): + self.predictions = class_counts(rows) + +class Decision_Node: + def __init__(self, + question, + true_branch, + false_branch): + self.question = question + self.true_branch = true_branch + self.false_branch = false_branch + +def build_tree(rows): + gain, question = find_best_split(rows) + if gain == 0: + return Leaf(rows) + true_rows, false_rows = partition(rows, question) + true_branch = build_tree(true_rows) + false_branch = build_tree(false_rows) + return Decision_Node(question, true_branch, false_branch) + + +def print_tree(node, spacing=""): + if isinstance(node, Leaf): + print (spacing + "Predict", node.predictions) + return + print (spacing + str(node.question)) + print (spacing + '--> True:') + print_tree(node.true_branch, spacing + " ") + print (spacing + '--> False:') + print_tree(node.false_branch, spacing + " ") + + +my_tree = build_tree(training_data) + +print_tree(my_tree) + +def classify(row, node): + if isinstance(node, Leaf): + return node.predictions + if node.question.match(row): + return classify(row, node.true_branch) + else: + return classify(row, node.false_branch) + +def print_leaf(counts): + total = sum(counts.values()) * 1.0 + probs = {} + for lbl in counts.keys(): + probs[lbl] = str(int(counts[lbl] / total * 100)) + "%" + return probs + + +with open( 'dane.txt', "r" ) as f: + testing_data = [ line.split() for line in f ] + + +file = open("decyzje.txt", "w") +file.write("") +file.close() + +for row in testing_data: + pom = print_leaf(classify(row, my_tree)) + f = open("decyzje.txt", "a") + if pom == {1: '100%'}: + f.write("B\n") + if pom == {2: '100%'}: + f.write("Z\n") + if pom == {3: '100%'}: + f.write(".\n") + f.close() \ No newline at end of file -- 2.20.1 From 3918d1fc79f8f645516c7552d90e101d01ef53a2 Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?Jaros=C5=82aw=20Zb=C4=85ski?= Date: Tue, 19 May 2020 20:39:29 +0000 Subject: [PATCH 2/5] Zaktualizuj 'RaportJaroslawZbaski.md' --- RaportJaroslawZbaski.md | 411 ++++++++++++++++++++-------------------- 1 file changed, 208 insertions(+), 203 deletions(-) diff --git a/RaportJaroslawZbaski.md b/RaportJaroslawZbaski.md index 02f36cc..fea348d 100644 --- a/RaportJaroslawZbaski.md +++ b/RaportJaroslawZbaski.md @@ -1,204 +1,209 @@ -##Jarosław Zbąski – raport z podprojektu ---- - #Wybrana metoda: - --- -Do realizacji podprojektu wykorzystano drzewa decyzyjne wskazujące którą roślinę (jeśli w ogóle) należy posadzić na danym polu. Drzewo decyzję podejmuje na podstawie poszczególnych parametrów gleby: - --żyzność (‘z’-żyzna, ‘j’-jałowa) --nawodnienie (‘n’ - nawodniona, ‘s’ - sucha) --nasłonecznienie (‘s’ - w słońcu, ‘c’ – w cieniu) --kwasowość gleby (‘k’ – kwasowa, ‘n’ – neutralna, ‘z’ - zasadowa) - - #Uczenie modelu: -Dane treningowe: -``` -training_data = [ - #zyznosc, nawodnienie, cien, kwasowość, grupa - ['z', 'n', 's', 'z', 1], - ['z', 'n', 's', 'n', 1], - ['j', 'n', 's', 'z', 1], - ['z', 's', 's', 'n', 1], - ['j', 'n', 'c', 'n', 1], - ['z', 'n', 's', 'k', 1], - ['z', 'n', 'c', 'k', 2], - ['z', 's', 's', 'k', 2], - ['z', 's', 'c', 'k', 2], - ['j', 'n', 's', 'k', 2], - ['z', 's', 'c', 'z', 3], - ['j', 'n', 's', 'n', 3] -] -``` -Budowanie drzewa decyzyjnego opiera się na podziale gałęzi względem algorytmu CART. Ma ono postać ciągu pytań, na które odpowiedzi determinują kolejne pytania, bądź kończą etap. W wyniku otrzymujemy strukturę drzewa, która w węzłach końcowych nie zawiera już pytań, lecz same odpowiedzi. Dodatkowo wypisuje liczbę zestawów danych pasujących do liścia z zestawu treningowego. -``` -def build_tree(rows): - gain, question = find_best_split(rows) - if gain == 0: - return Leaf(rows) - true_rows, false_rows = partition(rows, question) - true_branch = build_tree(true_rows) - false_branch = build_tree(false_rows) - return Decision_Node(question, true_branch, false_branch) -``` -Znajdowanie najlepszego podziału opiera się głównie na Współczynniku Giniego, który mierzy stopień niejednorodności i dzieli ją przez ilość pozostałych zestawów testowych. -``` -def find_best_split(rows): - best_gain = 0 - best_question = None - current_uncertainty = gini(rows) - n_features = len(rows[0]) - 1 - for col in range(n_features): - values = set([row[col] for row in rows]) - for val in values: - question = Question(col, val) - true_rows, false_rows = partition(rows, question) - if len(true_rows) == 0 or len(false_rows) == 0: - continue - gain = info_gain(true_rows, false_rows, current_uncertainty) - if gain >= best_gain: - best_gain, best_question = gain, question - return best_gain, best_question -``` - -Drzewo powstałe poprzez wykonanie metody print_tree(node,spacing) na zestawie testowym: -``` -Czy kwasowosc == k? ---> True: - Czy cien == s? - --> True: - Czy nawodnienie == n? - --> True: - Czy zyznosc == j? - --> True: - Predict {2: 1} - --> False: - Predict {1: 1} - --> False: - Predict {2: 1} - --> False: - Predict {2: 2} ---> False: - Czy cien == s? - --> True: - Czy zyznosc == j? - --> True: - Czy kwasowosc == n? - --> True: - Predict {3: 1} - --> False: - Predict {1: 1} - --> False: - Predict {1: 3} - --> False: - Czy kwasowosc == n? - --> True: - Predict {1: 1} - --> False: - Predict {3: 1} -``` -#Implementacja w C++: ---- -Komunikacja między pythonem a cpp zachodzi przez pliki dane.txt i decyzje.txt. W pliku dane.txt cpp wypisuje stan całego pola w oddzielonych spacją kolumnach począwszy od indeksu x=1,y=1 aż po x=25,y=25. Decyzje podjęte przez drzewo decyzyjne wypisane w pliku decyzje.txt zawierają symbol rośliny lub pola jakie mają się znajdować na polu (również w całej przestrzeni pola). - -Zestaw testowych danych: -``` -void testSI1() -{ - for (int i = 1; i < 26; i++) - { - for (int j = 1; j < 26; j++) - { - if (j % 3 == 0) - { - pole[i][j][2] = 'z'; //zyzne - pole[i][j][3] = 'n'; //nawodnione - pole[i][j][4] = 'c'; //w cieniu - pole[i][j][5] = 'k'; //kwasne - } - else - { - if (j % 3 == 1) - { - pole[i][j][2] = 'j'; //jalowe - pole[i][j][3] = 'n'; //nawodnione - pole[i][j][4] = 's'; //w sloncu - pole[i][j][5] = 'n'; //neutralne - } - else - { - pole[i][j][2] = 'z'; //zyzne - pole[i][j][3] = 's'; //suche - pole[i][j][4] = 's'; //sloneczne - pole[i][j][5] = 'z'; //zasadowe - } - } - } - } -} -``` - -Funkcja wysyłająca stan pola: -``` -void sendState() -{ - ofstream write("dane.txt"); - for (int i = 1; i < 26; i++) - { - for (int j = 1; j < 26; j++) - { - string a; - a += pole[i][j][2]; - a += ' '; - a += pole[i][j][3]; - a += ' '; - a += pole[i][j][4]; - a += ' '; - a += pole[i][j][5]; - write << a << endl; - } - } - write.close(); -} -``` - -Funkcja kierująca traktorem (decyzja co zasiać): -``` -void reciveState() -{ - ifstream read("decyzje.txt"); - if (read.is_open()) - { - char plant; - int i = 1; - int j = 1; - while (read >> plant) - { - if (j == 25) - { - gogo(1, i+1); - } - else - { - gogo(j+1 , i ); - } - pole[i][j][0] = plant; - if (plant == '.') - { - pole[i][j][1] = '1'; - } - else - { - pole[i][j][1] = '9'; - } - if (j == 25) - { - j = 1; - i += 1; - } - else - { - j += 1; - } - } - } -} +##Jarosław Zbąski – raport z podprojektu +--- + #Wybrana metoda: + --- +Do realizacji podprojektu wykorzystano drzewa decyzyjne wskazujące którą roślinę (jeśli w ogóle) należy posadzić na danym polu. Drzewo decyzję podejmuje na podstawie poszczególnych parametrów gleby: + +-żyzność (‘z’-żyzna, ‘j’-jałowa) + +-nawodnienie (‘n’ - nawodniona, ‘s’ - sucha) + +-nasłonecznienie (‘s’ - w słońcu, ‘c’ – w cieniu) + +-kwasowość gleby (‘k’ – kwasowa, ‘n’ – neutralna, ‘z’ - zasadowa) + + + #Uczenie modelu: + --- +Dane treningowe: +``` +training_data = [ + #zyznosc, nawodnienie, cien, kwasowość, grupa + ['z', 'n', 's', 'z', 1], + ['z', 'n', 's', 'n', 1], + ['j', 'n', 's', 'z', 1], + ['z', 's', 's', 'n', 1], + ['j', 'n', 'c', 'n', 1], + ['z', 'n', 's', 'k', 1], + ['z', 'n', 'c', 'k', 2], + ['z', 's', 's', 'k', 2], + ['z', 's', 'c', 'k', 2], + ['j', 'n', 's', 'k', 2], + ['z', 's', 'c', 'z', 3], + ['j', 'n', 's', 'n', 3] +] +``` +Budowanie drzewa decyzyjnego opiera się na podziale gałęzi względem algorytmu CART. Ma ono postać ciągu pytań, na które odpowiedzi determinują kolejne pytania, bądź kończą etap. W wyniku otrzymujemy strukturę drzewa, która w węzłach końcowych nie zawiera już pytań, lecz same odpowiedzi. Dodatkowo wypisuje liczbę zestawów danych pasujących do liścia z zestawu treningowego. +``` +def build_tree(rows): + gain, question = find_best_split(rows) + if gain == 0: + return Leaf(rows) + true_rows, false_rows = partition(rows, question) + true_branch = build_tree(true_rows) + false_branch = build_tree(false_rows) + return Decision_Node(question, true_branch, false_branch) +``` +Znajdowanie najlepszego podziału opiera się głównie na Współczynniku Giniego, który mierzy stopień niejednorodności i dzieli ją przez ilość pozostałych zestawów testowych. +``` +def find_best_split(rows): + best_gain = 0 + best_question = None + current_uncertainty = gini(rows) + n_features = len(rows[0]) - 1 + for col in range(n_features): + values = set([row[col] for row in rows]) + for val in values: + question = Question(col, val) + true_rows, false_rows = partition(rows, question) + if len(true_rows) == 0 or len(false_rows) == 0: + continue + gain = info_gain(true_rows, false_rows, current_uncertainty) + if gain >= best_gain: + best_gain, best_question = gain, question + return best_gain, best_question +``` + +Drzewo powstałe poprzez wykonanie metody print_tree(node,spacing) na zestawie testowym: +``` +Czy kwasowosc == k? +--> True: + Czy cien == s? + --> True: + Czy nawodnienie == n? + --> True: + Czy zyznosc == j? + --> True: + Predict {2: 1} + --> False: + Predict {1: 1} + --> False: + Predict {2: 1} + --> False: + Predict {2: 2} +--> False: + Czy cien == s? + --> True: + Czy zyznosc == j? + --> True: + Czy kwasowosc == n? + --> True: + Predict {3: 1} + --> False: + Predict {1: 1} + --> False: + Predict {1: 3} + --> False: + Czy kwasowosc == n? + --> True: + Predict {1: 1} + --> False: + Predict {3: 1} +``` +#Implementacja w C++: +--- +Komunikacja między pythonem a cpp zachodzi przez pliki dane.txt i decyzje.txt. W pliku dane.txt cpp wypisuje stan całego pola w oddzielonych spacją kolumnach począwszy od indeksu x=1,y=1 aż po x=25,y=25. Decyzje podjęte przez drzewo decyzyjne wypisane w pliku decyzje.txt zawierają symbol rośliny lub pola jakie mają się znajdować na polu (również w całej przestrzeni pola). + +Zestaw testowych danych: +``` +void testSI1() +{ + for (int i = 1; i < 26; i++) + { + for (int j = 1; j < 26; j++) + { + if (j % 3 == 0) + { + pole[i][j][2] = 'z'; //zyzne + pole[i][j][3] = 'n'; //nawodnione + pole[i][j][4] = 'c'; //w cieniu + pole[i][j][5] = 'k'; //kwasne + } + else + { + if (j % 3 == 1) + { + pole[i][j][2] = 'j'; //jalowe + pole[i][j][3] = 'n'; //nawodnione + pole[i][j][4] = 's'; //w sloncu + pole[i][j][5] = 'n'; //neutralne + } + else + { + pole[i][j][2] = 'z'; //zyzne + pole[i][j][3] = 's'; //suche + pole[i][j][4] = 's'; //sloneczne + pole[i][j][5] = 'z'; //zasadowe + } + } + } + } +} +``` + +Funkcja wysyłająca stan pola: +``` +void sendState() +{ + ofstream write("dane.txt"); + for (int i = 1; i < 26; i++) + { + for (int j = 1; j < 26; j++) + { + string a; + a += pole[i][j][2]; + a += ' '; + a += pole[i][j][3]; + a += ' '; + a += pole[i][j][4]; + a += ' '; + a += pole[i][j][5]; + write << a << endl; + } + } + write.close(); +} +``` + +Funkcja kierująca traktorem (decyzja co zasiać): +``` +void reciveState() +{ + ifstream read("decyzje.txt"); + if (read.is_open()) + { + char plant; + int i = 1; + int j = 1; + while (read >> plant) + { + if (j == 25) + { + gogo(1, i+1); + } + else + { + gogo(j+1 , i ); + } + pole[i][j][0] = plant; + if (plant == '.') + { + pole[i][j][1] = '1'; + } + else + { + pole[i][j][1] = '9'; + } + if (j == 25) + { + j = 1; + i += 1; + } + else + { + j += 1; + } + } + } +} ``` \ No newline at end of file -- 2.20.1 From 9bdd4c4bce59c904607d28e4e2afa49be2997030 Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?Jaros=C5=82aw=20Zb=C4=85ski?= Date: Wed, 20 May 2020 07:06:48 +0000 Subject: [PATCH 3/5] Zaktualizuj 'RaportJaroslawZbaski.md' --- RaportJaroslawZbaski.md | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/RaportJaroslawZbaski.md b/RaportJaroslawZbaski.md index fea348d..8e8c983 100644 --- a/RaportJaroslawZbaski.md +++ b/RaportJaroslawZbaski.md @@ -44,7 +44,7 @@ def build_tree(rows): false_branch = build_tree(false_rows) return Decision_Node(question, true_branch, false_branch) ``` -Znajdowanie najlepszego podziału opiera się głównie na Współczynniku Giniego, który mierzy stopień niejednorodności i dzieli ją przez ilość pozostałych zestawów testowych. +Znajdowanie najlepszego podziału opiera się głównie na Współczynniku Giniego, który mierzy stopień niejednorodności i dzieli ją przez ilość pozostałych zestawów testowych (entropia). ``` def find_best_split(rows): best_gain = 0 -- 2.20.1 From 6b8bbad1176a5138df13cbd918d4b0180a770ad2 Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?Jaros=C5=82aw=20Zb=C4=85ski?= Date: Wed, 20 May 2020 07:09:17 +0000 Subject: [PATCH 4/5] Zaktualizuj 'RaportJaroslawZbaski.md' --- RaportJaroslawZbaski.md | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/RaportJaroslawZbaski.md b/RaportJaroslawZbaski.md index 8e8c983..cf05106 100644 --- a/RaportJaroslawZbaski.md +++ b/RaportJaroslawZbaski.md @@ -33,7 +33,7 @@ training_data = [ ['j', 'n', 's', 'n', 3] ] ``` -Budowanie drzewa decyzyjnego opiera się na podziale gałęzi względem algorytmu CART. Ma ono postać ciągu pytań, na które odpowiedzi determinują kolejne pytania, bądź kończą etap. W wyniku otrzymujemy strukturę drzewa, która w węzłach końcowych nie zawiera już pytań, lecz same odpowiedzi. Dodatkowo wypisuje liczbę zestawów danych pasujących do liścia z zestawu treningowego. +Budowanie drzewa decyzyjnego opiera się na podziale gałęzi względem algorytmu CART. Ma ono postać ciągu pytań, na które odpowiedzi determinują kolejne pytania, bądź kończą etap. W wyniku otrzymujemy strukturę drzewa, która w węzłach końcowych nie zawiera już pytań, lecz same odpowiedzi. Dodatkowo wypisuje zestaw danych pasujących do liścia, z zestawu treningowego. ``` def build_tree(rows): gain, question = find_best_split(rows) -- 2.20.1 From 0611ae479bbe3a9c48dbf89f229300b610721c53 Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?Jaros=C5=82aw=20Zb=C4=85ski?= Date: Wed, 20 May 2020 07:11:32 +0000 Subject: [PATCH 5/5] Zaktualizuj 'RaportJaroslawZbaski.md' --- RaportJaroslawZbaski.md | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/RaportJaroslawZbaski.md b/RaportJaroslawZbaski.md index cf05106..a909057 100644 --- a/RaportJaroslawZbaski.md +++ b/RaportJaroslawZbaski.md @@ -44,7 +44,7 @@ def build_tree(rows): false_branch = build_tree(false_rows) return Decision_Node(question, true_branch, false_branch) ``` -Znajdowanie najlepszego podziału opiera się głównie na Współczynniku Giniego, który mierzy stopień niejednorodności i dzieli ją przez ilość pozostałych zestawów testowych (entropia). +Znajdowanie najlepszego podziału opiera się głównie na Współczynniku Giniego, który mierzy stopień niejednorodności i dzieli ją przez ilość pozostałych zestawów testowych (entropia), co daje nam przyrost informacji. ``` def find_best_split(rows): best_gain = 0 -- 2.20.1