MargePierwszy #2

Closed
s444513 wants to merge 5 commits from JaroslawZbaskiDrzewaDecyzyjne into master
5 changed files with 1752 additions and 27 deletions
Showing only changes of commit 84c416cc75 - Show all commits

160
Main.cpp
View File

@ -7,6 +7,7 @@
#include<set> #include<set>
#include<math.h> #include<math.h>
#include<stack> #include<stack>
#include<fstream>
using namespace std; using namespace std;
@ -21,7 +22,7 @@ struct cell
double f, g, h; double f, g, h;
}; };
char pole[27][27][2]; char pole[27][27][6];
int pozycjaTraktoraX = 1, pozycjaTraktoraY = 1; int pozycjaTraktoraX = 1, pozycjaTraktoraY = 1;
char currentWay = 'S'; char currentWay = 'S';
@ -130,6 +131,10 @@ void updatePola()
{ {
color("purple", "dark_yellow"); color("purple", "dark_yellow");
}break; }break;
case 'Z':
{
color("cyan", "dark_yellow");
}break;
case 'T': case 'T':
{ {
color("red", "dark_yellow"); color("red", "dark_yellow");
@ -161,33 +166,33 @@ void correctMovement(char wantedWay)
{ {
switch (currentWay) switch (currentWay)
{ {
case 'N': case 'N':
{ {
if (wantedWay == 'S') if (wantedWay == 'S')
currentWay = wantedWay; currentWay = wantedWay;
else else
currentWay = 'W'; currentWay = 'W';
}break; }break;
case 'S': case 'S':
{ {
if (wantedWay == 'N') if (wantedWay == 'N')
currentWay = wantedWay; currentWay = wantedWay;
else else
currentWay = 'W'; currentWay = 'W';
}break; }break;
case 'W': case 'W':
{ {
if (wantedWay == 'E') if (wantedWay == 'E')
currentWay = wantedWay; currentWay = wantedWay;
else else
currentWay = 'N'; currentWay = 'N';
}break; }break;
case 'E': case 'E':
{ {
if (wantedWay == 'W') if (wantedWay == 'W')
currentWay = wantedWay; currentWay = wantedWay;
else else
currentWay = 'N'; currentWay = 'N';
}break; }break;
} }
} }
@ -501,7 +506,7 @@ void test1()
{ {
pole[1][3][0] = 'B'; pole[1][3][0] = 'B';
pole[1][3][1] = '9'; pole[1][3][1] = '9';
pole[3][1][0] = 'B'; pole[3][1][0] = 'Z';
pole[3][1][1] = '9'; pole[3][1][1] = '9';
} }
void test2() void test2()
@ -518,15 +523,116 @@ void test2()
updatePola(); updatePola();
} }
void testSI1()
{
for (int i = 1; i < 26; i++)
{
for (int j = 1; j < 26; j++)
{
if (j % 3 == 0)
{
pole[i][j][2] = 'z'; //zyzne
pole[i][j][3] = 'n'; //nawodnione
pole[i][j][4] = 'c'; //w cieniu
pole[i][j][5] = 'k'; //kwasne
}
else
{
if (j % 3 == 1)
{
pole[i][j][2] = 'j'; //jalowe
pole[i][j][3] = 'n'; //nawodnione
pole[i][j][4] = 's'; //w sloncu
pole[i][j][5] = 'n'; //neutralne
}
else
{
pole[i][j][2] = 'z'; //zyzne
pole[i][j][3] = 's'; //suche
pole[i][j][4] = 's'; //sloneczne
pole[i][j][5] = 'z'; //zasadowe
}
}
}
}
}
void sendState()
{
ofstream write("dane.txt");
for (int i = 1; i < 26; i++)
{
for (int j = 1; j < 26; j++)
{
string a;
a += pole[i][j][2];
a += ' ';
a += pole[i][j][3];
a += ' ';
a += pole[i][j][4];
a += ' ';
a += pole[i][j][5];
write << a << endl;
}
}
write.close();
}
void reciveState()
{
ifstream read("decyzje.txt");
if (read.is_open())
{
char plant;
int i = 1;
int j = 1;
while (read >> plant)
{
if (j == 25)
{
gogo(1, i+1);
}
else
{
gogo(j+1 , i );
}
pole[i][j][0] = plant;
if (plant == '.')
{
pole[i][j][1] = '1';
}
else
{
pole[i][j][1] = '9';
}
if (j == 25)
{
j = 1;
i += 1;
}
else
{
j += 1;
}
}
}
}
void start1() void start1()
{ {
int goalX = 3, goalY = 4; int goalX = 3, goalY = 4;
test1(); test1();
testSI1();
pole[1][1][0] = 'T'; pole[1][1][0] = 'T';
pole[1][1][1] = '1'; pole[1][1][1] = '1';
pole[goalY][goalX][0] = 'G'; pole[goalY][goalX][0] = 'G';
pole[goalY][goalX][1] = '9'; pole[goalY][goalX][1] = '9';
gogo(goalX, goalY); gogo(goalX, goalY);
gogo(goalX - 1, goalY);
pole[goalY][goalX][0] = 'Z';
pole[goalY][goalX][1] = '9';
updatePola();
//sendState(); //trzeba ręcznie zmieniać między wysyłaniem stanu a pobieraniem stanu pola
reciveState();
} }
void start2() void start2()
{ {
@ -581,7 +687,7 @@ int main()
updatePola(); updatePola();
start3(); // testy start 1-3 start1(); // testy start 1-3
//---------start---------// //---------start---------//
bool traktorDziala = true; bool traktorDziala = true;

204
RaportJaroslawZbaski.md Normal file
View File

@ -0,0 +1,204 @@
##Jarosław Zbąski raport z podprojektu
---
#Wybrana metoda:
---
Do realizacji podprojektu wykorzystano drzewa decyzyjne wskazujące którą roślinę (jeśli w ogóle) należy posadzić na danym polu. Drzewo decyzję podejmuje na podstawie poszczególnych parametrów gleby:
-żyzność (z-żyzna, j-jałowa)
-nawodnienie (n - nawodniona, s - sucha)
-nasłonecznienie (s - w słońcu, c w cieniu)
-kwasowość gleby (k kwasowa, n neutralna, z - zasadowa)
#Uczenie modelu:
Dane treningowe:
```
training_data = [
#zyznosc, nawodnienie, cien, kwasowość, grupa
['z', 'n', 's', 'z', 1],
['z', 'n', 's', 'n', 1],
['j', 'n', 's', 'z', 1],
['z', 's', 's', 'n', 1],
['j', 'n', 'c', 'n', 1],
['z', 'n', 's', 'k', 1],
['z', 'n', 'c', 'k', 2],
['z', 's', 's', 'k', 2],
['z', 's', 'c', 'k', 2],
['j', 'n', 's', 'k', 2],
['z', 's', 'c', 'z', 3],
['j', 'n', 's', 'n', 3]
]
```
Budowanie drzewa decyzyjnego opiera się na podziale gałęzi względem algorytmu CART. Ma ono postać ciągu pytań, na które odpowiedzi determinują kolejne pytania, bądź kończą etap. W wyniku otrzymujemy strukturę drzewa, która w węzłach końcowych nie zawiera już pytań, lecz same odpowiedzi. Dodatkowo wypisuje liczbę zestawów danych pasujących do liścia z zestawu treningowego.
```
def build_tree(rows):
gain, question = find_best_split(rows)
if gain == 0:
return Leaf(rows)
true_rows, false_rows = partition(rows, question)
true_branch = build_tree(true_rows)
false_branch = build_tree(false_rows)
return Decision_Node(question, true_branch, false_branch)
```
Znajdowanie najlepszego podziału opiera się głównie na Współczynniku Giniego, który mierzy stopień niejednorodności i dzieli ją przez ilość pozostałych zestawów testowych.
```
def find_best_split(rows):
best_gain = 0
best_question = None
current_uncertainty = gini(rows)
n_features = len(rows[0]) - 1
for col in range(n_features):
values = set([row[col] for row in rows])
for val in values:
question = Question(col, val)
true_rows, false_rows = partition(rows, question)
if len(true_rows) == 0 or len(false_rows) == 0:
continue
gain = info_gain(true_rows, false_rows, current_uncertainty)
if gain >= best_gain:
best_gain, best_question = gain, question
return best_gain, best_question
```
Drzewo powstałe poprzez wykonanie metody print_tree(node,spacing) na zestawie testowym:
```
Czy kwasowosc == k?
--> True:
Czy cien == s?
--> True:
Czy nawodnienie == n?
--> True:
Czy zyznosc == j?
--> True:
Predict {2: 1}
--> False:
Predict {1: 1}
--> False:
Predict {2: 1}
--> False:
Predict {2: 2}
--> False:
Czy cien == s?
--> True:
Czy zyznosc == j?
--> True:
Czy kwasowosc == n?
--> True:
Predict {3: 1}
--> False:
Predict {1: 1}
--> False:
Predict {1: 3}
--> False:
Czy kwasowosc == n?
--> True:
Predict {1: 1}
--> False:
Predict {3: 1}
```
#Implementacja w C++:
---
Komunikacja między pythonem a cpp zachodzi przez pliki dane.txt i decyzje.txt. W pliku dane.txt cpp wypisuje stan całego pola w oddzielonych spacją kolumnach począwszy od indeksu x=1,y=1 aż po x=25,y=25. Decyzje podjęte przez drzewo decyzyjne wypisane w pliku decyzje.txt zawierają symbol rośliny lub pola jakie mają się znajdować na polu (również w całej przestrzeni pola).
Zestaw testowych danych:
```
void testSI1()
{
for (int i = 1; i < 26; i++)
{
for (int j = 1; j < 26; j++)
{
if (j % 3 == 0)
{
pole[i][j][2] = 'z'; //zyzne
pole[i][j][3] = 'n'; //nawodnione
pole[i][j][4] = 'c'; //w cieniu
pole[i][j][5] = 'k'; //kwasne
}
else
{
if (j % 3 == 1)
{
pole[i][j][2] = 'j'; //jalowe
pole[i][j][3] = 'n'; //nawodnione
pole[i][j][4] = 's'; //w sloncu
pole[i][j][5] = 'n'; //neutralne
}
else
{
pole[i][j][2] = 'z'; //zyzne
pole[i][j][3] = 's'; //suche
pole[i][j][4] = 's'; //sloneczne
pole[i][j][5] = 'z'; //zasadowe
}
}
}
}
}
```
Funkcja wysyłająca stan pola:
```
void sendState()
{
ofstream write("dane.txt");
for (int i = 1; i < 26; i++)
{
for (int j = 1; j < 26; j++)
{
string a;
a += pole[i][j][2];
a += ' ';
a += pole[i][j][3];
a += ' ';
a += pole[i][j][4];
a += ' ';
a += pole[i][j][5];
write << a << endl;
}
}
write.close();
}
```
Funkcja kierująca traktorem (decyzja co zasiać):
```
void reciveState()
{
ifstream read("decyzje.txt");
if (read.is_open())
{
char plant;
int i = 1;
int j = 1;
while (read >> plant)
{
if (j == 25)
{
gogo(1, i+1);
}
else
{
gogo(j+1 , i );
}
pole[i][j][0] = plant;
if (plant == '.')
{
pole[i][j][1] = '1';
}
else
{
pole[i][j][1] = '9';
}
if (j == 25)
{
j = 1;
i += 1;
}
else
{
j += 1;
}
}
}
}
```

625
dane.txt Normal file
View File

@ -0,0 +1,625 @@
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n
z s s z
z n c k
j n s n

625
decyzje.txt Normal file
View File

@ -0,0 +1,625 @@
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.
B
Z
.

165
drzewaDecyzyjne.py Normal file
View File

@ -0,0 +1,165 @@
training_data = [
#zyznosc, nawodnienie, cien, kwasowosc
['z', 'n', 's', 'z', 1],
['z', 'n', 's', 'n', 1],
['j', 'n', 's', 'z', 1],
['z', 's', 's', 'n', 1],
['j', 'n', 'c', 'n', 1],
['z', 'n', 's', 'k', 1],
['z', 'n', 'c', 'k', 2],
['z', 's', 's', 'k', 2],
['z', 's', 'c', 'k', 2],
['j', 'n', 's', 'k', 2],
['z', 's', 'c', 'z', 3],
['j', 'n', 's', 'n', 3]
]
header = ["zyznosc", "nawodnienie", "cien", "kwasowosc", "wybor"]
def class_counts(rows):
counts = {}
for row in rows:
label = row[-1]
if label not in counts:
counts[label] = 0
counts[label] += 1
return counts
def is_numeric(value):
return isinstance(value, int) or isinstance(value, float)
class Question:
def __init__(self, column, value):
self.column = column
self.value = value
def match(self, example):
val = example[self.column]
if is_numeric(val):
return val >= self.value
else:
return val == self.value
def __repr__(self):
condition = "=="
if is_numeric(self.value):
condition = ">="
return "Czy %s %s %s?" % (
header[self.column], condition, str(self.value))
def partition(rows, question):
true_rows, false_rows = [], []
for row in rows:
if question.match(row):
true_rows.append(row)
else:
false_rows.append(row)
return true_rows, false_rows
def gini(rows):
counts = class_counts(rows)
impurity = 1
for lbl in counts:
prob_of_lbl = counts[lbl] / float(len(rows))
impurity -= prob_of_lbl**2
return impurity
def info_gain(left, right, current_uncertainty):
p = float(len(left)) / (len(left) + len(right))
return current_uncertainty - p * gini(left) - (1 - p) * gini(right)
def find_best_split(rows):
best_gain = 0
best_question = None
current_uncertainty = gini(rows)
n_features = len(rows[0]) - 1
for col in range(n_features):
values = set([row[col] for row in rows])
for val in values:
question = Question(col, val)
true_rows, false_rows = partition(rows, question)
if len(true_rows) == 0 or len(false_rows) == 0:
continue
gain = info_gain(true_rows, false_rows, current_uncertainty)
if gain >= best_gain:
best_gain, best_question = gain, question
return best_gain, best_question
class Leaf:
def __init__(self, rows):
self.predictions = class_counts(rows)
class Decision_Node:
def __init__(self,
question,
true_branch,
false_branch):
self.question = question
self.true_branch = true_branch
self.false_branch = false_branch
def build_tree(rows):
gain, question = find_best_split(rows)
if gain == 0:
return Leaf(rows)
true_rows, false_rows = partition(rows, question)
true_branch = build_tree(true_rows)
false_branch = build_tree(false_rows)
return Decision_Node(question, true_branch, false_branch)
def print_tree(node, spacing=""):
if isinstance(node, Leaf):
print (spacing + "Predict", node.predictions)
return
print (spacing + str(node.question))
print (spacing + '--> True:')
print_tree(node.true_branch, spacing + " ")
print (spacing + '--> False:')
print_tree(node.false_branch, spacing + " ")
my_tree = build_tree(training_data)
print_tree(my_tree)
def classify(row, node):
if isinstance(node, Leaf):
return node.predictions
if node.question.match(row):
return classify(row, node.true_branch)
else:
return classify(row, node.false_branch)
def print_leaf(counts):
total = sum(counts.values()) * 1.0
probs = {}
for lbl in counts.keys():
probs[lbl] = str(int(counts[lbl] / total * 100)) + "%"
return probs
with open( 'dane.txt', "r" ) as f:
testing_data = [ line.split() for line in f ]
file = open("decyzje.txt", "w")
file.write("")
file.close()
for row in testing_data:
pom = print_leaf(classify(row, my_tree))
f = open("decyzje.txt", "a")
if pom == {1: '100%'}:
f.write("B\n")
if pom == {2: '100%'}:
f.write("Z\n")
if pom == {3: '100%'}:
f.write(".\n")
f.close()