34 lines
861 B
Python
34 lines
861 B
Python
import pandas as pd
|
|
from sklearn import tree
|
|
import joblib
|
|
|
|
df = pd.read_csv('data.csv')
|
|
print(df.head())
|
|
target = df['Y']
|
|
X = df.drop(columns=['Y'])
|
|
clf = tree.DecisionTreeClassifier()
|
|
clf.fit(X, target)
|
|
|
|
|
|
df_test = pd.read_csv('test.csv')
|
|
print(df_test.head())
|
|
target_test = df_test['Y']
|
|
X_test = df_test.drop(columns=['Y'])
|
|
pred = clf.predict(X_test)
|
|
print(pred)
|
|
|
|
print('Jedynki: ', len(df[df['Y'] == 1]))
|
|
print('Zera: ', len(df[df['Y'] == 0]))
|
|
|
|
joblib.dump(clf, 'decisionTreeClassifier')
|
|
|
|
|
|
#Legenda
|
|
#czy wywiezc zmieci 1 tak 0 nie
|
|
#typ smiecia 0-zmieszane 1-bio 2-szklo 3-plastik 4-papier
|
|
#pora roku 1-wiosna 2-lato 3-jesien 4-zima
|
|
#zwierze 1 jest 0 nie ma
|
|
#smieciarka pełna 1-pełna 0-nie pełna
|
|
#śmietnik pełny 0.XX
|
|
#czas smieci liczba to ilosc dni
|
|
#w pracy 0-zmieszane 1-bio 2-szklo 3-plastik 4-papier 5-wolne |