commit_natalia3

This commit is contained in:
Natalia 2020-05-24 19:33:50 +02:00
parent adce2ac99f
commit c0e4e47232

View File

@ -12,7 +12,10 @@ Tematem realizowanego projektu indywidualnego jest stworzenie sztucznej intelige
- pandas - pandas
- pydotplus - pydotplus
- StringIO - StringIO
## Realizacja projektu ## ## Realizacja projektu ##
Na początku dane są pobierane z pliku "Nowy.csv" gdzie zostały przygotowane 121 wiersze o kolumnach z kolejno podanymi nazwami. Następnie model zostal podzielony na cechy i etykietę ['number'], która oznacza polecane danie.
```python ```python
col_names = ['age', 'sex', 'fat', 'fiber', 'spicy', 'number'] col_names = ['age', 'sex', 'fat', 'fiber', 'spicy', 'number']
model_tree = pd.read_csv("Nowy.csv", header=None, names=col_names) model_tree = pd.read_csv("Nowy.csv", header=None, names=col_names)
@ -21,8 +24,8 @@ Tematem realizowanego projektu indywidualnego jest stworzenie sztucznej intelige
X = model_tree[feature_cols] X = model_tree[feature_cols]
y = model_tree.number y = model_tree.number
``` ```
Na początku dane są pobierane z pliku "Nowy.csv" gdzie zostały przygotowane 121 wiersze o kolumnach z kolejno podanymi nazwami. Następnie model zostal podzielony na cechy i etykietę ['number'], która oznacza polecane danie.
##### Dane: ##### #### Dane: ####
Aby utworzyć model stworzyłam 121 wierszy z 6 kolejnych liczb oznaczających: Aby utworzyć model stworzyłam 121 wierszy z 6 kolejnych liczb oznaczających:
- wiek klienta (7 - 80); - wiek klienta (7 - 80);
@ -41,14 +44,13 @@ Aby utworzyć model stworzyłam 121 wierszy z 6 kolejnych liczb oznaczających:
Poszczególne liczby są oddzielone przecinkami, a wiersze znakiem nowej linii, plik z rozszerzeniem .csv. Poszczególne liczby są oddzielone przecinkami, a wiersze znakiem nowej linii, plik z rozszerzeniem .csv.
#### Proces uczenia: #### #### Drzewa decyzyjne: ####
Następnie następuje podział danych na zestaw treningowy i testowy. Zestaw treningowy to 70% danych, testowy 30%. X to zestaw cech, Y zestaw wyników - tutaj etykieta "number". Następnie następuje podział danych na zestaw treningowy i testowy. Zestaw treningowy to 70% danych, testowy 30%. X to zestaw cech, Y zestaw wyników - tutaj etykieta "number".
```python
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3,
random_state=1) random_state=1)
```
##### Drzewa decyzyjne: #####
Do stworzenia modelu drzew została wykorzystana funkcja **DecisionTreeClassifier.** Pierwsze drzewo przyjmuje jako kryterium indeks Gini (domyślny), drugie drzewo entropię. Do stworzenia modelu drzew została wykorzystana funkcja **DecisionTreeClassifier.** Pierwsze drzewo przyjmuje jako kryterium indeks Gini (domyślny), drugie drzewo entropię.
```python ```python