commit_natalia3
This commit is contained in:
parent
adce2ac99f
commit
c0e4e47232
@ -12,7 +12,10 @@ Tematem realizowanego projektu indywidualnego jest stworzenie sztucznej intelige
|
|||||||
- pandas
|
- pandas
|
||||||
- pydotplus
|
- pydotplus
|
||||||
- StringIO
|
- StringIO
|
||||||
|
|
||||||
## Realizacja projektu ##
|
## Realizacja projektu ##
|
||||||
|
Na początku dane są pobierane z pliku "Nowy.csv" gdzie zostały przygotowane 121 wiersze o kolumnach z kolejno podanymi nazwami. Następnie model zostal podzielony na cechy i etykietę ['number'], która oznacza polecane danie.
|
||||||
|
|
||||||
```python
|
```python
|
||||||
col_names = ['age', 'sex', 'fat', 'fiber', 'spicy', 'number']
|
col_names = ['age', 'sex', 'fat', 'fiber', 'spicy', 'number']
|
||||||
model_tree = pd.read_csv("Nowy.csv", header=None, names=col_names)
|
model_tree = pd.read_csv("Nowy.csv", header=None, names=col_names)
|
||||||
@ -21,8 +24,8 @@ Tematem realizowanego projektu indywidualnego jest stworzenie sztucznej intelige
|
|||||||
X = model_tree[feature_cols]
|
X = model_tree[feature_cols]
|
||||||
y = model_tree.number
|
y = model_tree.number
|
||||||
```
|
```
|
||||||
Na początku dane są pobierane z pliku "Nowy.csv" gdzie zostały przygotowane 121 wiersze o kolumnach z kolejno podanymi nazwami. Następnie model zostal podzielony na cechy i etykietę ['number'], która oznacza polecane danie.
|
|
||||||
##### Dane: #####
|
#### Dane: ####
|
||||||
Aby utworzyć model stworzyłam 121 wierszy z 6 kolejnych liczb oznaczających:
|
Aby utworzyć model stworzyłam 121 wierszy z 6 kolejnych liczb oznaczających:
|
||||||
|
|
||||||
- wiek klienta (7 - 80);
|
- wiek klienta (7 - 80);
|
||||||
@ -41,14 +44,13 @@ Aby utworzyć model stworzyłam 121 wierszy z 6 kolejnych liczb oznaczających:
|
|||||||
|
|
||||||
Poszczególne liczby są oddzielone przecinkami, a wiersze znakiem nowej linii, plik z rozszerzeniem .csv.
|
Poszczególne liczby są oddzielone przecinkami, a wiersze znakiem nowej linii, plik z rozszerzeniem .csv.
|
||||||
|
|
||||||
#### Proces uczenia: ####
|
#### Drzewa decyzyjne: ####
|
||||||
|
|
||||||
Następnie następuje podział danych na zestaw treningowy i testowy. Zestaw treningowy to 70% danych, testowy 30%. X to zestaw cech, Y zestaw wyników - tutaj etykieta "number".
|
Następnie następuje podział danych na zestaw treningowy i testowy. Zestaw treningowy to 70% danych, testowy 30%. X to zestaw cech, Y zestaw wyników - tutaj etykieta "number".
|
||||||
|
```python
|
||||||
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3,
|
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3,
|
||||||
random_state=1)
|
random_state=1)
|
||||||
|
```
|
||||||
##### Drzewa decyzyjne: #####
|
|
||||||
|
|
||||||
Do stworzenia modelu drzew została wykorzystana funkcja **DecisionTreeClassifier.** Pierwsze drzewo przyjmuje jako kryterium indeks Gini (domyślny), drugie drzewo entropię.
|
Do stworzenia modelu drzew została wykorzystana funkcja **DecisionTreeClassifier.** Pierwsze drzewo przyjmuje jako kryterium indeks Gini (domyślny), drugie drzewo entropię.
|
||||||
```python
|
```python
|
||||||
|
Loading…
Reference in New Issue
Block a user