diff --git a/Raports/SVM.md b/Raports/SVM.md new file mode 100644 index 0000000..c9732f1 --- /dev/null +++ b/Raports/SVM.md @@ -0,0 +1,89 @@ +--- + +# SVM raport + +##### Konrad Pierzyński + +###### Śmieciarz + +12.06.2019 + +--- + +**SVM** - **S**upport-**V**ector **M**achine - zestaw metod uczenia stosowanych głównie do klasyfikacji, której nauka ma na celu wyznaczenie płaszczyzn rozdzielających dane wejściowe na klasy. + +![5d00b5469956838867](https://i.loli.net/2019/06/12/5d00b5469956838867.png) + +--- + +### Przygotowanie danych + +Dane uczące zostały wygenerowane w następujący sposób: + ++ Program generuje losową mapę o określonych wymiarach + ++ Uruchamiany jest jeden z algorytmów (*BestFirstSearch*), który generuje listę ruchów. + ++ Do zestawu uczącego dopisywana jest para składająca się na ruch i otoczenie gracza. + + - Ruch odpowiada kierunkom: góra, prawo, dół, lewo i akcji zebrania/oddania śmieci - odpowienio liczbowo 1, 2, 3, 4, 99 + + - Otocznie to tablica dwuwymiarowa 7x7, gdzie element środkowy to pozycja gracza. Tablica ta następnie spłaszczana jest do tablicy jednowymiarowej + + - Każdy 'domek', na którym została wykonana już akcja zebrania i jest opróżniony, widoczny jest na mapie tak samo jak element otoczenia, z którym gracz nie może wejść w żadną interakcję (stanąć, zebrać) + + - Jeśli siatka 7x7 wykracza swoim zakresem za mapę, siatka uzupełniana jest przez trawę, czyli obiekt, z którym gracz nie wchodzi w interakcję + ++ Po przejściu całej mapy algorytmem i zebraniu danych proces jest powtarzany tak długo, by zgromadzić około tysiąc rozwiązanych map + +Pojedynczy zestaw danych jest zapisywany jako json postaci: + +```json +{ + "maps": [ + [Int, Int, ...], + [Int, Int, ...], + ... + ], + "moves": + [ + Int, Int, ... + ] +} +``` + +I dopisywany do głównej struktury: + +```json +{ + "moveset": [ + Zestaw, Zestaw, ... + ] +} +``` + +--- + +### Uczenie + +Do przeprowadzenia procesu uczenia dane uczące zostały podzielone na dwie listy: + +- Pierwsza lista X zawiera wszystkie mapy częściowe (otoczenia) + + ```X = [ [Int, Int, ...], [Int, Int, ...], ... ]``` + +- Druga lista y zawiera odpowiadające mapom ruchy (1,2,3,4,99), które wykonał algorytm (*BestFirstSearch*) na danych otoczeniach. + + ```y = [ Int, Int, ... ]``` + +Wyżej wymienione dwie listy zostały podane jako argument metodzie ```fit(X,y)```, która odpowiada za uczenie się SVM. Natomiast utworzenie samego obiektu polega na zaimportowaniu biblioteki *scikit-learn*: +```from sklearn import svm``` +a następnie już same utworzenia obiektu svm: +```clf = svm.SVC(gamma='scale')``` +Wyuczony obiekt jest zapisywany do pliku, dzięki modułowi ```pickle```, aby nie przeprowadzać procesu uczenia za każdym uruchomieniem programu. + +--- + +### Wykonywanie ruchów + +Do przewidywania ruchów wystarczy użyć metody ```predict([ [otoczenie] ])``` , które przyjmuje mapę częściową, a jej wynik jest akcją, którą powinien wykonać gracz. Wynik metody przekazywany jest graczowi, który wykonuje ruch. diff --git a/Raports/TREE.md b/Raports/TREE.md new file mode 100644 index 0000000..4dc59ff --- /dev/null +++ b/Raports/TREE.md @@ -0,0 +1,92 @@ +# Sztuczna Inteligencja 2019 - Raport Indywidualny + +**Czas trwania opisywanych prac:** 09.05.2019 - 11.06.2019 + +**Autor:** Michał Starski + +**Wybrany temat:** Inteligentna śmieciarka + +**Link do repozytorium projektu:** https://git.wmi.amu.edu.pl/s440556/SZI2019SmieciarzWmi + +## Wybrany algorytm uczenia - drzewa decyzyjne + +### Przygotowane dane + +Aby zapewnić smieciarce jak najlepszy wynik, do przygotowania danych do uczenia wybrałem algorytm szukania najkrótszej ścieżki, który dawał najlepsze wyniki podczas projektu grupowego - **BestFS**. + +Podczas każdego jednorazowego przebiegu algorytmu BestFS patrzyłem na to jaki krok śmieciarka wykonuje w danej sytuacji, a następnie dane kroki zapisywałem do pliku w formacie json, tworząc próbki do późniejszej nauki. + +Przykładowa próbka w formacie json: + +```json +{ + "moveset": [ + { + "maps": [[1, 1, 3, 4, 2, 2, 2, 2, 1], [2, 1, 1, 3, 1, 4, 1, 1, 1]], + "moves": [1, 2] + } + ] +} +``` + +`moveset` to tablica wszystkich próbek wykorzystywanych do nauki. +Każdy element tablicy to obiekt posiadający dwa pola: +`maps` - otoczenie śmieciarki w danym kroku, +`moves` - ruch śmieciarki przy danym otoczeniu + +W powyższym przykładzie dla czytelności, zostały przedstawione otoczenia 3x3 wokół śmieciarki. W implementacji obszar ten został powiększony do 7x7 w celu poprawienia dokładności algorytmu. + +#### Maps + +Spłaszczona tablicę dwuwymiarową przedstawiająca otoczenie śmieciarki w konkretnym momencie działania algorytmu. Każda z cyfr przedstawia inny obiekt na mapie: + +- 1 - Trawa (Grass) +- 2 - Droga (Road) +- 3 - Wysypisko (Dump) +- 4 - Dom (House) + +Dla powyższego przykładu pierwsza sytuacja (`moveset[0].maps[0]`) przedstawia następujące otoczenie na mapie + +``` +G G D +H R R +R R G +``` + +#### Moves + +Tablica ruchów śmieciarki. i-ty ruch w tablicy odpowiada i-temu otoczeniu. Wyróżnimay 5 różnych ruchów agenta: + +- 1 - Lewo +- 2 - Prawo +- 3 - Dół +- 4 - Góra +- 99 - Zbierz śmieci + +Tak więc dla powyższego otoczenia `1` będzie oznaczać, że agent ruszył się w lewo. + +--- + +### Implementacja + +Do implementacji uczenia poprzez drzewo decyzyjny wykorzystałem bibliotekę [scikit learn](https://scikit-learn.org) do języka **python**. Podając odpowiednie dane, biblioteka przygotuje nam model zdolny do samodzielnego poruszania się na mapie. + +```python +#Trenowanie modelu +from sklearn import tree +X = [Kolejne otoczenia 7x7 w danym kroku] +Y = [Kolejne kroki odpowiednie dla danego otoczenia] +clf = tree.DecisionTreeClassifier() +clf = clf.fit(X, Y) + +#Samodzielny ruch wytrenowanego modelu +clf.predict([Otoczenie agenta]) +``` + +`clf.predict` zwróci nam 1 z 5 ruchów, które ma wykonać agent. + +--- + +### Obserwacje + +W idealnym przypadku wytrenowany model powinien odzwierciedlać algorytm BestFS, jako iż to na podstawie jego był trenowany i to jego decyzje starał się naśladować. W rzeczywistości jednak po przygotowaniu ok. 1000 próbek agent radził sobie różnorako. Na jednych mapach poruszał się dość sprawnie, jednak na wielu nie wiedział co ma robić. Przyczyny mogą być różne, jednak w mojej opinii, przygotowanych danych było jednak trochę za mało i gdyby dać o wiele więcej danych do wytrenowania modelu, rezultat byłby o wiele lepszy.