Merge branch 'VowpalWabbit' of https://git.wmi.amu.edu.pl/s440556/SZI2019SmieciarzWmi into VowpalWabbit

This commit is contained in:
Magdalena Wilczynska 2019-06-12 10:33:41 +02:00
commit 7ee29820a6

View File

@ -79,29 +79,26 @@ od teraz wymagane są 2 do 3 argumentów:
- algorytm, który automatycznie uruchamia się po starcie aplikacji (bfs / dfs / bestfs / brak wartości jeżeli nie chcemy nic automatycznie włączać)
Przykładowe wywołanie komendy:
>python3 ./main.py auto false dfs
python3 ./main.py auto false dfs
W celu maksymalnego zautomatyzowania procesu uczenia się, stworzyłyśmy skrypt, które wszystkie potrzebne rzeczy robi za nas. Wymaga podania liczby uruchomień aplikacji, informacji, czy ma wyczyścić poprzednie dane, nazwę wyjściowego modelu oraz informację, czy po zakończeniu zbierania danych powinien od razu zacząć sie uczyć. Po uruchomieniu aplikacji wymaganą liczbę razy, skrypt zbiera dane z powstałych plików i tworzy z nich jeden plik .txt, który następnie przekazuje do VW za pomocą komendy
vw --oaa 5 data_set.txt -f data_model.model
Poniżej znajdują się parametry, dla których stworzyłyśmy prezentowany model:
Poniżej znajdują się parametry, dla których stworzyłyśmy dwa prezentowane modele:
| Liczba wykonań programu | Typ mapy | Przykładowy algorytm | Pole widzenia |
| --- | --- | --- | --- |
| 2000 | auto | BestFS | 2 |
| Nazwa | Liczba wykonań programu | Typ mapy | Przykładowy algorytm | Pole widzenia |
| --- | --- | --- | --- | --- |
| 1k.model | 1000 | auto | BestFS | 2 |
| 100.model | 100 | auto | BestFS | 1 |
W wyniku procesu zbierania danych, otrzymałyśmy dane w liczbie 100 000 linii i output z VW:
> Dlaczego
> to
> nie
> działa
> HALP
W wyniku procesu zbierania danych, otrzymałyśmy dane w liczbie około 50 000 linii oraz 5 000 linii.
#### Obserwacje
Pomimo dostosowania danych wejściowych i ich parametrów agent nie zawsze podejmuje racjonalne ruchy. Za każdym razem gdy trafia na skrzyżowanie nie potrafi dostosować ruchu do sytuacji. Udało nam się jednak nauczyć agenta kierowania się w stronę nieodwiedzonego domku, jeżeli ma taki w polu widzenia.
Podczas obserwacji obu modeli doszłyśmy do wniosku, że agent o zwiększonym polu widzenia(model 1k.model) sprawuje się gorzej niż model o ograniczonym polu widzenia (mimo większej ilości danych).
---
Ze względu na to, że agent nie potrafi wyznaczyć odpowiedniego rozwiązania zadanego mu problemu ograniczyłyśmy przewidywanie do jednego ruchu.