precipitation-pl/README.md

38 lines
1.9 KiB
Markdown
Raw Normal View History

2021-12-23 14:50:39 +01:00
Meteo rain
======================
W latach 1980-2020 prowadzono pomiary opadów deszczu. Jednostką jest miesięczna suma opadów w milimetrach.
Lista stacji pogodowych znajduje się w pliku `dataset_splits.tsv`. Stacje pogodowe podzielone
są na 3 zbiory: train, dev-0, test-A.
Dla lat 1980-2010 dostępne są wszystkie pomiary dla wszystkich stacji (train, dev-0, test-A) i znajdują sie w katalogu `train/`.
Dla lat 2011-2020 dostępne są pomiary stacji oznaczonych train, ale nie stacji oznaczonych dev-0, test-A.
Należy odgadnąć wyniki pomiarów w latach 2011-2020 dla stacji oznaczonych dev-0 i test-A i podać je w katalogach odpowiednio `dev-0/` i `test-A/`.
Przy czym można sprawdzać wyniki dla dev-0 lokalnie dla komputerze, ponieważ w pliku `dev-0/expected.tsv` znajdują się odpowiedzi
(ale nie używamy tych odpowiedzi do treningu). Do sprawdzania wyników najlepiej użyć narzędzia geval.
Przy konstruowaniu modelu można korzystać z pomiarów historycznych dla danej stacji, pomiarów z tego samego miesiacą i roku z innych stacji (z train).
Nie wolno natomiast posiłkować się danymi zewnętrznymi (np. samodzielnie szukać wyników pomiarów w internecie).
Opis kolumn znajduje się w plikach `in-header.tsv`, `out-header.tsv`.
https://www.youtube.com/watch?v=vzXW3RTNjuY&ab_channel=aruzo88
Directory structure
-------------------
* `README.md` — this file
* `config.txt` — configuration file
* `train/` — directory with training data
* `train/in.tsv` — input data for the train set
* `train/expected.tsv` — expected (reference) data for the train set
* `dev-0/` — directory with dev (test) data
* `dev-0/in.tsv` — input data for the dev set
* `dev-0/expected.tsv` — expected (reference) data for the dev set
* `test-A` — directory with test data
* `test-A/in.tsv` — input data for the test set
* `test-A/expected.tsv` — expected (reference) data for the test set