38 lines
1.9 KiB
Markdown
38 lines
1.9 KiB
Markdown
|
|
||
|
Meteo rain
|
||
|
======================
|
||
|
|
||
|
W latach 1980-2020 prowadzono pomiary opadów deszczu. Jednostką jest miesięczna suma opadów w milimetrach.
|
||
|
Lista stacji pogodowych znajduje się w pliku `dataset_splits.tsv`. Stacje pogodowe podzielone
|
||
|
są na 3 zbiory: train, dev-0, test-A.
|
||
|
|
||
|
Dla lat 1980-2010 dostępne są wszystkie pomiary dla wszystkich stacji (train, dev-0, test-A) i znajdują sie w katalogu `train/`.
|
||
|
|
||
|
Dla lat 2011-2020 dostępne są pomiary stacji oznaczonych train, ale nie stacji oznaczonych dev-0, test-A.
|
||
|
|
||
|
Należy odgadnąć wyniki pomiarów w latach 2011-2020 dla stacji oznaczonych dev-0 i test-A i podać je w katalogach odpowiednio `dev-0/` i `test-A/`.
|
||
|
Przy czym można sprawdzać wyniki dla dev-0 lokalnie dla komputerze, ponieważ w pliku `dev-0/expected.tsv` znajdują się odpowiedzi
|
||
|
(ale nie używamy tych odpowiedzi do treningu). Do sprawdzania wyników najlepiej użyć narzędzia geval.
|
||
|
|
||
|
Przy konstruowaniu modelu można korzystać z pomiarów historycznych dla danej stacji, pomiarów z tego samego miesiacą i roku z innych stacji (z train).
|
||
|
Nie wolno natomiast posiłkować się danymi zewnętrznymi (np. samodzielnie szukać wyników pomiarów w internecie).
|
||
|
|
||
|
Opis kolumn znajduje się w plikach `in-header.tsv`, `out-header.tsv`.
|
||
|
|
||
|
https://www.youtube.com/watch?v=vzXW3RTNjuY&ab_channel=aruzo88
|
||
|
|
||
|
Directory structure
|
||
|
-------------------
|
||
|
|
||
|
* `README.md` — this file
|
||
|
* `config.txt` — configuration file
|
||
|
* `train/` — directory with training data
|
||
|
* `train/in.tsv` — input data for the train set
|
||
|
* `train/expected.tsv` — expected (reference) data for the train set
|
||
|
* `dev-0/` — directory with dev (test) data
|
||
|
* `dev-0/in.tsv` — input data for the dev set
|
||
|
* `dev-0/expected.tsv` — expected (reference) data for the dev set
|
||
|
* `test-A` — directory with test data
|
||
|
* `test-A/in.tsv` — input data for the test set
|
||
|
* `test-A/expected.tsv` — expected (reference) data for the test set
|