current_month_mean_from_train | ||
dev-0 | ||
mean_from_train | ||
station_result_from_year_2010 | ||
test-A | ||
train | ||
.gitignore | ||
config.txt | ||
dataset_splits.tsv | ||
in-header.tsv | ||
out-header.tsv | ||
README.md |
Meteo rain
W latach 1980-2020 prowadzono pomiary opadów deszczu. Jednostką jest miesięczna suma opadów w milimetrach.
Lista stacji pogodowych znajduje się w pliku dataset_splits.tsv
. Stacje pogodowe podzielone
są na 3 zbiory: train, dev-0, test-A.
Dla lat 1980-2010 dostępne są wszystkie pomiary dla wszystkich stacji (train, dev-0, test-A) i znajdują sie w katalogu train/
.
Dla lat 2011-2020 dostępne są pomiary stacji oznaczonych train, ale nie stacji oznaczonych dev-0, test-A.
Należy odgadnąć wyniki pomiarów w latach 2011-2020 dla stacji oznaczonych dev-0 i test-A i podać je w katalogach odpowiednio dev-0/
i test-A/
.
Przy czym można sprawdzać wyniki dla dev-0 lokalnie dla komputerze, ponieważ w pliku dev-0/expected.tsv
znajdują się odpowiedzi
(ale nie używamy tych odpowiedzi do treningu). Do sprawdzania wyników najlepiej użyć narzędzia geval.
Przy konstruowaniu modelu można korzystać z pomiarów historycznych dla danej stacji, pomiarów z tego samego miesiacą i roku z innych stacji (z train). Nie wolno natomiast posiłkować się danymi zewnętrznymi (np. samodzielnie szukać wyników pomiarów w internecie).
Opis kolumn znajduje się w plikach in-header.tsv
, out-header.tsv
.
https://www.youtube.com/watch?v=vzXW3RTNjuY&ab_channel=aruzo88
Directory structure
README.md
— this fileconfig.txt
— configuration filetrain/
— directory with training datatrain/in.tsv
— input data for the train settrain/expected.tsv
— expected (reference) data for the train setdev-0/
— directory with dev (test) datadev-0/in.tsv
— input data for the dev setdev-0/expected.tsv
— expected (reference) data for the dev settest-A
— directory with test datatest-A/in.tsv
— input data for the test settest-A/expected.tsv
— expected (reference) data for the test set