meteo-rain/README.md

1.9 KiB

Meteo rain

W latach 1980-2020 prowadzono pomiary opadów deszczu. Jednostką jest miesięczna suma opadów w milimetrach. Lista stacji pogodowych znajduje się w pliku dataset_splits.tsv. Stacje pogodowe podzielone są na 3 zbiory: train, dev-0, test-A.

Dla lat 1980-2010 dostępne są wszystkie pomiary dla wszystkich stacji (train, dev-0, test-A) i znajdują sie w katalogu train/.

Dla lat 2011-2020 dostępne są pomiary stacji oznaczonych train, ale nie stacji oznaczonych dev-0, test-A.

Należy odgadnąć wyniki pomiarów w latach 2011-2020 dla stacji oznaczonych dev-0 i test-A i podać je w katalogach odpowiednio dev-0/ i test-A/. Przy czym można sprawdzać wyniki dla dev-0 lokalnie dla komputerze, ponieważ w pliku dev-0/expected.tsv znajdują się odpowiedzi (ale nie używamy tych odpowiedzi do treningu). Do sprawdzania wyników najlepiej użyć narzędzia geval.

Przy konstruowaniu modelu można korzystać z pomiarów historycznych dla danej stacji, pomiarów z tego samego miesiacą i roku z innych stacji (z train). Nie wolno natomiast posiłkować się danymi zewnętrznymi (np. samodzielnie szukać wyników pomiarów w internecie).

Opis kolumn znajduje się w plikach in-header.tsv, out-header.tsv.

https://www.youtube.com/watch?v=vzXW3RTNjuY&ab_channel=aruzo88

Directory structure

  • README.md — this file
  • config.txt — configuration file
  • train/ — directory with training data
  • train/in.tsv — input data for the train set
  • train/expected.tsv — expected (reference) data for the train set
  • dev-0/ — directory with dev (test) data
  • dev-0/in.tsv — input data for the dev set
  • dev-0/expected.tsv — expected (reference) data for the dev set
  • test-A — directory with test data
  • test-A/in.tsv — input data for the test set
  • test-A/expected.tsv — expected (reference) data for the test set