diff --git a/labs03/task5.py b/labs03/task5.py new file mode 100644 index 0000000..2adb2bf --- /dev/null +++ b/labs03/task5.py @@ -0,0 +1,39 @@ +"""**ćwiczenie 5** +Katalog scores zawiera 64 pliki tekstowe, które posiadają informacje o wysokości miary ``BLEU`` + na różnych etapach trenowania modelu. Nazwa każdego pliku na postać ``model.iterXXXXXXX.npz.bleu``, + gdzie ``XXXXXXX``, to liczba iteracji.Zawartość każdego pliku jest podobna i ma następującą formę: + *BLEU = YY.YY, 44.4/18.5/9.3/5.0 (BP=1.000, ratio=1.072, hyp_len=45976, ref_len=42903)*, + gdzie ``YY.YY`` to wartość miary ``BLEU``. Znajdź plik, który zawiera najwyższą wartość miary ``BLEU``. + * Wykorzystaj bibliotekę ``glob`` (https://docs.python.org/2/library/glob.html) + * Wyświetl tylko pełną nazwe pliku (wraz z ścieżką). +""" + +import glob +import os + +path = '\scores' +path = os.getcwd()+ path + +file_list = glob.glob(path+'\*npz.bleu') + +list_all = [] +#key_list = [] +value_list =[] + +for file in file_list: + with open(file, 'r') as f: + linijki = f.readlines() + for line in linijki: + list_all.append(line) + +for i in list_all: + i = i.split(',') + #a = i[0][0:4] + b = i[0][7:] + b = float(b) + #key_list.append(a) + value_list.append(b) + +max_bleau = (max(value_list)) +index_max_bleu = value_list.index(max_bleau) +print(file_list[index_max_bleu])