From 9c0e6ccc52f082a20b540ba1b29e2f79f69cf3ff Mon Sep 17 00:00:00 2001 From: Ewelina Date: Sun, 10 Dec 2017 10:43:26 +0100 Subject: [PATCH] task05 (labs03) done --- labs03/task5.py | 39 +++++++++++++++++++++++++++++++++++++++ 1 file changed, 39 insertions(+) create mode 100644 labs03/task5.py diff --git a/labs03/task5.py b/labs03/task5.py new file mode 100644 index 0000000..2adb2bf --- /dev/null +++ b/labs03/task5.py @@ -0,0 +1,39 @@ +"""**ćwiczenie 5** +Katalog scores zawiera 64 pliki tekstowe, które posiadają informacje o wysokości miary ``BLEU`` + na różnych etapach trenowania modelu. Nazwa każdego pliku na postać ``model.iterXXXXXXX.npz.bleu``, + gdzie ``XXXXXXX``, to liczba iteracji.Zawartość każdego pliku jest podobna i ma następującą formę: + *BLEU = YY.YY, 44.4/18.5/9.3/5.0 (BP=1.000, ratio=1.072, hyp_len=45976, ref_len=42903)*, + gdzie ``YY.YY`` to wartość miary ``BLEU``. Znajdź plik, który zawiera najwyższą wartość miary ``BLEU``. + * Wykorzystaj bibliotekę ``glob`` (https://docs.python.org/2/library/glob.html) + * Wyświetl tylko pełną nazwe pliku (wraz z ścieżką). +""" + +import glob +import os + +path = '\scores' +path = os.getcwd()+ path + +file_list = glob.glob(path+'\*npz.bleu') + +list_all = [] +#key_list = [] +value_list =[] + +for file in file_list: + with open(file, 'r') as f: + linijki = f.readlines() + for line in linijki: + list_all.append(line) + +for i in list_all: + i = i.split(',') + #a = i[0][0:4] + b = i[0][7:] + b = float(b) + #key_list.append(a) + value_list.append(b) + +max_bleau = (max(value_list)) +index_max_bleu = value_list.index(max_bleau) +print(file_list[index_max_bleu])