From 9c0e6ccc52f082a20b540ba1b29e2f79f69cf3ff Mon Sep 17 00:00:00 2001
From: Ewelina <ewestr1@st.amu.edu.pl>
Date: Sun, 10 Dec 2017 10:43:26 +0100
Subject: [PATCH] task05 (labs03) done

---
 labs03/task5.py | 39 +++++++++++++++++++++++++++++++++++++++
 1 file changed, 39 insertions(+)
 create mode 100644 labs03/task5.py

diff --git a/labs03/task5.py b/labs03/task5.py
new file mode 100644
index 0000000..2adb2bf
--- /dev/null
+++ b/labs03/task5.py
@@ -0,0 +1,39 @@
+"""**ćwiczenie 5**
+Katalog scores zawiera 64 pliki tekstowe, które posiadają informacje o wysokości miary ``BLEU``
+ na różnych etapach trenowania modelu. Nazwa każdego pliku na postać  ``model.iterXXXXXXX.npz.bleu``,
+  gdzie ``XXXXXXX``, to liczba iteracji.Zawartość każdego pliku jest podobna i ma następującą formę:
+   *BLEU = YY.YY, 44.4/18.5/9.3/5.0 (BP=1.000, ratio=1.072, hyp_len=45976, ref_len=42903)*,
+   gdzie ``YY.YY`` to wartość miary ``BLEU``. Znajdź plik, który zawiera najwyższą wartość miary ``BLEU``.
+ * Wykorzystaj bibliotekę ``glob`` (https://docs.python.org/2/library/glob.html)
+ * Wyświetl tylko pełną nazwe pliku (wraz z ścieżką).
+"""
+
+import glob
+import os
+
+path = '\scores'
+path = os.getcwd()+ path
+
+file_list = glob.glob(path+'\*npz.bleu')
+
+list_all = []
+#key_list = []
+value_list =[]
+
+for file in file_list:
+    with open(file, 'r') as f:
+        linijki = f.readlines()
+        for line in linijki:
+            list_all.append(line)
+
+for i in list_all:
+    i = i.split(',')
+    #a = i[0][0:4]
+    b = i[0][7:]
+    b = float(b)
+    #key_list.append(a)
+    value_list.append(b)
+
+max_bleau = (max(value_list))
+index_max_bleu = value_list.index(max_bleau)
+print(file_list[index_max_bleu])