diff --git a/ium-data.py b/ium-data.py index 6b5f1f0..cef71a3 100755 --- a/ium-data.py +++ b/ium-data.py @@ -15,12 +15,16 @@ def column_stat(analyzed_set, column_name): rating_median = analyzed_set[column_name].median() rating_std = round(analyzed_set[column_name].std(), 3) - print(f"Dla kolumny '{column_name}':") - print(f"Minimum: {rating_min}") - print(f"Maximum: {rating_max}") - print(f"Średnia: {rating_mean}") - print(f"Mediana: {rating_median}") - print(f"Odchylenie standardowe: {rating_std}") + output = '' + + output += f"Dla kolumny '{column_name}':\n" + output += f"Minimum: {rating_min}\n" + output += f"Maximum: {rating_max}\n" + output += f"Średnia: {rating_mean}\n" + output += f"Mediana: {rating_median}\n" + output += f"Odchylenie standardowe: {rating_std}\n" + + return output # Pobieranie danych @@ -48,25 +52,30 @@ d_test.to_csv('d_test.csv', index=False) d_dev.to_csv('d_dev.csv', index=False) # Statystyki -print(f"Wielkość całego zbioru: {disney.shape[0]}\n" - f"Inne statystyki:") -column_stat(disney, 'Rating') -print('') +temp = '' +temp += f"Wielkość całego zbioru: {disney.shape[0]}\n" +temp += f"Inne statystyki:\n" +temp += column_stat(disney, 'Rating') +temp += '\n' -print(f"Wielkość zbioru trenującego: {d_train.shape[0]}\n" - f"Inne statystyki:") -column_stat(d_train, 'Rating') -print('') +temp += f"Wielkość zbioru trenującego: {d_train.shape[0]}\n" +temp += f"Inne statystyki:\n" +temp += column_stat(d_train, 'Rating') +temp += '\n' -print(f"Wielkość zbioru walidującego: {d_dev.shape[0]}\n" - f"Inne statystyki:") -column_stat(d_dev, 'Rating') -print('') +temp += f"Wielkość zbioru walidującego: {d_dev.shape[0]}\n" +temp += f"Inne statystyki:\n" +temp += column_stat(d_dev, 'Rating') +temp += '\n' -print(f"Wielkość zbioru testowego: {d_test.shape[0]}\n" - f"Inne statystyki:") -column_stat(d_test, 'Rating') -print('') +temp += f"Wielkość zbioru testowego: {d_test.shape[0]}\n" +temp += f"Inne statystyki:\n" +temp += column_stat(d_test, 'Rating') +temp += '\n' + +with open('stats.txt', 'w+', encoding="utf-8") as f: + print(temp) + f.write(temp) # Rozkład ocen dla każdego oddziału try: @@ -75,3 +84,4 @@ try: plt.show() except: print("Error drawing hist plot (Powinno działać w Pycharmie)") +