test
This commit is contained in:
parent
5d210c0e6a
commit
5d564ac423
54
ium-data.py
54
ium-data.py
@ -15,12 +15,16 @@ def column_stat(analyzed_set, column_name):
|
||||
rating_median = analyzed_set[column_name].median()
|
||||
rating_std = round(analyzed_set[column_name].std(), 3)
|
||||
|
||||
print(f"Dla kolumny '{column_name}':")
|
||||
print(f"Minimum: {rating_min}")
|
||||
print(f"Maximum: {rating_max}")
|
||||
print(f"Średnia: {rating_mean}")
|
||||
print(f"Mediana: {rating_median}")
|
||||
print(f"Odchylenie standardowe: {rating_std}")
|
||||
output = ''
|
||||
|
||||
output += f"Dla kolumny '{column_name}':\n"
|
||||
output += f"Minimum: {rating_min}\n"
|
||||
output += f"Maximum: {rating_max}\n"
|
||||
output += f"Średnia: {rating_mean}\n"
|
||||
output += f"Mediana: {rating_median}\n"
|
||||
output += f"Odchylenie standardowe: {rating_std}\n"
|
||||
|
||||
return output
|
||||
|
||||
|
||||
# Pobieranie danych
|
||||
@ -48,25 +52,30 @@ d_test.to_csv('d_test.csv', index=False)
|
||||
d_dev.to_csv('d_dev.csv', index=False)
|
||||
|
||||
# Statystyki
|
||||
print(f"Wielkość całego zbioru: {disney.shape[0]}\n"
|
||||
f"Inne statystyki:")
|
||||
column_stat(disney, 'Rating')
|
||||
print('')
|
||||
temp = ''
|
||||
temp += f"Wielkość całego zbioru: {disney.shape[0]}\n"
|
||||
temp += f"Inne statystyki:\n"
|
||||
temp += column_stat(disney, 'Rating')
|
||||
temp += '\n'
|
||||
|
||||
print(f"Wielkość zbioru trenującego: {d_train.shape[0]}\n"
|
||||
f"Inne statystyki:")
|
||||
column_stat(d_train, 'Rating')
|
||||
print('')
|
||||
temp += f"Wielkość zbioru trenującego: {d_train.shape[0]}\n"
|
||||
temp += f"Inne statystyki:\n"
|
||||
temp += column_stat(d_train, 'Rating')
|
||||
temp += '\n'
|
||||
|
||||
print(f"Wielkość zbioru walidującego: {d_dev.shape[0]}\n"
|
||||
f"Inne statystyki:")
|
||||
column_stat(d_dev, 'Rating')
|
||||
print('')
|
||||
temp += f"Wielkość zbioru walidującego: {d_dev.shape[0]}\n"
|
||||
temp += f"Inne statystyki:\n"
|
||||
temp += column_stat(d_dev, 'Rating')
|
||||
temp += '\n'
|
||||
|
||||
print(f"Wielkość zbioru testowego: {d_test.shape[0]}\n"
|
||||
f"Inne statystyki:")
|
||||
column_stat(d_test, 'Rating')
|
||||
print('')
|
||||
temp += f"Wielkość zbioru testowego: {d_test.shape[0]}\n"
|
||||
temp += f"Inne statystyki:\n"
|
||||
temp += column_stat(d_test, 'Rating')
|
||||
temp += '\n'
|
||||
|
||||
with open('stats.txt', 'w+', encoding="utf-8") as f:
|
||||
print(temp)
|
||||
f.write(temp)
|
||||
|
||||
# Rozkład ocen dla każdego oddziału
|
||||
try:
|
||||
@ -75,3 +84,4 @@ try:
|
||||
plt.show()
|
||||
except:
|
||||
print("Error drawing hist plot (Powinno działać w Pycharmie)")
|
||||
|
||||
|
Loading…
Reference in New Issue
Block a user