diff --git a/run.py b/run.py index 2d9712b..4498fc3 100644 --- a/run.py +++ b/run.py @@ -1,20 +1,22 @@ # słowniki -male = ['gry', 'grać', 'grami', 'auto', 'samochód', 'silnik', 'kolegami', 'brodę', 'zarost', 'samochodem', 'piwo', - 'kolega', 'fura', 'kasa', 'pieniądze', 'autem', 'mechanika', 'piłka', 'mecz', 'nożna', 'sport', 'motor', - 'skuter', 'pograć', 'alkohol', 'ubuntu', 'systemu', 'serwer', 'linux', 'windows', 'procesor', 'dysk', 'gb', +male = ['gry', 'grac', 'grami', 'auto', 'samochod', 'silnik', 'kolegami', 'brode', 'zarost', 'samochodem', 'piwo', + 'kolega', 'fura', 'kasa', 'pieniadze', 'autem', 'mechanika', 'pilka', 'meczu', 'mecz', 'nozna', 'sport', 'motor', + 'skuter', 'pograc', 'alkohol', 'ubuntu', 'systemu', 'serwer', 'linux', 'windows', 'procesor', 'dysk', 'gb', 'mb'] -female = ['ja', 'koleżanka', 'koleżankami', 'koleżanką', 'przyjaciółki', 'przyjaciółka', 'przyjaciółkami', +female = ['kolezanka', 'kolezankami', 'koleżanką', 'przyjaciółki', 'przyjaciółka', 'przyjaciółkami', 'kosmetyczka', 'okres', 'praca', 'paznokcie', 'włosy', 'usta', 'ciąża', 'lekarz', 'lekarza', 'ciąży', - 'dziecko', 'dzieci', 'wino', 'sukienka', 'sukienkę', 'torebka', 'tprebkę', 'makijaż', 'pomadka', 'piersi', - 'wesele', 'ślub'] - + 'dziecko', 'dzieci', 'wino', 'sukienka', 'sukienke', 'torebka', 'torebkę', 'makijaż', 'pomadka', 'piersi', + 'wesele', 'slub', 'weselu', 'mąż', 'maz', 'mężem'] # klasyfikacja def calculation(path_in, path_out): results = [] with open(path_in, encoding='utf-8') as file: + #removeAccents(path_in) for line in file.readlines(): + male_score = 0 + female_score = 0 line = line.replace('.', ' ').replace(',', ' ').lower() words = line.split() male_score = len([w for w in words if w in male])