# słowniki male = ['gry', 'grac', 'grami', 'auto', 'samochod', 'silnik', 'kolegami', 'brode', 'zarost', 'samochodem', 'piwo', 'kolega', 'fura', 'kasa', 'pieniadze', 'autem', 'mechanika', 'pilka', 'meczu', 'mecz', 'nozna', 'sport', 'motor', 'skuter', 'pograc', 'alkohol', 'ubuntu', 'systemu', 'serwer', 'linux', 'windows', 'procesor', 'dysk', 'gb', 'mb'] female = ['kolezanka', 'kolezankami', 'koleżanką', 'przyjaciółki', 'przyjaciółka', 'przyjaciółkami', 'kosmetyczka', 'okres', 'praca', 'paznokcie', 'włosy', 'usta', 'ciąża', 'lekarz', 'lekarza', 'ciąży', 'dziecko', 'dzieci', 'wino', 'sukienka', 'sukienke', 'torebka', 'torebkę', 'makijaż', 'pomadka', 'piersi', 'wesele', 'slub', 'weselu', 'mąż', 'maz', 'mężem'] # klasyfikacja def calculation(path_in, path_out): results = [] with open(path_in, encoding='utf-8') as file: #removeAccents(path_in) for line in file.readlines(): male_score = 0 female_score = 0 line = line.replace('.', ' ').replace(',', ' ').lower() words = line.split() male_score = len([w for w in words if w in male]) female_score = len([w for w in words if w in female]) if male_score > female_score: results.append('1') else: results.append('0') with open(path_out, 'w') as file: for r in results: file.write(r + '\n') #pliki calculation('dev-0/in.tsv', 'dev-0/out.tsv') calculation('dev-1/in.tsv', 'dev-1/out.tsv') calculation('test-A/in.tsv', 'test-A/out.tsv')