petite-difference-challenge2/run.py

37 lines
1.6 KiB
Python

# słowniki
male = ['gry', 'grac', 'grami', 'auto', 'samochod', 'silnik', 'kolegami', 'brode', 'zarost', 'samochodem', 'piwo',
'kolega', 'fura', 'kasa', 'pieniadze', 'autem', 'mechanika', 'pilka', 'meczu', 'mecz', 'nozna', 'sport', 'motor',
'skuter', 'pograc', 'alkohol', 'ubuntu', 'systemu', 'serwer', 'linux', 'windows', 'procesor', 'dysk', 'gb',
'mb']
female = ['kolezanka', 'kolezankami', 'koleżanką', 'przyjaciółki', 'przyjaciółka', 'przyjaciółkami',
'kosmetyczka', 'okres', 'praca', 'paznokcie', 'włosy', 'usta', 'ciąża', 'lekarz', 'lekarza', 'ciąży',
'dziecko', 'dzieci', 'wino', 'sukienka', 'sukienke', 'torebka', 'torebkę', 'makijaż', 'pomadka', 'piersi',
'wesele', 'slub', 'weselu', 'mąż', 'maz', 'mężem']
# klasyfikacja
def calculation(path_in, path_out):
results = []
with open(path_in, encoding='utf-8') as file:
#removeAccents(path_in)
for line in file.readlines():
male_score = 0
female_score = 0
line = line.replace('.', ' ').replace(',', ' ').lower()
words = line.split()
male_score = len([w for w in words if w in male])
female_score = len([w for w in words if w in female])
if male_score > female_score:
results.append('1')
else:
results.append('0')
with open(path_out, 'w') as file:
for r in results:
file.write(r + '\n')
#pliki
calculation('dev-0/in.tsv', 'dev-0/out.tsv')
calculation('dev-1/in.tsv', 'dev-1/out.tsv')
calculation('test-A/in.tsv', 'test-A/out.tsv')