petite-difference-challenge2/run.py

39 lines
1.7 KiB
Python

m = ['żona', 'żony', 'żonie', 'żoną', 'zona', 'zony', 'zonie', 'mecz', 'komputer', 'serwer',
'ziomek', 'ziom', 'ziomków', 'ziomkow', 'kumpel', 'kolega', 'kolegą', 'kolegi',
'lagi', 'gram', 'gra', 'gry', 'diablo', 'wowa', 'tibia', 'tibie', 'samochód', 'samochod', 'auto', 'felga', 'felgi',
'bmw', 'audi', 'passat', 'informatyka', 'informatykę', 'polibuda', 'polibudzie', 'politechnika', 'politechnice',
'piwo', 'laska', 'laseczka', 'laseczki', 'dziewczynie', 'siema', 'elo', 'yo', 'spadam', 'windows',
'linux', 'sterowniki', 'silka', 'siłka', 'wyciskam', 'klate', 'paliwo', 'paliwa', 'lv', 'eq',
'robota', 'cycki', 'sztanga', 'sztange', 'rychu', 'peja', 'czolg', 'czołg', 'korwin',
'system', 'pc', 'pecet', 'wariat', 'wariacie', 'hd', 'hq', 'rozdzielczosc', 'rozdzielczość'
]
f = ['mąż', 'okres', 'ciąża', 'kocham', 'chłopak', 'torebka', 'torebke', 'podpaska', 'podpaski',
'ciąża', 'ciąży', 'ciaza', 'ciazy', 'sukienka', 'obcasy', 'koleżanka', 'szminka', 'szminki',
'ginekolog', 'ginekologa', 'porod', 'poród'
]
def calculate(p_in, p_out):
results = []
with open(p_in, encoding='utf-8') as file:
for line in file.readlines():
line = line.replace('.', ' ').replace(',', ' ').lower()
words = line.split()
m_score = len([w for w in words if w in m])
f_score = len([w for w in words if w in f])
if m_score > f_score:
results.append('1')
else:
results.append('0')
with open(p_out, 'w') as file:
for r in results:
file.write(r + '\n')
calculate('dev-0/in.tsv', 'dev-0/out.tsv')
calculate('dev-1/in.tsv', 'dev-1/out.tsv')
calculate('test-A/in.tsv', 'test-A/out.tsv')