This commit is contained in:
s444501 2022-04-22 19:30:27 +02:00
parent dc23a5d26a
commit cb3ad81655
4 changed files with 7078 additions and 7078 deletions

File diff suppressed because it is too large Load Diff

File diff suppressed because it is too large Load Diff

10
run.py
View File

@ -4,12 +4,14 @@ m = ['żona', 'żony', 'żonie', 'żoną', 'zona', 'zony', 'zonie', 'mecz', 'kom
'bmw', 'audi', 'passat', 'informatyka', 'informatykę', 'polibuda', 'polibudzie', 'politechnika', 'politechnice', 'bmw', 'audi', 'passat', 'informatyka', 'informatykę', 'polibuda', 'polibudzie', 'politechnika', 'politechnice',
'piwo', 'laska', 'laseczka', 'laseczki', 'dziewczynie', 'siema', 'elo', 'yo', 'spadam', 'windows', 'piwo', 'laska', 'laseczka', 'laseczki', 'dziewczynie', 'siema', 'elo', 'yo', 'spadam', 'windows',
'linux', 'sterowniki', 'silka', 'siłka', 'wyciskam', 'klate', 'paliwo', 'paliwa', 'lv', 'eq', 'linux', 'sterowniki', 'silka', 'siłka', 'wyciskam', 'klate', 'paliwo', 'paliwa', 'lv', 'eq',
'robota', 'cycki', 'sztanga', 'sztange', 'rychu', 'peja', 'czolg', 'czołg', 'korwin' 'robota', 'cycki', 'sztanga', 'sztange', 'rychu', 'peja', 'czolg', 'czołg', 'korwin',
'system', 'pc', 'pecet', 'wariat', 'wariacie', 'hd', 'hq', 'rozdzielczosc', 'rozdzielczość'
] ]
f = ['mąż', 'okres', 'ciąża', 'kocham', 'chłopak', 'torebka', 'torebke', 'podpaska', 'podpaski', f = ['mąż', 'okres', 'ciąża', 'kocham', 'chłopak', 'torebka', 'torebke', 'podpaska', 'podpaski',
'ciąża', 'ciąży', 'ciaza', 'ciazy', 'sukienka', 'ciąża', 'ciąży', 'ciaza', 'ciazy', 'sukienka', 'obcasy', 'koleżanka', 'szminka', 'szminki',
'ginekolog', 'ginekologa', 'porod', 'poród'
] ]
@ -17,8 +19,7 @@ def calculate(p_in, p_out):
results = [] results = []
with open(p_in, encoding='utf-8') as file: with open(p_in, encoding='utf-8') as file:
for line in file.readlines(): for line in file.readlines():
line.replace('.', ' ') line = line.replace('.', ' ').replace(',', ' ').lower()
line.replace(',', ' ')
words = line.split() words = line.split()
m_score = len([w for w in words if w in m]) m_score = len([w for w in words if w in m])
f_score = len([w for w in words if w in f]) f_score = len([w for w in words if w in f])
@ -32,7 +33,6 @@ def calculate(p_in, p_out):
for r in results: for r in results:
file.write(r + '\n') file.write(r + '\n')
calculate('dev-0/in.tsv', 'dev-0/out.tsv') calculate('dev-0/in.tsv', 'dev-0/out.tsv')
calculate('dev-1/in.tsv', 'dev-1/out.tsv') calculate('dev-1/in.tsv', 'dev-1/out.tsv')
calculate('test-A/in.tsv', 'test-A/out.tsv') calculate('test-A/in.tsv', 'test-A/out.tsv')

File diff suppressed because it is too large Load Diff