s444476 - add more characteristic words

This commit is contained in:
Maciej Ścigacz 2022-04-22 17:57:01 +02:00
parent 431761f6f5
commit eb5a10172e
4 changed files with 82677 additions and 82674 deletions

File diff suppressed because it is too large Load Diff

File diff suppressed because it is too large Load Diff

15
run.py
View File

@ -1,10 +1,13 @@
import random
man_words_list = ['silnik', 'windows', 'silnika', 'gb', 'mb', 'meczu', 'pc', 'opony', 'apple', 'iphone', 'zwiastuny', 'hd',
'ubuntu', 'systemu', 'serwer']
man_list = ['silnik', 'windows', 'silnika', 'gb', 'mb', 'meczu', 'pc', 'opony', 'apple', 'iphone', 'zwiastuny', 'hd',
'ubuntu', 'systemu', 'serwer', "samoch", 'kompute', 'pc', 'sport', 'km', 'paliw', 'kierownic',
'piw', 'koleg', 'śrub', 'mecz']
woman_words_list = ['ciąży', 'miesiączki', 'ciasto', 'ciążę', 'zadowolona', 'ciąża', 'ciazy', 'antykoncepcyjne', 'ginekologa',
'tabletki', 'porodzie', 'mąż', 'miesiączkę', 'krwawienie', 'ciasta']
woman_list = ['ciąży', 'miesiączki', 'ciasto', 'ciążę', 'zadowolona', 'ciąża', 'ciazy', 'antykoncepcyjne', 'ginekologa',
'tabletki', 'porodzie', 'mąż', 'miesiączkę', 'krwawienie', 'ciasta', 'fryzjer', 'kosmety', 'biżuter', 'sukienk',
'kolczy', 'obcas', 'bransolet', 'spink', 'torebk', 'szmink', 'kobiet', 'koleżan', 'kuchni', 'gotowa', 'przepis',
'miesiączk']
def classificator(path_in, path_out):
result = []
@ -13,11 +16,11 @@ def classificator(path_in, path_out):
for line in lines:
counter_man = 0
counter_woman = 0
for word in man_words_list:
for word in man_list:
if word in line:
counter_man += 1
for word in woman_words_list:
for word in woman_list:
if word in line:
counter_woman += 1

File diff suppressed because it is too large Load Diff