478855 - improvement

This commit is contained in:
ulaniuk 2022-04-20 21:15:53 +02:00
parent 31c2a80b77
commit 846b9b074f
5 changed files with 269961 additions and 269963 deletions

174378
dev-0/out.tsv

File diff suppressed because it is too large Load Diff

199162
dev-1/out.tsv

File diff suppressed because it is too large Load Diff

View File

@ -2,7 +2,7 @@
"cells": [
{
"cell_type": "code",
"execution_count": 535,
"execution_count": 617,
"metadata": {},
"outputs": [],
"source": [
@ -11,7 +11,7 @@
},
{
"cell_type": "code",
"execution_count": 536,
"execution_count": 618,
"metadata": {},
"outputs": [],
"source": [
@ -21,25 +21,25 @@
},
{
"cell_type": "code",
"execution_count": 538,
"execution_count": 619,
"metadata": {},
"outputs": [],
"source": [
"m_vocabulary = ['komputer', 'komputerze', 'aucie', 'auto', 'samochód', 'samochodzie', 'piwie', 'piwo', 'alkoholu', 'alkohol', 'żonie', 'żona', 'xboxie', 'xbox', 'co', 'e', 'XD', 'stary', 'staremu']"
"m_vocabulary = ['windows', 'pc', 'lagi', 'komputer', 'komputerze', 'aucie', 'auto', 'samochód', 'samochodzie', 'piwie', 'piwo', 'alkoholu', 'alkohol', 'żonie', 'żona', 'xboxie', 'xbox', 'mecz', 'meczu', 'XD', 'stary', 'staremu']"
]
},
{
"cell_type": "code",
"execution_count": 539,
"execution_count": 620,
"metadata": {},
"outputs": [],
"source": [
"f_vocabulary = ['zakupy', 'zakupach', 'mężem', 'mąż', 'nasze', 'my', 'dzieckiem', 'dziecko', 'domu', 'dom', 'mieszkaniu', 'mieszkanie', 'kocham', 'kocha', 'chłopakowai', 'chłopak', 'haha', 'boże', 'uh', 'uhh', \":)\", 'mama', 'mamie', 'włosy']"
"f_vocabulary = ['ciasto', 'porodzie', 'ciąży', 'ciąża', 'tabletki', 'zakupy', 'zakupach', 'mężem', 'mąż', 'nasze', 'my', 'dzieckiem', 'dziecko', 'domu', 'dom', 'mieszkaniu', 'mieszkanie', 'kocham', 'kocha', 'chłopakowai', 'chłopak', 'haha', 'boże', 'uh', 'uhh', \":)\", 'mama', 'mamie', 'włosy']"
]
},
{
"cell_type": "code",
"execution_count": 540,
"execution_count": 621,
"metadata": {},
"outputs": [],
"source": [
@ -64,7 +64,7 @@
},
{
"cell_type": "code",
"execution_count": 541,
"execution_count": 622,
"metadata": {},
"outputs": [],
"source": [
@ -74,7 +74,7 @@
},
{
"cell_type": "code",
"execution_count": 542,
"execution_count": 623,
"metadata": {},
"outputs": [],
"source": [
@ -83,7 +83,7 @@
},
{
"cell_type": "code",
"execution_count": 543,
"execution_count": 624,
"metadata": {},
"outputs": [],
"source": [
@ -102,16 +102,16 @@
},
{
"cell_type": "code",
"execution_count": 544,
"execution_count": 625,
"metadata": {},
"outputs": [
{
"data": {
"text/plain": [
"0.5122792230182751"
"0.5128610338348603"
]
},
"execution_count": 544,
"execution_count": 625,
"metadata": {},
"output_type": "execute_result"
}

6
run.py
View File

@ -21,10 +21,8 @@ def predict(text):
m_vocabulary = ['komputer', 'komputerze', 'aucie', 'auto', 'samochód', 'samochodzie', 'piwie', 'piwo', 'alkoholu', 'alkohol', 'żonie', 'żona', 'xboxie', 'xbox', 'co', 'e', 'XD', 'stary', 'staremu']
f_vocabulary = ['zakupy', 'zakupach', 'mężem', 'mąż', 'nasze', 'my', 'dzieckiem', 'dziecko', 'domu', 'dom', 'mieszkaniu', 'mieszkanie', 'kocham', 'kocha', 'chłopakowai', 'chłopak', 'haha', 'boże', 'uh', 'uhh', ":)", 'mama', 'mamie', 'włosy']
m_vocabulary = ['windows', 'pc', 'lagi', 'komputer', 'komputerze', 'aucie', 'auto', 'samochód', 'samochodzie', 'piwie', 'piwo', 'alkoholu', 'alkohol', 'żonie', 'żona', 'xboxie', 'xbox', 'mecz', 'meczu', 'XD', 'stary', 'staremu']
f_vocabulary = ['ciasto', 'porodzie', 'ciąży', 'ciąża', 'tabletki', 'zakupy', 'zakupach', 'mężem', 'mąż', 'nasze', 'my', 'dzieckiem', 'dziecko', 'domu', 'dom', 'mieszkaniu', 'mieszkanie', 'kocham', 'kocha', 'chłopakowai', 'chłopak', 'haha', 'boże', 'uh', 'uhh', ":)", 'mama', 'mamie', 'włosy']
with open('dev-0/in.tsv', 'r', encoding='utf8') as f:

File diff suppressed because it is too large Load Diff