Panda3
This commit is contained in:
parent
3ff980254a
commit
10c7156f46
776
dev-0/out.tsv
776
dev-0/out.tsv
@ -1,471 +1,471 @@
|
|||||||
od
|
pokoju
|
||||||
dawna
|
)
|
||||||
|
;
|
||||||
|
lecz
|
||||||
|
nie
|
||||||
|
?
|
||||||
|
.
|
||||||
|
po
|
||||||
|
do
|
||||||
|
niego
|
||||||
i
|
i
|
||||||
jeszcze
|
jeszcze
|
||||||
,
|
|
||||||
czy
|
|
||||||
na
|
|
||||||
niej
|
|
||||||
;
|
|
||||||
co
|
|
||||||
on
|
|
||||||
od
|
|
||||||
.
|
|
||||||
na
|
|
||||||
co
|
|
||||||
do
|
|
||||||
głowy
|
|
||||||
na
|
|
||||||
jego
|
|
||||||
i
|
|
||||||
do
|
|
||||||
panny
|
|
||||||
do
|
|
||||||
niego
|
|
||||||
:
|
|
||||||
po
|
|
||||||
chwili
|
|
||||||
o
|
|
||||||
co
|
|
||||||
?
|
|
||||||
)
|
)
|
||||||
:
|
|
||||||
nie
|
|
||||||
było
|
|
||||||
mnie
|
|
||||||
:
|
|
||||||
nie
|
|
||||||
ma
|
|
||||||
do
|
|
||||||
czasu
|
|
||||||
i
|
|
||||||
nie
|
|
||||||
można
|
|
||||||
do
|
|
||||||
głowy
|
|
||||||
do
|
|
||||||
głowy
|
|
||||||
i
|
|
||||||
ja
|
|
||||||
?
|
|
||||||
.
|
.
|
||||||
na
|
panna
|
||||||
drugi
|
florentyna
|
||||||
mnie
|
do
|
||||||
nie
|
głowy
|
||||||
był
|
|
||||||
o
|
|
||||||
,
|
|
||||||
jak
|
|
||||||
by
|
|
||||||
od
|
|
||||||
niej
|
|
||||||
i
|
|
||||||
o
|
|
||||||
,
|
|
||||||
jak
|
|
||||||
nie
|
|
||||||
można
|
|
||||||
od
|
|
||||||
niej
|
|
||||||
,
|
|
||||||
nie
|
|
||||||
ma
|
|
||||||
pan
|
|
||||||
nie
|
|
||||||
było
|
|
||||||
i
|
|
||||||
ja
|
|
||||||
,
|
|
||||||
co
|
|
||||||
on
|
|
||||||
jest
|
|
||||||
na
|
|
||||||
jego
|
|
||||||
;
|
|
||||||
ale
|
|
||||||
co
|
|
||||||
do
|
do
|
||||||
domu
|
domu
|
||||||
?
|
!
|
||||||
)
|
|
||||||
?
|
|
||||||
a
|
a
|
||||||
jeżeli
|
|
||||||
ja
|
|
||||||
go
|
|
||||||
o
|
|
||||||
do
|
|
||||||
niej
|
|
||||||
;
|
|
||||||
ale
|
|
||||||
nie
|
|
||||||
mogłem
|
|
||||||
i
|
|
||||||
na
|
|
||||||
co
|
|
||||||
?
|
|
||||||
na
|
|
||||||
niego
|
|
||||||
nie
|
|
||||||
ma
|
|
||||||
.
|
|
||||||
potem
|
potem
|
||||||
.
|
|
||||||
ale
|
|
||||||
co
|
|
||||||
,
|
,
|
||||||
i
|
który
|
||||||
ja
|
|
||||||
go
|
|
||||||
do
|
|
||||||
mnie
|
|
||||||
na
|
na
|
||||||
prawo
|
|
||||||
.
|
|
||||||
pan
|
|
||||||
,
|
|
||||||
o
|
|
||||||
jego
|
jego
|
||||||
na
|
na
|
||||||
nim
|
dzień
|
||||||
?
|
;
|
||||||
do
|
do
|
||||||
panny
|
panny
|
||||||
;
|
|
||||||
ale
|
|
||||||
,
|
|
||||||
co
|
|
||||||
,
|
|
||||||
ale
|
|
||||||
co
|
|
||||||
mi
|
|
||||||
o
|
|
||||||
pani
|
|
||||||
nie
|
|
||||||
był
|
|
||||||
i
|
|
||||||
nie
|
|
||||||
można
|
|
||||||
;
|
|
||||||
bo
|
|
||||||
pan
|
|
||||||
i
|
|
||||||
od
|
|
||||||
mnie
|
|
||||||
:
|
|
||||||
potem
|
|
||||||
nie
|
|
||||||
było
|
|
||||||
do
|
do
|
||||||
nich
|
panny
|
||||||
:
|
?
|
||||||
od
|
,
|
||||||
mnie
|
ażeby
|
||||||
;
|
nie
|
||||||
o
|
ma
|
||||||
nim
|
mu
|
||||||
;
|
|
||||||
co
|
|
||||||
,
|
,
|
||||||
a
|
a
|
||||||
potem
|
on
|
||||||
od
|
|
||||||
,
|
,
|
||||||
co
|
ażeby
|
||||||
mnie
|
nie
|
||||||
|
jest
|
||||||
|
nie
|
||||||
|
.
|
||||||
|
ale
|
||||||
|
ja
|
||||||
|
.
|
||||||
|
pan
|
||||||
|
ignacy
|
||||||
|
?
|
||||||
|
po
|
||||||
|
chwili
|
||||||
|
go
|
||||||
|
?
|
||||||
|
na
|
||||||
|
jego
|
||||||
|
dzień
|
||||||
|
?
|
||||||
|
)
|
||||||
|
i
|
||||||
|
nie
|
||||||
|
.
|
||||||
|
ale
|
||||||
|
może
|
||||||
|
do
|
||||||
|
domu
|
||||||
,
|
,
|
||||||
nie
|
nie
|
||||||
jestem
|
jestem
|
||||||
na
|
i
|
||||||
prawo
|
|
||||||
od
|
|
||||||
.
|
|
||||||
a
|
|
||||||
co
|
co
|
||||||
ja
|
do
|
||||||
?
|
niego
|
||||||
|
)
|
||||||
|
i
|
||||||
|
nie
|
||||||
|
będzie
|
||||||
|
do
|
||||||
|
głowy
|
||||||
|
;
|
||||||
i
|
i
|
||||||
ja
|
ja
|
||||||
go
|
,
|
||||||
od
|
na
|
||||||
.
|
drugi
|
||||||
|
i
|
||||||
|
do
|
||||||
|
mnie
|
||||||
|
,
|
||||||
|
który
|
||||||
|
do
|
||||||
|
niej
|
||||||
|
nie
|
||||||
|
może
|
||||||
|
być
|
||||||
|
do
|
||||||
|
końca
|
||||||
|
?
|
||||||
|
)
|
||||||
|
,
|
||||||
|
ażeby
|
||||||
|
nie
|
||||||
|
było
|
||||||
|
do
|
||||||
|
pani
|
||||||
|
krzeszowskiej
|
||||||
|
)
|
||||||
|
?
|
||||||
|
a
|
||||||
|
może
|
||||||
|
nie
|
||||||
|
mam
|
||||||
|
na
|
||||||
|
myśl
|
||||||
|
;
|
||||||
ale
|
ale
|
||||||
|
ja
|
||||||
|
,
|
||||||
|
który
|
||||||
|
?
|
||||||
|
nie
|
||||||
|
mam
|
||||||
|
nie
|
||||||
|
ma
|
||||||
|
do
|
||||||
|
niego
|
||||||
|
i
|
||||||
|
na
|
||||||
|
niego
|
||||||
|
;
|
||||||
|
nawet
|
||||||
|
i
|
||||||
|
do
|
||||||
|
mego
|
||||||
|
do
|
||||||
|
paryża
|
||||||
i
|
i
|
||||||
nawet
|
nawet
|
||||||
od
|
i
|
||||||
|
nie
|
||||||
|
,
|
||||||
|
ale
|
||||||
|
co
|
||||||
|
,
|
||||||
|
co
|
||||||
|
do
|
||||||
|
domu
|
||||||
|
;
|
||||||
|
może
|
||||||
|
być
|
||||||
do
|
do
|
||||||
paryża
|
paryża
|
||||||
:
|
:
|
||||||
po
|
po
|
||||||
obiedzie
|
nie
|
||||||
;
|
?
|
||||||
czy
|
i
|
||||||
może
|
|
||||||
.
|
|
||||||
ja
|
ja
|
||||||
,
|
.
|
||||||
ale
|
panna
|
||||||
,
|
.
|
||||||
ale
|
a
|
||||||
co
|
może
|
||||||
,
|
?
|
||||||
|
)
|
||||||
|
na
|
||||||
|
myśl
|
||||||
|
nie
|
||||||
|
było
|
||||||
|
o
|
||||||
|
?
|
||||||
|
czy
|
||||||
|
na
|
||||||
|
myśl
|
||||||
|
:
|
||||||
|
a
|
||||||
|
może
|
||||||
|
?
|
||||||
i
|
i
|
||||||
o
|
o
|
||||||
co
|
co
|
||||||
do
|
|
||||||
niego
|
|
||||||
i
|
|
||||||
jeszcze
|
|
||||||
.
|
|
||||||
nie
|
|
||||||
jestem
|
|
||||||
na
|
|
||||||
niego
|
|
||||||
nie
|
|
||||||
do
|
|
||||||
nas
|
|
||||||
od
|
|
||||||
niego
|
|
||||||
nie
|
|
||||||
ma
|
|
||||||
;
|
|
||||||
ale
|
|
||||||
co
|
|
||||||
,
|
|
||||||
który
|
|
||||||
,
|
|
||||||
który
|
|
||||||
mi
|
|
||||||
,
|
,
|
||||||
a
|
a
|
||||||
jeżeli
|
|
||||||
ja
|
|
||||||
?
|
|
||||||
o
|
|
||||||
mnie
|
|
||||||
.
|
|
||||||
pan
|
pan
|
||||||
?
|
|
||||||
nie
|
nie
|
||||||
chce
|
będzie
|
||||||
na
|
|
||||||
mnie
|
mnie
|
||||||
:
|
|
||||||
na
|
|
||||||
drugim
|
|
||||||
od
|
|
||||||
powietrza
|
|
||||||
do
|
|
||||||
głowy
|
|
||||||
;
|
|
||||||
potem
|
|
||||||
,
|
|
||||||
nie
|
|
||||||
mogłem
|
|
||||||
nie
|
|
||||||
był
|
|
||||||
od
|
|
||||||
niego
|
|
||||||
nie
|
|
||||||
,
|
|
||||||
ani
|
|
||||||
nie
|
|
||||||
mam
|
|
||||||
na
|
|
||||||
nich
|
|
||||||
i
|
|
||||||
nie
|
|
||||||
jest
|
|
||||||
o
|
o
|
||||||
|
nim
|
||||||
|
;
|
||||||
|
ale
|
||||||
|
po
|
||||||
|
,
|
||||||
|
który
|
||||||
|
?
|
||||||
|
do
|
||||||
|
paryża
|
||||||
|
?
|
||||||
|
a
|
||||||
|
potem
|
||||||
|
!
|
||||||
|
po
|
||||||
|
.
|
||||||
|
co
|
||||||
|
nie
|
||||||
|
jestem
|
||||||
|
.
|
||||||
|
i
|
||||||
|
jeszcze
|
||||||
|
do
|
||||||
|
mnie
|
||||||
|
?
|
||||||
|
i
|
||||||
|
na
|
||||||
|
myśl
|
||||||
|
do
|
||||||
|
końca
|
||||||
|
?
|
||||||
|
i
|
||||||
|
na
|
||||||
|
myśl
|
||||||
|
:
|
||||||
|
po
|
||||||
,
|
,
|
||||||
jak
|
jak
|
||||||
nie
|
nie
|
||||||
było
|
jestem
|
||||||
i
|
|
||||||
nie
|
nie
|
||||||
można
|
można
|
||||||
?
|
|
||||||
a
|
|
||||||
nie
|
|
||||||
ma
|
|
||||||
na
|
|
||||||
mnie
|
|
||||||
na
|
|
||||||
nich
|
|
||||||
?
|
|
||||||
i
|
i
|
||||||
o
|
o
|
||||||
ile
|
.
|
||||||
|
panna
|
||||||
|
na
|
||||||
|
co
|
||||||
|
,
|
||||||
nie
|
nie
|
||||||
było
|
ma
|
||||||
;
|
być
|
||||||
a
|
)
|
||||||
on
|
|
||||||
na
|
|
||||||
nich
|
|
||||||
.
|
|
||||||
na
|
|
||||||
co
|
|
||||||
.
|
|
||||||
po
|
|
||||||
francusku
|
|
||||||
:
|
|
||||||
ale
|
|
||||||
co
|
|
||||||
on
|
|
||||||
?
|
?
|
||||||
nie
|
nie
|
||||||
był
|
może
|
||||||
,
|
do
|
||||||
|
czasu
|
||||||
|
:
|
||||||
nie
|
nie
|
||||||
jest
|
jest
|
||||||
i
|
bardzo
|
||||||
po
|
|
||||||
obiedzie
|
|
||||||
o
|
|
||||||
,
|
,
|
||||||
co
|
ani
|
||||||
na
|
|
||||||
niej
|
|
||||||
od
|
|
||||||
czasu
|
|
||||||
,
|
|
||||||
i
|
|
||||||
ja
|
|
||||||
o
|
|
||||||
nim
|
|
||||||
,
|
,
|
||||||
a
|
a
|
||||||
|
on
|
||||||
|
na
|
||||||
|
kilka
|
||||||
nie
|
nie
|
||||||
będzie
|
ma
|
||||||
do
|
być
|
||||||
niej
|
|
||||||
i
|
i
|
||||||
ja
|
|
||||||
?
|
|
||||||
nie
|
|
||||||
było
|
|
||||||
na
|
|
||||||
nich
|
|
||||||
,
|
|
||||||
który
|
|
||||||
o
|
o
|
||||||
mnie
|
niej
|
||||||
na
|
;
|
||||||
mnie
|
|
||||||
,
|
|
||||||
na
|
|
||||||
co
|
|
||||||
od
|
|
||||||
do
|
do
|
||||||
panny
|
panny
|
||||||
do
|
;
|
||||||
nich
|
na
|
||||||
.
|
mnie
|
||||||
a
|
|
||||||
nie
|
nie
|
||||||
ma
|
mam
|
||||||
od
|
na
|
||||||
mnie
|
mnie
|
||||||
,
|
,
|
||||||
|
i
|
||||||
|
nie
|
||||||
|
na
|
||||||
|
nią
|
||||||
|
.
|
||||||
|
panna
|
||||||
|
na
|
||||||
|
kilka
|
||||||
|
dni
|
||||||
|
na
|
||||||
|
myśl
|
||||||
|
i
|
||||||
o
|
o
|
||||||
ile
|
:
|
||||||
do
|
|
||||||
nich
|
|
||||||
nie
|
nie
|
||||||
|
o
|
||||||
do
|
do
|
||||||
niego
|
głowy
|
||||||
;
|
:
|
||||||
a
|
a
|
||||||
nie
|
może
|
||||||
było
|
na
|
||||||
i
|
nią
|
||||||
nie
|
:
|
||||||
będzie
|
na
|
||||||
i
|
mnie
|
||||||
pan
|
.
|
||||||
od
|
|
||||||
dawna
|
|
||||||
?
|
|
||||||
po
|
po
|
||||||
chwili
|
chwili
|
||||||
!
|
|
||||||
nawet
|
|
||||||
mnie
|
|
||||||
.
|
|
||||||
i
|
|
||||||
jeszcze
|
|
||||||
mi
|
|
||||||
nie
|
|
||||||
na
|
|
||||||
nim
|
|
||||||
,
|
|
||||||
który
|
|
||||||
o
|
|
||||||
co
|
|
||||||
do
|
|
||||||
niej
|
|
||||||
i
|
|
||||||
jeszcze
|
|
||||||
od
|
|
||||||
do
|
|
||||||
nich
|
|
||||||
.
|
|
||||||
i
|
|
||||||
o
|
|
||||||
nim
|
|
||||||
:
|
|
||||||
i
|
|
||||||
po
|
|
||||||
do
|
|
||||||
domu
|
|
||||||
do
|
|
||||||
niej
|
|
||||||
od
|
|
||||||
.
|
|
||||||
ale
|
|
||||||
i
|
|
||||||
ja
|
|
||||||
mu
|
mu
|
||||||
|
,
|
||||||
|
jak
|
||||||
|
on
|
||||||
|
nie
|
||||||
|
może
|
||||||
|
być
|
||||||
|
)
|
||||||
do
|
do
|
||||||
niego
|
niego
|
||||||
na
|
|
||||||
nim
|
|
||||||
od
|
|
||||||
.
|
|
||||||
ja
|
|
||||||
i
|
i
|
||||||
na
|
|
||||||
mnie
|
|
||||||
:
|
|
||||||
potem
|
|
||||||
,
|
|
||||||
ażeby
|
|
||||||
o
|
o
|
||||||
|
jego
|
||||||
,
|
,
|
||||||
a
|
ale
|
||||||
nawet
|
może
|
||||||
o
|
?
|
||||||
nim
|
|
||||||
i
|
|
||||||
nie
|
nie
|
||||||
ma
|
ma
|
||||||
od
|
?
|
||||||
.
|
ale
|
||||||
pan
|
ja
|
||||||
do
|
|
||||||
nich
|
|
||||||
i
|
|
||||||
na
|
|
||||||
jego
|
|
||||||
jego
|
|
||||||
nie
|
|
||||||
było
|
|
||||||
do
|
|
||||||
nas
|
|
||||||
,
|
,
|
||||||
co
|
co
|
||||||
|
i
|
||||||
|
co
|
||||||
|
nie
|
||||||
|
będzie
|
||||||
|
,
|
||||||
|
co
|
||||||
|
on
|
||||||
|
,
|
||||||
|
bo
|
||||||
|
jest
|
||||||
|
nie
|
||||||
|
,
|
||||||
|
co
|
||||||
|
jest
|
||||||
|
o
|
||||||
|
,
|
||||||
|
i
|
||||||
|
nawet
|
||||||
|
?
|
||||||
|
nie
|
||||||
|
,
|
||||||
|
i
|
||||||
|
co
|
||||||
|
,
|
||||||
|
nie
|
||||||
|
mógł
|
||||||
|
o
|
||||||
|
nich
|
||||||
|
nie
|
||||||
|
,
|
||||||
|
nie
|
||||||
|
ma
|
||||||
|
i
|
||||||
|
nie
|
||||||
|
mam
|
||||||
|
,
|
||||||
|
ale
|
||||||
|
o
|
||||||
|
nim
|
||||||
|
nie
|
||||||
|
będzie
|
||||||
|
.
|
||||||
|
a
|
||||||
|
co
|
||||||
|
nie
|
||||||
|
będzie
|
||||||
|
do
|
||||||
|
niej
|
||||||
|
.
|
||||||
|
ale
|
||||||
|
nie
|
||||||
|
może
|
||||||
|
do
|
||||||
|
nas
|
||||||
|
:
|
||||||
|
po
|
||||||
|
angielsku
|
||||||
|
?
|
||||||
|
po
|
||||||
|
.
|
||||||
|
po
|
||||||
|
nie
|
||||||
|
mam
|
||||||
|
.
|
||||||
|
po
|
||||||
|
nie
|
||||||
|
mam
|
||||||
|
nic
|
||||||
|
:
|
||||||
|
co
|
||||||
|
.
|
||||||
|
po
|
||||||
|
co
|
||||||
|
.
|
||||||
|
na
|
||||||
|
co
|
||||||
|
nie
|
||||||
?
|
?
|
||||||
)
|
)
|
||||||
|
nie
|
||||||
|
,
|
||||||
|
który
|
||||||
|
?
|
||||||
|
do
|
||||||
|
domu
|
||||||
|
na
|
||||||
|
co
|
||||||
|
dzień
|
||||||
|
nie
|
||||||
|
było
|
||||||
o
|
o
|
||||||
|
co
|
||||||
|
dzień
|
||||||
|
,
|
||||||
|
który
|
||||||
|
na
|
||||||
|
nich
|
||||||
|
.
|
||||||
|
do
|
||||||
|
niego
|
||||||
|
)
|
||||||
|
?
|
||||||
|
do
|
||||||
|
domu
|
||||||
|
na
|
||||||
|
kilka
|
||||||
|
lat
|
||||||
|
na
|
||||||
|
niego
|
||||||
|
)
|
||||||
|
;
|
||||||
|
nie
|
||||||
|
może
|
||||||
|
być
|
||||||
|
od
|
||||||
|
innych
|
||||||
|
.
|
||||||
|
pan
|
||||||
|
jest
|
||||||
|
.
|
||||||
|
panna
|
||||||
|
na
|
||||||
|
chwilę
|
||||||
|
na
|
||||||
|
co
|
||||||
|
na
|
||||||
|
niego
|
||||||
|
;
|
||||||
|
na
|
||||||
|
co
|
||||||
|
,
|
||||||
|
ażeby
|
||||||
|
i
|
||||||
|
na
|
||||||
|
chwilę
|
||||||
|
;
|
||||||
|
ale
|
||||||
|
może
|
||||||
|
być
|
||||||
|
?
|
||||||
|
|
76
main.py
76
main.py
@ -1,38 +1,41 @@
|
|||||||
import numpy as np
|
|
||||||
import torch
|
|
||||||
from tqdm.notebook import tqdm
|
|
||||||
from sklearn.model_selection import train_test_split
|
|
||||||
import nltk
|
import nltk
|
||||||
|
import torch
|
||||||
|
import numpy as np
|
||||||
|
from tqdm.notebook import tqdm
|
||||||
from nltk.tokenize import word_tokenize
|
from nltk.tokenize import word_tokenize
|
||||||
|
from sklearn.model_selection import train_test_split
|
||||||
|
|
||||||
nltk.download('punkt')
|
nltk.download('punkt')
|
||||||
|
|
||||||
|
NGRAMS = 5
|
||||||
|
BATCH_SIZE = 128
|
||||||
|
EPOCHS = 15
|
||||||
|
|
||||||
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
|
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
|
||||||
|
|
||||||
with open("train/train.tsv", "r") as lalka_path:
|
with open("train/train.tsv", "r", encoding="utf8") as lalka_path:
|
||||||
lines = lalka_path.readlines()
|
lines = lalka_path.readlines()
|
||||||
|
|
||||||
train, test = train_test_split(lines, test_size=0.2)
|
train, test = train_test_split(lines, test_size=0.2)
|
||||||
|
|
||||||
with open("train/train_train.tsv", "w") as out_train_file:
|
with open("train/train_train.tsv", "w", encoding="utf8") as out_train_file:
|
||||||
for i in train:
|
for i in train:
|
||||||
out_train_file.write(i)
|
out_train_file.write(i)
|
||||||
|
|
||||||
with open("train/train_test.tsv", "w") as out_test_file:
|
with open("train/train_test.tsv", "w", encoding="utf8") as out_test_file:
|
||||||
for i in test:
|
for i in test:
|
||||||
out_test_file.write(i)
|
out_test_file.write(i)
|
||||||
|
|
||||||
lalka_path_train = 'train/train_train.tsv'
|
lalka_path_train = 'train/train_train.tsv'
|
||||||
lalka_path_valid = 'train/train_test.tsv'
|
lalka_path_valid = 'train/train_test.tsv'
|
||||||
|
|
||||||
corpora_train = open(lalka_path_train).read()
|
corpora_train = open(lalka_path_train, encoding="utf8").read()
|
||||||
|
|
||||||
corpora_train_tokenized = list(word_tokenize(corpora_train))
|
corpora_train_tokenized = list(word_tokenize(corpora_train))
|
||||||
corpora_train_tokenized = [token.lower() for token in corpora_train_tokenized]
|
corpora_train_tokenized = [token.lower() for token in corpora_train_tokenized]
|
||||||
|
|
||||||
vocab_itos = sorted(set(corpora_train_tokenized))
|
vocab_itos = sorted(set(corpora_train_tokenized))
|
||||||
|
|
||||||
vocab_itos = vocab_itos[:15005]
|
vocab_itos = vocab_itos[:15005]
|
||||||
|
|
||||||
vocab_itos[15001] = "<UNK>"
|
vocab_itos[15001] = "<UNK>"
|
||||||
vocab_itos[15002] = "<BOS>"
|
vocab_itos[15002] = "<BOS>"
|
||||||
vocab_itos[15003] = "<EOS>"
|
vocab_itos[15003] = "<EOS>"
|
||||||
@ -43,8 +46,6 @@ vocab_stoi = dict()
|
|||||||
for i, token in enumerate(vocab_itos):
|
for i, token in enumerate(vocab_itos):
|
||||||
vocab_stoi[token] = i
|
vocab_stoi[token] = i
|
||||||
|
|
||||||
NGRAMS = 5
|
|
||||||
|
|
||||||
def get_token_id(dataset):
|
def get_token_id(dataset):
|
||||||
token_ids = [vocab_stoi['<PAD>']] * (NGRAMS - 1) + [vocab_stoi['<BOS>']]
|
token_ids = [vocab_stoi['<PAD>']] * (NGRAMS - 1) + [vocab_stoi['<BOS>']]
|
||||||
for token in dataset:
|
for token in dataset:
|
||||||
@ -53,23 +54,22 @@ def get_token_id(dataset):
|
|||||||
except KeyError:
|
except KeyError:
|
||||||
token_ids.append(vocab_stoi['<UNK>'])
|
token_ids.append(vocab_stoi['<UNK>'])
|
||||||
token_ids.append(vocab_stoi['<EOS>'])
|
token_ids.append(vocab_stoi['<EOS>'])
|
||||||
|
|
||||||
return token_ids
|
return token_ids
|
||||||
|
|
||||||
train_ids = get_token_id(corpora_train_tokenized)
|
|
||||||
|
|
||||||
def get_samples(dataset):
|
def get_samples(dataset):
|
||||||
samples = []
|
samples = []
|
||||||
for i in range(len(dataset) - NGRAMS):
|
for i in range(len(dataset) - NGRAMS):
|
||||||
samples.append(dataset[i:i + NGRAMS])
|
samples.append(dataset[i:i + NGRAMS])
|
||||||
|
|
||||||
return samples
|
return samples
|
||||||
|
|
||||||
|
|
||||||
|
train_ids = get_token_id(corpora_train_tokenized)
|
||||||
|
|
||||||
train_ids = get_samples(train_ids)
|
train_ids = get_samples(train_ids)
|
||||||
|
|
||||||
train_ids = torch.tensor(train_ids, device=device)
|
train_ids = torch.tensor(train_ids, device=device)
|
||||||
|
|
||||||
corpora_valid = open(lalka_path_valid).read()
|
corpora_valid = open(lalka_path_valid, encoding="utf8").read()
|
||||||
|
|
||||||
corpora_valid_tokenized = list(word_tokenize(corpora_valid))
|
corpora_valid_tokenized = list(word_tokenize(corpora_valid))
|
||||||
corpora_valid_tokenized = [token.lower() for token in corpora_valid_tokenized]
|
corpora_valid_tokenized = [token.lower() for token in corpora_valid_tokenized]
|
||||||
@ -78,6 +78,7 @@ valid_ids = get_token_id(corpora_valid_tokenized)
|
|||||||
|
|
||||||
valid_ids = torch.tensor(get_samples(valid_ids), dtype=torch.long, device=device)
|
valid_ids = torch.tensor(get_samples(valid_ids), dtype=torch.long, device=device)
|
||||||
|
|
||||||
|
|
||||||
class GRU(torch.nn.Module):
|
class GRU(torch.nn.Module):
|
||||||
|
|
||||||
def __init__(self):
|
def __init__(self):
|
||||||
@ -85,40 +86,30 @@ class GRU(torch.nn.Module):
|
|||||||
self.emb = torch.nn.Embedding(len(vocab_itos), 100)
|
self.emb = torch.nn.Embedding(len(vocab_itos), 100)
|
||||||
self.rec = torch.nn.GRU(100, 256, 1, batch_first=True)
|
self.rec = torch.nn.GRU(100, 256, 1, batch_first=True)
|
||||||
self.fc1 = torch.nn.Linear(256, len(vocab_itos))
|
self.fc1 = torch.nn.Linear(256, len(vocab_itos))
|
||||||
#self.dropout = torch.nn.Dropout(0.5)
|
|
||||||
|
|
||||||
def forward(self, x):
|
def forward(self, x):
|
||||||
emb = self.emb(x)
|
emb = self.emb(x)
|
||||||
#emb = self.dropout(emb)
|
|
||||||
output, h_n = self.rec(emb)
|
output, h_n = self.rec(emb)
|
||||||
hidden = h_n.squeeze(0)
|
hidden = h_n.squeeze(0)
|
||||||
out = self.fc1(hidden)
|
out = self.fc1(hidden)
|
||||||
#out = self.dropout(out)
|
|
||||||
return out
|
return out
|
||||||
|
|
||||||
|
|
||||||
lm = GRU().to(device)
|
lm = GRU().to(device)
|
||||||
|
|
||||||
criterion = torch.nn.CrossEntropyLoss()
|
criterion = torch.nn.CrossEntropyLoss()
|
||||||
|
|
||||||
optimizer = torch.optim.Adam(lm.parameters(), lr=0.0001)
|
optimizer = torch.optim.Adam(lm.parameters(), lr=0.0001)
|
||||||
|
|
||||||
BATCH_SIZE = 128
|
|
||||||
EPOCHS = 15
|
|
||||||
|
|
||||||
def get_ppl(dataset_ids):
|
def get_ppl(dataset_ids):
|
||||||
|
|
||||||
lm.eval()
|
lm.eval()
|
||||||
|
|
||||||
batches = 0
|
batches = 0
|
||||||
loss_sum = 0
|
loss_sum = 0
|
||||||
acc_score = 0
|
|
||||||
|
|
||||||
for i in range(0, len(dataset_ids) - BATCH_SIZE + 1, BATCH_SIZE):
|
for i in range(0, len(dataset_ids) - BATCH_SIZE + 1, BATCH_SIZE):
|
||||||
X = dataset_ids[i:i + BATCH_SIZE, :NGRAMS - 1]
|
X = dataset_ids[i:i + BATCH_SIZE, :NGRAMS - 1]
|
||||||
Y = dataset_ids[i:i + BATCH_SIZE, NGRAMS - 1]
|
Y = dataset_ids[i:i + BATCH_SIZE, NGRAMS - 1]
|
||||||
|
|
||||||
predictions = lm(X)
|
predictions = lm(X)
|
||||||
|
|
||||||
loss = criterion(predictions, Y)
|
loss = criterion(predictions, Y)
|
||||||
loss_sum += loss.item()
|
loss_sum += loss.item()
|
||||||
batches += 1
|
batches += 1
|
||||||
@ -129,13 +120,13 @@ history_ppl_train = []
|
|||||||
history_ppl_valid = []
|
history_ppl_valid = []
|
||||||
|
|
||||||
for epoch in range(EPOCHS):
|
for epoch in range(EPOCHS):
|
||||||
|
|
||||||
batches = 0
|
batches = 0
|
||||||
loss_sum = 0
|
loss_sum = 0
|
||||||
acc_score = 0
|
|
||||||
lm.train()
|
lm.train()
|
||||||
|
total = len(train_ids) - BATCH_SIZE + 1
|
||||||
|
for i in range(0, total, BATCH_SIZE):
|
||||||
|
print('batches: ' + str(batches))
|
||||||
|
|
||||||
for i in tqdm(range(0, len(train_ids)-BATCH_SIZE + 1, BATCH_SIZE)):
|
|
||||||
X = train_ids[i: i + BATCH_SIZE, :NGRAMS - 1]
|
X = train_ids[i: i + BATCH_SIZE, :NGRAMS - 1]
|
||||||
Y = train_ids[i: i + BATCH_SIZE, NGRAMS - 1]
|
Y = train_ids[i: i + BATCH_SIZE, NGRAMS - 1]
|
||||||
|
|
||||||
@ -164,7 +155,6 @@ tokenized = list(word_tokenize('Gości innych nie widział oprócz spółleśnik
|
|||||||
tokenized = [token.lower() for token in tokenized]
|
tokenized = [token.lower() for token in tokenized]
|
||||||
|
|
||||||
ids = []
|
ids = []
|
||||||
|
|
||||||
for word in tokenized:
|
for word in tokenized:
|
||||||
if word in vocab_stoi:
|
if word in vocab_stoi:
|
||||||
ids.append(vocab_stoi[word])
|
ids.append(vocab_stoi[word])
|
||||||
@ -174,9 +164,7 @@ for word in tokenized:
|
|||||||
lm.eval()
|
lm.eval()
|
||||||
|
|
||||||
ids = torch.tensor(ids, dtype=torch.long, device=device)
|
ids = torch.tensor(ids, dtype=torch.long, device=device)
|
||||||
|
|
||||||
preds = lm(ids.unsqueeze(0))
|
preds = lm(ids.unsqueeze(0))
|
||||||
|
|
||||||
vocab_itos[torch.argmax(torch.softmax(preds, 1), 1).item()]
|
vocab_itos[torch.argmax(torch.softmax(preds, 1), 1).item()]
|
||||||
|
|
||||||
tokenized = list(word_tokenize('Lalka'))
|
tokenized = list(word_tokenize('Lalka'))
|
||||||
@ -189,13 +177,13 @@ for word in tokenized:
|
|||||||
ids.append(vocab_stoi[word])
|
ids.append(vocab_stoi[word])
|
||||||
else:
|
else:
|
||||||
ids.append(vocab_stoi['<UNK>'])
|
ids.append(vocab_stoi['<UNK>'])
|
||||||
|
|
||||||
ids = torch.tensor([ids], dtype=torch.long, device=device)
|
ids = torch.tensor([ids], dtype=torch.long, device=device)
|
||||||
|
|
||||||
candidates_number = 10
|
candidates_number = 10
|
||||||
|
|
||||||
for i in range(30):
|
for i in range(30):
|
||||||
preds = lm(ids)
|
preds = lm(ids)
|
||||||
|
|
||||||
candidates = torch.topk(torch.softmax(preds, 1), candidates_number)[1][0].cpu().numpy()
|
candidates = torch.topk(torch.softmax(preds, 1), candidates_number)[1][0].cpu().numpy()
|
||||||
candidate = 15001
|
candidate = 15001
|
||||||
|
|
||||||
@ -205,38 +193,32 @@ for i in range(30):
|
|||||||
print(vocab_itos[candidate])
|
print(vocab_itos[candidate])
|
||||||
ids = torch.cat((ids, torch.tensor([[candidate]], device=device)), 1)
|
ids = torch.cat((ids, torch.tensor([[candidate]], device=device)), 1)
|
||||||
|
|
||||||
with open("dev-0/in.tsv", "r") as dev_path:
|
print('starting outs...')
|
||||||
|
|
||||||
|
with open("dev-0/in.tsv", "r", encoding="UTF-8") as dev_path:
|
||||||
nr_of_dev_lines = len(dev_path.readlines())
|
nr_of_dev_lines = len(dev_path.readlines())
|
||||||
|
|
||||||
with open("test-A/in.tsv", "r") as test_a_path:
|
with open("test-A/in.tsv", "r", encoding="UTF-8") as test_a_path:
|
||||||
nr_of_test_a_lines = len(test_a_path.readlines())
|
nr_of_test_a_lines = len(test_a_path.readlines())
|
||||||
|
|
||||||
with open("dev-0/out.tsv", "w") as out_dev_file:
|
with open("dev-0/out.tsv", "w", encoding="UTF-8") as out_dev_file:
|
||||||
for i in range(nr_of_dev_lines):
|
for i in range(nr_of_dev_lines):
|
||||||
preds = lm(ids)
|
preds = lm(ids)
|
||||||
|
|
||||||
candidates = torch.topk(torch.softmax(preds, 1), candidates_number)[1][0].cpu().numpy()
|
candidates = torch.topk(torch.softmax(preds, 1), candidates_number)[1][0].cpu().numpy()
|
||||||
candidate = 15001
|
candidate = 15001
|
||||||
|
|
||||||
while candidate > 15000:
|
while candidate > 15000:
|
||||||
candidate = candidates[np.random.randint(candidates_number)]
|
candidate = candidates[np.random.randint(candidates_number)]
|
||||||
|
|
||||||
print(vocab_itos[candidate])
|
print(vocab_itos[candidate])
|
||||||
|
|
||||||
ids = torch.cat((ids, torch.tensor([[candidate]], device=device)), 1)
|
ids = torch.cat((ids, torch.tensor([[candidate]], device=device)), 1)
|
||||||
out_dev_file.write(vocab_itos[candidate] + '\n')
|
out_dev_file.write(vocab_itos[candidate] + '\n')
|
||||||
|
|
||||||
with open("test-A/out.tsv", "w") as out_test_file:
|
with open("test-A/out.tsv", "w", encoding="UTF-8") as out_test_file:
|
||||||
for i in range(nr_of_dev_lines):
|
for i in range(nr_of_dev_lines):
|
||||||
preds = lm(ids)
|
preds = lm(ids)
|
||||||
|
|
||||||
candidates = torch.topk(torch.softmax(preds, 1), candidates_number)[1][0].cpu().numpy()
|
candidates = torch.topk(torch.softmax(preds, 1), candidates_number)[1][0].cpu().numpy()
|
||||||
candidate = 15001
|
candidate = 15001
|
||||||
|
|
||||||
while candidate > 15000:
|
while candidate > 15000:
|
||||||
candidate = candidates[np.random.randint(candidates_number)]
|
candidate = candidates[np.random.randint(candidates_number)]
|
||||||
|
|
||||||
print(vocab_itos[candidate])
|
print(vocab_itos[candidate])
|
||||||
|
|
||||||
ids = torch.cat((ids, torch.tensor([[candidate]], device=device)), 1)
|
ids = torch.cat((ids, torch.tensor([[candidate]], device=device)), 1)
|
||||||
out_test_file.write(vocab_itos[candidate] + '\n')
|
out_test_file.write(vocab_itos[candidate] + '\n')
|
782
test-A/out.tsv
782
test-A/out.tsv
@ -1,471 +1,471 @@
|
|||||||
|
)
|
||||||
|
.
|
||||||
|
do
|
||||||
|
nas
|
||||||
|
po
|
||||||
|
do
|
||||||
|
domu
|
||||||
|
.
|
||||||
|
panna
|
||||||
|
felicja
|
||||||
|
?
|
||||||
|
na
|
||||||
|
nią
|
||||||
|
do
|
||||||
|
mnie
|
||||||
|
,
|
||||||
|
i
|
||||||
|
co
|
||||||
|
i
|
||||||
|
jeszcze
|
||||||
|
i
|
||||||
|
do
|
||||||
|
głowy
|
||||||
|
do
|
||||||
|
niego
|
||||||
|
?
|
||||||
|
ale
|
||||||
|
jeżeli
|
||||||
,
|
,
|
||||||
ale
|
ale
|
||||||
nie
|
nie
|
||||||
mam
|
mam
|
||||||
.
|
mnie
|
||||||
ale
|
|
||||||
o
|
|
||||||
on
|
|
||||||
,
|
,
|
||||||
czy
|
|
||||||
,
|
|
||||||
co
|
|
||||||
on
|
|
||||||
do
|
|
||||||
głowy
|
|
||||||
.
|
|
||||||
na
|
|
||||||
jego
|
|
||||||
.
|
|
||||||
pan
|
|
||||||
i
|
i
|
||||||
od
|
już
|
||||||
czasu
|
|
||||||
do
|
|
||||||
domu
|
|
||||||
od
|
|
||||||
dawna
|
|
||||||
;
|
|
||||||
ale
|
|
||||||
co
|
|
||||||
do
|
|
||||||
pani
|
|
||||||
i
|
i
|
||||||
do
|
ja
|
||||||
nich
|
|
||||||
nie
|
|
||||||
było
|
|
||||||
do
|
|
||||||
domu
|
|
||||||
;
|
|
||||||
potem
|
|
||||||
mu
|
|
||||||
do
|
|
||||||
głowy
|
|
||||||
?
|
|
||||||
ale
|
|
||||||
o
|
|
||||||
czym
|
|
||||||
;
|
|
||||||
potem
|
|
||||||
do
|
do
|
||||||
niego
|
niego
|
||||||
|
na
|
||||||
|
głowie
|
||||||
|
.
|
||||||
|
panna
|
||||||
|
felicja
|
||||||
|
i
|
||||||
|
ja
|
||||||
.
|
.
|
||||||
pan
|
pan
|
||||||
i
|
ma
|
||||||
nawet
|
|
||||||
o
|
|
||||||
do
|
do
|
||||||
domu
|
domu
|
||||||
:
|
:
|
||||||
od
|
ale
|
||||||
niej
|
,
|
||||||
nie
|
nie
|
||||||
|
jestem
|
||||||
|
nie
|
||||||
|
mam
|
||||||
|
i
|
||||||
|
nie
|
||||||
|
,
|
||||||
|
na
|
||||||
|
którym
|
||||||
|
na
|
||||||
|
jego
|
||||||
|
pokoju
|
||||||
|
)
|
||||||
|
i
|
||||||
|
bez
|
||||||
|
i
|
||||||
|
do
|
||||||
|
paryża
|
||||||
|
na
|
||||||
|
myśl
|
||||||
|
,
|
||||||
|
gdzie
|
||||||
.
|
.
|
||||||
|
panna
|
||||||
|
nie
|
||||||
|
na
|
||||||
|
lewo
|
||||||
|
i
|
||||||
|
na
|
||||||
|
mnie
|
||||||
|
nie
|
||||||
|
,
|
||||||
|
który
|
||||||
|
i
|
||||||
nawet
|
nawet
|
||||||
od
|
nie
|
||||||
czasu
|
będzie
|
||||||
od
|
;
|
||||||
|
nie
|
||||||
|
było
|
||||||
|
mu
|
||||||
|
do
|
||||||
|
mieszkania
|
||||||
|
do
|
||||||
|
paryża
|
||||||
|
i
|
||||||
|
o
|
||||||
|
czym
|
||||||
|
do
|
||||||
niego
|
niego
|
||||||
na
|
na
|
||||||
niego
|
myśl
|
||||||
|
.
|
||||||
|
panna
|
||||||
|
na
|
||||||
|
kilka
|
||||||
|
i
|
||||||
|
o
|
||||||
|
mnie
|
||||||
|
na
|
||||||
|
co
|
||||||
|
i
|
||||||
|
o
|
||||||
|
co
|
||||||
|
na
|
||||||
|
jego
|
||||||
|
?
|
||||||
|
i
|
||||||
do
|
do
|
||||||
domu
|
końca
|
||||||
|
.
|
||||||
|
i
|
||||||
|
nie
|
||||||
|
mam
|
||||||
|
nie
|
||||||
|
mam
|
||||||
|
nie
|
||||||
|
o
|
||||||
|
,
|
||||||
|
który
|
||||||
|
do
|
||||||
|
końca
|
||||||
|
do
|
||||||
|
czasu
|
||||||
|
:
|
||||||
|
i
|
||||||
|
jeszcze
|
||||||
|
,
|
||||||
|
na
|
||||||
|
niego
|
||||||
|
,
|
||||||
|
nie
|
||||||
|
można
|
||||||
|
:
|
||||||
i
|
i
|
||||||
jeszcze
|
jeszcze
|
||||||
i
|
i
|
||||||
nawet
|
|
||||||
:
|
|
||||||
ale
|
|
||||||
na
|
na
|
||||||
nią
|
chwilę
|
||||||
:
|
i
|
||||||
czy
|
|
||||||
na
|
na
|
||||||
lewo
|
lewo
|
||||||
,
|
:
|
||||||
a
|
|
||||||
na
|
na
|
||||||
niego
|
niego
|
||||||
nie
|
?
|
||||||
było
|
do
|
||||||
.
|
mnie
|
||||||
|
do
|
||||||
|
mnie
|
||||||
i
|
i
|
||||||
|
nie
|
||||||
|
mógł
|
||||||
o
|
o
|
||||||
co
|
nich
|
||||||
na
|
|
||||||
nią
|
|
||||||
.
|
|
||||||
na
|
|
||||||
drugim
|
|
||||||
do
|
|
||||||
niej
|
|
||||||
;
|
|
||||||
lecz
|
|
||||||
nawet
|
|
||||||
do
|
|
||||||
mnie
|
|
||||||
;
|
|
||||||
i
|
i
|
||||||
on
|
|
||||||
do
|
do
|
||||||
mnie
|
panny
|
||||||
i
|
,
|
||||||
nie
|
nie
|
||||||
|
mógł
|
||||||
|
o
|
||||||
|
nim
|
||||||
|
i
|
||||||
do
|
do
|
||||||
paryża
|
końca
|
||||||
|
;
|
||||||
|
i
|
||||||
|
ja
|
||||||
|
go
|
||||||
|
pan
|
||||||
:
|
:
|
||||||
od
|
czy
|
||||||
|
,
|
||||||
|
który
|
||||||
|
?
|
||||||
|
)
|
||||||
nie
|
nie
|
||||||
jest
|
jestem
|
||||||
|
go
|
||||||
i
|
i
|
||||||
na
|
na
|
||||||
myśl
|
myśl
|
||||||
do
|
;
|
||||||
paryża
|
nawet
|
||||||
,
|
|
||||||
co
|
|
||||||
,
|
|
||||||
bo
|
|
||||||
i
|
|
||||||
jeszcze
|
|
||||||
,
|
|
||||||
ażeby
|
|
||||||
mu
|
|
||||||
do
|
|
||||||
pani
|
|
||||||
:
|
|
||||||
potem
|
|
||||||
:
|
|
||||||
na
|
|
||||||
prawo
|
|
||||||
i
|
|
||||||
nie
|
nie
|
||||||
można
|
można
|
||||||
na
|
na
|
||||||
lewo
|
mnie
|
||||||
|
nie
|
||||||
|
będzie
|
||||||
,
|
,
|
||||||
ażeby
|
co
|
||||||
|
na
|
||||||
|
kilka
|
||||||
|
do
|
||||||
|
niego
|
||||||
|
i
|
||||||
|
o
|
||||||
|
co
|
||||||
|
najmniej
|
||||||
|
nie
|
||||||
|
może
|
||||||
|
;
|
||||||
|
i
|
||||||
o
|
o
|
||||||
czym
|
czym
|
||||||
:
|
:
|
||||||
czy
|
czy
|
||||||
pan
|
co
|
||||||
jest
|
nie
|
||||||
od
|
|
||||||
nas
|
|
||||||
od
|
|
||||||
powietrza
|
|
||||||
?
|
|
||||||
i
|
|
||||||
pan
|
|
||||||
,
|
,
|
||||||
ażeby
|
a
|
||||||
na
|
ja
|
||||||
nim
|
go
|
||||||
.
|
i
|
||||||
|
jeszcze
|
||||||
|
:
|
||||||
|
)
|
||||||
|
:
|
||||||
ale
|
ale
|
||||||
o
|
o
|
||||||
nim
|
,
|
||||||
|
nie
|
||||||
|
można
|
||||||
|
na
|
||||||
|
mnie
|
||||||
|
i
|
||||||
|
do
|
||||||
|
pani
|
||||||
|
baronowa
|
||||||
|
;
|
||||||
|
na
|
||||||
|
co
|
||||||
|
na
|
||||||
|
kilka
|
||||||
.
|
.
|
||||||
|
po
|
||||||
|
chwili
|
||||||
|
do
|
||||||
|
niego
|
||||||
|
:
|
||||||
|
po
|
||||||
|
,
|
||||||
|
nie
|
||||||
|
ma
|
||||||
|
,
|
||||||
|
ale
|
||||||
|
po
|
||||||
|
do
|
||||||
|
pokoju
|
||||||
|
do
|
||||||
|
mnie
|
||||||
|
;
|
||||||
|
nie
|
||||||
na
|
na
|
||||||
lewo
|
lewo
|
||||||
od
|
:
|
||||||
niego
|
na
|
||||||
;
|
głowie
|
||||||
|
,
|
||||||
|
a
|
||||||
|
po
|
||||||
|
południu
|
||||||
i
|
i
|
||||||
nie
|
nie
|
||||||
jest
|
będę
|
||||||
do
|
|
||||||
niego
|
|
||||||
nie
|
|
||||||
do
|
|
||||||
czasu
|
|
||||||
na
|
|
||||||
myśl
|
|
||||||
,
|
|
||||||
o
|
|
||||||
na
|
|
||||||
mnie
|
|
||||||
?
|
|
||||||
,
|
|
||||||
nie
|
|
||||||
ma
|
|
||||||
i
|
|
||||||
nie
|
nie
|
||||||
może
|
może
|
||||||
o
|
o
|
||||||
pani
|
dziesiątej
|
||||||
|
.
|
||||||
|
na
|
||||||
|
jego
|
||||||
|
i
|
||||||
|
jeszcze
|
||||||
|
do
|
||||||
|
czasu
|
||||||
|
;
|
||||||
|
a
|
||||||
|
gdy
|
||||||
|
nie
|
||||||
|
będzie
|
||||||
|
?
|
||||||
|
o
|
||||||
|
jej
|
||||||
|
nie
|
||||||
|
było
|
||||||
|
?
|
||||||
|
ale
|
||||||
|
na
|
||||||
|
kilka
|
||||||
|
na
|
||||||
|
kilka
|
||||||
|
.
|
||||||
|
po
|
||||||
|
nie
|
||||||
|
może
|
||||||
|
,
|
||||||
|
nie
|
||||||
|
jest
|
||||||
|
i
|
||||||
|
o
|
||||||
|
co
|
||||||
|
na
|
||||||
|
mnie
|
||||||
|
:
|
||||||
|
czy
|
||||||
|
nie
|
||||||
|
może
|
||||||
|
nie
|
||||||
|
będzie
|
||||||
|
o
|
||||||
|
nim
|
||||||
|
;
|
||||||
|
nawet
|
||||||
|
nie
|
||||||
|
jest
|
||||||
|
o
|
||||||
|
co
|
||||||
|
,
|
||||||
|
bo
|
||||||
|
,
|
||||||
|
a
|
||||||
|
nawet
|
||||||
|
na
|
||||||
|
jego
|
||||||
|
,
|
||||||
|
ażeby
|
||||||
|
,
|
||||||
|
na
|
||||||
|
których
|
||||||
|
i
|
||||||
|
co
|
||||||
|
.
|
||||||
|
po
|
||||||
|
nie
|
||||||
|
będzie
|
||||||
|
mnie
|
||||||
|
:
|
||||||
|
ale
|
||||||
|
o
|
||||||
|
jej
|
||||||
|
nie
|
||||||
|
jest
|
||||||
|
i
|
||||||
|
o
|
||||||
|
:
|
||||||
|
co
|
||||||
|
.
|
||||||
|
)
|
||||||
|
do
|
||||||
|
paryża
|
||||||
|
.
|
||||||
|
ale
|
||||||
|
czy
|
||||||
|
co
|
||||||
|
na
|
||||||
|
nich
|
||||||
|
;
|
||||||
|
a
|
||||||
|
nie
|
||||||
|
będzie
|
||||||
|
.
|
||||||
|
a
|
||||||
|
co
|
||||||
|
nie
|
||||||
|
mam
|
||||||
|
nie
|
||||||
|
mam
|
||||||
|
nie
|
||||||
|
.
|
||||||
|
a
|
||||||
|
co
|
||||||
|
.
|
||||||
|
panna
|
||||||
|
do
|
||||||
|
nas
|
||||||
|
i
|
||||||
|
nie
|
||||||
|
będzie
|
||||||
|
i
|
||||||
|
co
|
||||||
|
nie
|
||||||
|
było
|
||||||
|
.
|
||||||
|
nie
|
||||||
|
na
|
||||||
|
nią
|
||||||
|
i
|
||||||
|
bez
|
||||||
|
panny
|
||||||
|
izabeli
|
||||||
|
i
|
||||||
|
na
|
||||||
|
nią
|
||||||
|
nie
|
||||||
,
|
,
|
||||||
ale
|
ale
|
||||||
jeszcze
|
jeszcze
|
||||||
od
|
|
||||||
nie
|
nie
|
||||||
było
|
można
|
||||||
do
|
do
|
||||||
paryża
|
głowy
|
||||||
i
|
|
||||||
o
|
|
||||||
pani
|
|
||||||
?
|
?
|
||||||
i
|
|
||||||
o
|
o
|
||||||
mnie
|
|
||||||
,
|
,
|
||||||
nie
|
a
|
||||||
mam
|
|
||||||
na
|
|
||||||
mnie
|
|
||||||
,
|
|
||||||
jak
|
|
||||||
pan
|
|
||||||
od
|
|
||||||
mnie
|
|
||||||
na
|
|
||||||
myśl
|
|
||||||
i
|
|
||||||
nawet
|
nawet
|
||||||
:
|
nie
|
||||||
ale
|
będzie
|
||||||
na
|
do
|
||||||
niego
|
mnie
|
||||||
na
|
|
||||||
prawo
|
|
||||||
od
|
|
||||||
czasu
|
|
||||||
do
|
do
|
||||||
nas
|
nas
|
||||||
do
|
do
|
||||||
panny
|
końca
|
||||||
|
nie
|
||||||
.
|
.
|
||||||
ja
|
panna
|
||||||
po
|
|
||||||
odejściu
|
|
||||||
?
|
|
||||||
,
|
|
||||||
o
|
|
||||||
mnie
|
|
||||||
na
|
na
|
||||||
nią
|
niego
|
||||||
:
|
|
||||||
co
|
|
||||||
nie
|
|
||||||
może
|
|
||||||
być
|
|
||||||
i
|
|
||||||
ja
|
|
||||||
od
|
|
||||||
niej
|
|
||||||
?
|
|
||||||
od
|
|
||||||
nie
|
|
||||||
było
|
|
||||||
na
|
|
||||||
nich
|
|
||||||
i
|
|
||||||
jego
|
|
||||||
do
|
|
||||||
domu
|
|
||||||
nie
|
|
||||||
do
|
|
||||||
pani
|
|
||||||
.
|
|
||||||
na
|
|
||||||
mnie
|
|
||||||
,
|
|
||||||
a
|
|
||||||
on
|
|
||||||
i
|
|
||||||
nie
|
|
||||||
,
|
|
||||||
na
|
|
||||||
nim
|
|
||||||
?
|
|
||||||
a
|
|
||||||
potem
|
|
||||||
i
|
|
||||||
na
|
|
||||||
nim
|
|
||||||
.
|
|
||||||
ja
|
|
||||||
na
|
|
||||||
nią
|
|
||||||
?
|
|
||||||
a
|
|
||||||
,
|
|
||||||
który
|
|
||||||
na
|
|
||||||
mnie
|
|
||||||
;
|
;
|
||||||
potem
|
|
||||||
do
|
|
||||||
mnie
|
|
||||||
i
|
i
|
||||||
od
|
|
||||||
czasu
|
|
||||||
od
|
|
||||||
niego
|
|
||||||
.
|
|
||||||
a
|
|
||||||
potem
|
|
||||||
o
|
o
|
||||||
nim
|
jej
|
||||||
do
|
|
||||||
niego
|
|
||||||
i
|
|
||||||
na
|
|
||||||
nim
|
|
||||||
do
|
|
||||||
mnie
|
|
||||||
.
|
|
||||||
a
|
|
||||||
jeżeli
|
|
||||||
pan
|
|
||||||
,
|
|
||||||
czy
|
|
||||||
pan
|
|
||||||
,
|
|
||||||
o
|
o
|
||||||
ile
|
dziesiątej
|
||||||
:
|
|
||||||
o
|
|
||||||
nie
|
|
||||||
,
|
|
||||||
nie
|
|
||||||
było
|
|
||||||
.
|
.
|
||||||
a
|
|
||||||
ja
|
|
||||||
na
|
|
||||||
nią
|
|
||||||
na
|
|
||||||
prawo
|
|
||||||
od
|
|
||||||
mnie
|
|
||||||
:
|
|
||||||
i
|
|
||||||
jeszcze
|
|
||||||
nie
|
|
||||||
do
|
|
||||||
mnie
|
|
||||||
?
|
|
||||||
a
|
|
||||||
on
|
|
||||||
o
|
|
||||||
nim
|
|
||||||
do
|
|
||||||
domu
|
|
||||||
?
|
|
||||||
ale
|
|
||||||
ja
|
|
||||||
mu
|
|
||||||
nie
|
|
||||||
na
|
|
||||||
prawo
|
|
||||||
nie
|
|
||||||
było
|
|
||||||
na
|
|
||||||
jego
|
|
||||||
,
|
|
||||||
i
|
|
||||||
ja
|
|
||||||
go
|
|
||||||
i
|
|
||||||
nie
|
|
||||||
jest
|
|
||||||
,
|
|
||||||
ażeby
|
|
||||||
na
|
|
||||||
niego
|
|
||||||
do
|
|
||||||
pani
|
|
||||||
.
|
|
||||||
ale
|
|
||||||
i
|
|
||||||
cóż
|
|
||||||
?
|
|
||||||
i
|
|
||||||
pan
|
|
||||||
?
|
|
||||||
,
|
|
||||||
czy
|
|
||||||
o
|
|
||||||
mnie
|
|
||||||
:
|
|
||||||
na
|
|
||||||
prawo
|
|
||||||
i
|
|
||||||
jeszcze
|
|
||||||
,
|
|
||||||
co
|
|
||||||
do
|
|
||||||
paryża
|
|
||||||
nie
|
|
||||||
na
|
|
||||||
.
|
|
||||||
nie
|
|
||||||
jest
|
|
||||||
na
|
|
||||||
prawo
|
|
||||||
?
|
|
||||||
pan
|
|
||||||
,
|
|
||||||
i
|
|
||||||
pan
|
|
||||||
na
|
|
||||||
nią
|
|
||||||
.
|
|
||||||
ale
|
|
||||||
po
|
|
||||||
mnie
|
|
||||||
?
|
|
||||||
do
|
|
||||||
domu
|
|
||||||
nie
|
|
||||||
na
|
|
||||||
niego
|
|
||||||
do
|
|
||||||
głowy
|
|
||||||
;
|
|
||||||
ale
|
|
||||||
co
|
|
||||||
mi
|
|
||||||
o
|
|
||||||
mnie
|
|
||||||
.
|
|
||||||
na
|
|
||||||
prawo
|
|
||||||
.
|
|
||||||
a
|
|
||||||
jeżeli
|
|
||||||
go
|
|
||||||
o
|
|
||||||
nie
|
|
||||||
na
|
|
||||||
prawo
|
|
||||||
od
|
|
||||||
dawna
|
|
||||||
do
|
|
||||||
paryża
|
|
||||||
nie
|
|
||||||
.
|
|
||||||
a
|
|
||||||
nawet
|
|
||||||
mnie
|
|
||||||
?
|
|
||||||
na
|
|
||||||
prawo
|
|
||||||
?
|
|
||||||
na
|
|
||||||
nią
|
|
||||||
:
|
|
||||||
na
|
|
||||||
nim
|
|
||||||
,
|
|
||||||
co
|
|
||||||
na
|
|
||||||
jego
|
|
||||||
nie
|
nie
|
||||||
ma
|
ma
|
||||||
;
|
|
||||||
i
|
i
|
||||||
|
ja
|
||||||
|
na
|
||||||
|
kilka
|
||||||
|
minut
|
||||||
|
?
|
||||||
|
ale
|
||||||
|
czy
|
||||||
|
ja
|
||||||
|
.
|
||||||
|
ale
|
||||||
|
ja
|
||||||
|
do
|
||||||
|
niej
|
||||||
|
do
|
||||||
|
końca
|
||||||
|
i
|
||||||
|
po
|
||||||
|
do
|
||||||
|
panny
|
||||||
|
,
|
||||||
|
nie
|
||||||
|
można
|
||||||
|
na
|
||||||
|
niego
|
||||||
|
|
3572
train/train_test.tsv
3572
train/train_test.tsv
File diff suppressed because it is too large
Load Diff
14290
train/train_train.tsv
14290
train/train_train.tsv
File diff suppressed because it is too large
Load Diff
Loading…
Reference in New Issue
Block a user