Compare commits

...

1 Commits

Author SHA1 Message Date
Mateusz Kociszewski
97c8565777 Zadanie RNN 2021-06-22 22:02:24 +02:00
5 changed files with 10151 additions and 0 deletions

248
Untitled.py Normal file
View File

@ -0,0 +1,248 @@
#!/usr/bin/env python
# coding: utf-8
# In[ ]:
import nltk
from nltk.tokenize import word_tokenize
import torch
from tqdm.notebook import tqdm
from sklearn.model_selection import train_test_split
import numpy as np
nltk.download('punkt')
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
print('Using {} device'.format(device))
with open("train/train.tsv", "r", encoding='utf-8') as lalka_path:
lines = lalka_path.readlines()
train, test = train_test_split(lines, test_size = 0.2)
with open("train/train_train.tsv", "w", encoding='utf-8') as out_train_file:
for i in train:
out_train_file.write(i)
with open("train/train_test.tsv", "w", encoding='utf-8') as out_test_file:
for i in test:
out_test_file.write(i)
lalka_path_train= 'train/train_train.tsv'
lalka_path_valid= 'train/train_test.tsv'
corpora_train = open(lalka_path_train, encoding='utf-8').read()
corpora_train_tokenized = list(word_tokenize(corpora_train))
corpora_train_tokenized = [token.lower() for token in corpora_train_tokenized]
vocab_itos = sorted(set(corpora_train_tokenized))
print(len(vocab_itos))
vocab_itos = vocab_itos[:15005]
vocab_itos[15001] = "<UNK>"
vocab_itos[15002] = "<BOS>"
vocab_itos[15003] = "<EOS>"
vocab_itos[15004] = "<PAD>"
print(len(vocab_itos))
vocab_stoi = dict()
for i, token in enumerate(vocab_itos):
vocab_stoi[token] = i
NGRAMS = 5
def get_token_id(dataset):
token_ids = [vocab_stoi['<PAD>']] * (NGRAMS-1) + [vocab_stoi['<BOS>']]
for token in dataset:
try:
token_ids.append(vocab_stoi[token])
except KeyError:
token_ids.append(vocab_stoi['<UNK>'])
token_ids.append(vocab_stoi['<EOS>'])
return token_ids
train_ids = get_token_id(corpora_train_tokenized)
def get_samples(dataset):
samples = []
for i in range(len(dataset)-NGRAMS):
samples.append(dataset[i:i+NGRAMS])
return samples
train_ids = get_samples(train_ids)
train_ids = torch.tensor(train_ids, device = device)
corpora_valid = open(lalka_path_valid, encoding='utf-8').read()
corpora_valid_tokenized = list(word_tokenize(corpora_valid))
corpora_valid_tokenized = [token.lower() for token in corpora_valid_tokenized]
valid_ids = get_token_id(corpora_valid_tokenized)
valid_ids = torch.tensor(get_samples(valid_ids), dtype = torch.long, device = device)
class GRU(torch.nn.Module):
def __init__(self):
super(GRU, self).__init__()
self.emb = torch.nn.Embedding(len(vocab_itos),100)
self.rec = torch.nn.GRU(100, 256, 1, batch_first = True)
self.fc1 = torch.nn.Linear( 256 ,len(vocab_itos))
self.dropout = torch.nn.Dropout(0.5)
def forward(self, x):
emb = self.emb(x)
#emb = self.dropout(emb)
output, h_n = self.rec(emb)
hidden = h_n.squeeze(0)
out = self.fc1(hidden)
out = self.dropout(out)
return out
lm = GRU().to(device)
criterion = torch.nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(lm.parameters(),lr=0.0001)
BATCH_SIZE = 128
EPOCHS = 15
def get_ppl(dataset_ids):
lm.eval()
batches = 0
loss_sum =0
acc_score = 0
for i in range(0, len(dataset_ids)-BATCH_SIZE+1, BATCH_SIZE):
X = dataset_ids[i:i+BATCH_SIZE,:NGRAMS-1]
Y = dataset_ids[i:i+BATCH_SIZE,NGRAMS-1]
predictions = lm(X)
# equally distributted
# predictions = torch.zeros_like(predictions)
loss = criterion(predictions,Y)
loss_sum += loss.item()
batches += 1
return np.exp(loss_sum / batches)
history_ppl_train = []
history_ppl_valid = []
for epoch in range(EPOCHS):
batches = 0
loss_sum =0
acc_score = 0
lm.train()
#for i in range(0, len(train_ids)-BATCH_SIZE+1, BATCH_SIZE):
for i in tqdm(range(0, len(train_ids)-BATCH_SIZE+1, BATCH_SIZE)):
X = train_ids[i:i+BATCH_SIZE,:NGRAMS-1]
Y = train_ids[i:i+BATCH_SIZE,NGRAMS-1]
predictions = lm(X)
loss = criterion(predictions,Y)
optimizer.zero_grad()
loss.backward()
optimizer.step()
loss_sum += loss.item()
batches += 1
ppl_train = get_ppl(train_ids)
ppl_valid = get_ppl(valid_ids)
history_ppl_train.append(ppl_train)
history_ppl_valid.append(ppl_valid)
print('epoch: ', epoch)
print('train ppl: ', ppl_train)
print('valid ppl: ', ppl_valid)
print()
tokenized = list(word_tokenize('Gości innych nie widział oprócz spółleśników'))
tokenized = [token.lower() for token in tokenized]
ids = []
for word in tokenized:
if word in vocab_stoi:
ids.append(vocab_stoi[word])
else:
ids.append(vocab_stoi['<UNK>'])
lm.eval()
ids = torch.tensor(ids, dtype = torch.long, device = device)
preds= lm(ids.unsqueeze(0))
vocab_itos[torch.argmax(torch.softmax(preds,1),1).item()]
tokenized = list(word_tokenize('Lalka'))
tokenized = [token.lower() for token in tokenized]
ids = []
for word in tokenized:
if word in vocab_stoi:
ids.append(vocab_stoi[word])
else:
ids.append(vocab_stoi['<UNK>'])
ids = torch.tensor([ids], dtype = torch.long, device = device)
candidates_number = 10
for i in range(30):
preds= lm(ids)
candidates = torch.topk(torch.softmax(preds,1),candidates_number)[1][0].cpu().numpy()
candidate = 15001
while candidate > 15000:
candidate = candidates[np.random.randint(candidates_number)]
print(vocab_itos[candidate])
ids = torch.cat((ids, torch.tensor([[candidate]], device = device)), 1)
with open("dev-0/in.tsv", "r", encoding='utf-8') as dev_path:
nr_of_dev_lines = len(dev_path.readlines())
with open("test-A/in.tsv", "r", encoding='utf-8') as test_a_path:
nr_of_test_a_lines = len(test_a_path.readlines())
with open("dev-0/out.tsv", "w", encoding='utf-8') as out_dev_file:
for i in range(nr_of_dev_lines):
preds= lm(ids)
candidates = torch.topk(torch.softmax(preds,1),candidates_number)[1][0].cpu().numpy()
candidate = 15001
while candidate > 15000:
candidate = candidates[np.random.randint(candidates_number)]
print(vocab_itos[candidate])
ids = torch.cat((ids, torch.tensor([[candidate]], device = device)), 1)
out_dev_file.write(vocab_itos[candidate] + '\n')
with open("test-A/out.tsv", "w", encoding='utf-8') as out_test_file:
for i in range(nr_of_dev_lines):
preds= lm(ids)
candidates = torch.topk(torch.softmax(preds,1),candidates_number)[1][0].cpu().numpy()
candidate = 15001
while candidate > 15000:
candidate = candidates[np.random.randint(candidates_number)]
print(vocab_itos[candidate])
ids = torch.cat((ids, torch.tensor([[candidate]], device = "cuda")), 1)
out_test_file.write(vocab_itos[candidate] + '\n')
# In[10]:
get_ipython().system('pip install ipywidgets')
# In[12]:
get_ipython().system('pip install notebook --upgrade ')
# In[14]:
get_ipython().system('jupyter nbextension enable --py widgetsnbextension')
# In[ ]:

471
dev-0/out.tsv Normal file
View File

@ -0,0 +1,471 @@
na
,
jak
ja
.
po
cóż
,
na
której
!
o
i
nawet
już
na
mnie
.
panna
,
czy
jeszcze
nie
jest
na
niego
nie
.
,
nie
na
mnie
nie
o
czym
od
dwudziestu
na
nią
.
,
a
na
jego
nie
i
po
co
.
pan
,
panie
?
,
a
i
nawet
nie
było
,
nie
mógł
od
.
po
co
.
na
lewo
i
nie
,
i
ja
mam
do
końca
!
nie
o
mnie
.
na
chwilę
o
mnie
nie
do
paryża
i
po
chwili
od
niego
:
nie
,
co
pan
ignacy
!
,
a
do
końca
,
kiedy
pan
do
pani
,
która
go
nie
jest
bardzo
?
do
i
nawet
,
ażeby
go
:
,
ale
nawet
nie
na
mnie
?
po
o
jej
nie
ma
do
domu
,
ażeby
mnie
,
na
której
;
już
mi
na
,
ale
gdyby
nawet
i
nie
,
o
czym
,
co
na
obiad
;
a
gdy
już
o
.
i
ja
,
a
do
jego
i
mówi
na
,
ażeby
:
pani
małgorzata
do
panny
,
nie
mogła
,
ażeby
mnie
!
co
do
domu
;
na
mnie
?
i
nie
jest
mnie
!
na
mnie
od
.
,
a
on
już
o
panu
nie
na
do
i
o
jej
nie
na
co
!
,
nie
mógł
,
co
nawet
nie
.
nawet
po
francusku
nie
było
?
o
co
do
nas
!
na
jej
!
o
.
.
gdy
i
,
co
mu
nie
było
do
nas
?
nie
jest
?
a
potem
na
jej
:
co
pan
?
)
do
niej
i
po
chwili
,
bo
,
nie
jest
kobietą
!
)
?
na
i
ja
po
na
co
?
i
jak
mnie
.
panna
izabela
do
.
,
jeżeli
o
,
ale
o
co
do
mnie
i
o
nim
,
a
i
jego
już
.
ale
na
nią
na
miejscu
do
i
po
co
dzień
?
i
nawet
,
a
i
jej
.
o
ile
mu
bardzo
o
nie
,
na
co
i
,
i
nareszcie
go
już
od
,
na
mnie
na
i
na
jej
,
a
potem
i
jego
drzwi
na
powrót
:
,
ale
on
.
ale
na
niego
do
panny
izabeli
.
po
nie
,
co
na
jego
!
nie
jest
i
na
.
,
nie
był
nie
mam
do
nas
.
na
,
ażeby
go
do
.
i
dopiero
.
ale
czy
do
,
a
ja
do
panny
;
ale
nie
może
pan
do
pani
;
i
ja
do
mnie
do
drzwi
,
a
pan
mnie
:
co
pan
ignacy
.
i
ja
go
.
pan
,
i
nie
ma
.
od
nas
i
już
o
mnie
.
czy
ja
na
niego
i
na
mnie
na
i
nie
jest
o
.
a
pani
baronowa
i
1 na
2 ,
3 jak
4 ja
5 .
6 po
7 cóż
8 ,
9 na
10 której
11 !
12 o
13 i
14 nawet
15 już
16 na
17 mnie
18 .
19 panna
20 ,
21 czy
22 jeszcze
23 nie
24 jest
25 na
26 niego
27 nie
28 .
29 ,
30 nie
31 na
32 mnie
33 nie
34 o
35 czym
36 od
37 dwudziestu
38 na
39 nią
40 .
41 ,
42 a
43 na
44 jego
45 nie
46 i
47 po
48 co
49 .
50 pan
51 ,
52 panie
53 ?
54 ,
55 a
56 i
57 nawet
58 nie
59 było
60 ,
61 nie
62 mógł
63 od
64 .
65 po
66 co
67 .
68 na
69 lewo
70 i
71 nie
72 ,
73 i
74 ja
75 mam
76 do
77 końca
78 !
79 nie
80 o
81 mnie
82 .
83 na
84 chwilę
85 o
86 mnie
87 nie
88 do
89 paryża
90 i
91 po
92 chwili
93 od
94 niego
95 :
96 nie
97 ,
98 co
99 pan
100 ignacy
101 !
102 ,
103 a
104 do
105 końca
106 ,
107 kiedy
108 pan
109 do
110 pani
111 ,
112 która
113 go
114 nie
115 jest
116 bardzo
117 ?
118 do
119 i
120 nawet
121 ,
122 ażeby
123 go
124 :
125 ,
126 ale
127 nawet
128 nie
129 na
130 mnie
131 ?
132 po
133 o
134 jej
135 nie
136 ma
137 do
138 domu
139 ,
140 ażeby
141 mnie
142 ,
143 na
144 której
145 ;
146 już
147 mi
148 na
149 ,
150 ale
151 gdyby
152 nawet
153 i
154 nie
155 ,
156 o
157 czym
158 ,
159 co
160 na
161 obiad
162 ;
163 a
164 gdy
165 już
166 o
167 .
168 i
169 ja
170 ,
171 a
172 do
173 jego
174 i
175 mówi
176 na
177 ,
178 ażeby
179 :
180 pani
181 małgorzata
182 do
183 panny
184 ,
185 nie
186 mogła
187 ,
188 ażeby
189 mnie
190 !
191 co
192 do
193 domu
194 ;
195 na
196 mnie
197 ?
198 i
199 nie
200 jest
201 mnie
202 !
203 na
204 mnie
205 od
206 .
207 ,
208 a
209 on
210 już
211 o
212 panu
213 nie
214 na
215 do
216 i
217 o
218 jej
219 nie
220 na
221 co
222 !
223 ,
224 nie
225 mógł
226 ,
227 co
228 nawet
229 nie
230 .
231 nawet
232 po
233 francusku
234 nie
235 było
236 ?
237 o
238 co
239 do
240 nas
241 !
242 na
243 jej
244 !
245 o
246 .
247 .
248 gdy
249 i
250 ,
251 co
252 mu
253 nie
254 było
255 do
256 nas
257 ?
258 nie
259 jest
260 ?
261 a
262 potem
263 na
264 jej
265 :
266 co
267 pan
268 ?
269 )
270 do
271 niej
272 i
273 po
274 chwili
275 ,
276 bo
277 ,
278 nie
279 jest
280 kobietą
281 !
282 )
283 ?
284 na
285 i
286 ja
287 po
288 na
289 co
290 ?
291 i
292 jak
293 mnie
294 .
295 panna
296 izabela
297 do
298 .
299 ,
300 jeżeli
301 o
302 ,
303 ale
304 o
305 co
306 do
307 mnie
308 i
309 o
310 nim
311 ,
312 a
313 i
314 jego
315 już
316 .
317 ale
318 na
319 nią
320 na
321 miejscu
322 do
323 i
324 po
325 co
326 dzień
327 ?
328 i
329 nawet
330 ,
331 a
332 i
333 jej
334 .
335 o
336 ile
337 mu
338 bardzo
339 o
340 nie
341 ,
342 na
343 co
344 i
345 ,
346 i
347 nareszcie
348 go
349 już
350 od
351 ,
352 na
353 mnie
354 na
355 i
356 na
357 jej
358 ,
359 a
360 potem
361 i
362 jego
363 drzwi
364 na
365 powrót
366 :
367 ,
368 ale
369 on
370 .
371 ale
372 na
373 niego
374 do
375 panny
376 izabeli
377 .
378 po
379 nie
380 ,
381 co
382 na
383 jego
384 !
385 nie
386 jest
387 i
388 na
389 .
390 ,
391 nie
392 był
393 nie
394 mam
395 do
396 nas
397 .
398 na
399 ,
400 ażeby
401 go
402 do
403 .
404 i
405 dopiero
406 .
407 ale
408 czy
409 do
410 ,
411 a
412 ja
413 do
414 panny
415 ;
416 ale
417 nie
418 może
419 pan
420 do
421 pani
422 ;
423 i
424 ja
425 do
426 mnie
427 do
428 drzwi
429 ,
430 a
431 pan
432 mnie
433 :
434 co
435 pan
436 ignacy
437 .
438 i
439 ja
440 go
441 .
442 pan
443 ,
444 i
445 nie
446 ma
447 .
448 od
449 nas
450 i
451 już
452 o
453 mnie
454 .
455 czy
456 ja
457 na
458 niego
459 i
460 na
461 mnie
462 na
463 i
464 nie
465 jest
466 o
467 .
468 a
469 pani
470 baronowa
471 i

471
test-A/out.tsv Normal file
View File

@ -0,0 +1,471 @@
ja
,
nie
na
co
,
bo
nie
,
co
na
niego
,
ale
ja
nie
mam
?
i
już
do
końca
?
a
może
na
jego
:
czy
,
kiedy
mi
do
mnie
nie
było
do
domu
nie
jest
.
czy
może
mnie
,
i
,
i
już
nic
mnie
na
i
.
do
nas
pani
nie
,
a
nie
o
nim
od
niej
;
a
może
na
niego
od
,
kiedy
już
o
nie
było
,
do
mnie
,
ale
jeszcze
i
jej
i
.
już
już
,
jak
mnie
!
i
jeszcze
dalej
;
ale
nie
do
.
nie
ma
na
nią
:
co
do
nas
!
)
i
nie
.
i
nawet
mu
i
nawet
już
od
do
paryża
i
o
mnie
nie
było
na
myśl
o
!
.
pani
meliton
na
myśl
.
nie
był
mu
.
o
ile
mu
o
.
.
i
ja
.
na
jej
do
kościoła
nie
i
już
na
myśl
i
na
lewo
nie
mógł
na
mnie
na
i
.
gdy
na
niego
.
na
,
jak
mnie
.
po
południu
na
myśl
,
nie
,
i
jeszcze
dalej
:
i
ja
go
nie
.
na
jej
.
i
dopiero
:
dla
nich
,
ażeby
go
pod
,
na
których
,
na
którego
:
na
prawo
nie
mógł
ani
na
myśl
!
.
nie
,
panie
.
po
chwili
i
już
o
,
ale
ja
.
a
jeżeli
i
na
jego
na
myśl
o
nie
i
nie
.
po
dziś
na
obiad
?
na
jej
,
ażeby
mnie
do
pani
baronowej
nie
jest
o
do
i
.
a
jeżeli
do
mego
i
po
na
obiad
?
,
i
ja
.
pan
,
i
po
południu
,
ale
nawet
mi
o
mnie
!
co
na
co
do
,
o
której
,
ale
nie
mógł
mnie
?
)
!
co
na
co
,
na
i
,
co
chwilę
na
myśl
i
,
ale
nie
jest
?
czy
może
i
pan
.
o
nie
,
a
pani
,
ale
ja
jestem
kupcem
,
nie
,
a
nawet
,
kiedy
?
a
,
jak
ona
:
nie
mam
od
dwudziestu
i
i
do
pani
;
lecz
i
o
jego
do
i
nawet
i
po
chwili
do
domu
;
lecz
gdy
nie
,
nie
może
nie
ma
?
czy
do
.
na
co
i
o
mnie
;
a
potem
?
,
czy
nie
było
na
niej
.
,
czy
do
ciebie
?
nie
o
,
czy
na
jego
i
nie
na
jej
:
na
,
i
jeszcze
dalej
do
głowy
nie
było
i
po
pokoju
do
,
czy
ja
,
i
już
o
mnie
i
po
francusku
:
co
?
,
który
i
ja
i
nie
jest
o
.
czy
już
był
bardzo
od
pani
krzeszowskiej
nie
było
do
,
nie
na
jej
,
ale
jeszcze
1 ja
2 ,
3 nie
4 na
5 co
6 ,
7 bo
8 nie
9 ,
10 co
11 na
12 niego
13 ,
14 ale
15 ja
16 nie
17 mam
18 ?
19 i
20 już
21 do
22 końca
23 ?
24 a
25 może
26 na
27 jego
28 :
29 czy
30 ,
31 kiedy
32 mi
33 do
34 mnie
35 nie
36 było
37 do
38 domu
39 nie
40 jest
41 .
42 czy
43 może
44 mnie
45 ,
46 i
47 ,
48 i
49 już
50 nic
51 mnie
52 na
53 i
54 .
55 do
56 nas
57 pani
58 nie
59 ,
60 a
61 nie
62 o
63 nim
64 od
65 niej
66 ;
67 a
68 może
69 na
70 niego
71 od
72 ,
73 kiedy
74 już
75 o
76 nie
77 było
78 ,
79 do
80 mnie
81 ,
82 ale
83 jeszcze
84 i
85 jej
86 i
87 .
88 już
89 już
90 ,
91 jak
92 mnie
93 !
94 i
95 jeszcze
96 dalej
97 ;
98 ale
99 nie
100 do
101 .
102 nie
103 ma
104 na
105 nią
106 :
107 co
108 do
109 nas
110 !
111 )
112 i
113 nie
114 .
115 i
116 nawet
117 mu
118 i
119 nawet
120 już
121 od
122 do
123 paryża
124 i
125 o
126 mnie
127 nie
128 było
129 na
130 myśl
131 o
132 !
133 .
134 pani
135 meliton
136 na
137 myśl
138 .
139 nie
140 był
141 mu
142 .
143 o
144 ile
145 mu
146 o
147 .
148 .
149 i
150 ja
151 .
152 na
153 jej
154 do
155 kościoła
156 nie
157 i
158 już
159 na
160 myśl
161 i
162 na
163 lewo
164 nie
165 mógł
166 na
167 mnie
168 na
169 i
170 .
171 gdy
172 na
173 niego
174 .
175 na
176 ,
177 jak
178 mnie
179 .
180 po
181 południu
182 na
183 myśl
184 ,
185 nie
186 ,
187 i
188 jeszcze
189 dalej
190 :
191 i
192 ja
193 go
194 nie
195 .
196 na
197 jej
198 .
199 i
200 dopiero
201 :
202 dla
203 nich
204 ,
205 ażeby
206 go
207 pod
208 ,
209 na
210 których
211 ,
212 na
213 którego
214 :
215 na
216 prawo
217 nie
218 mógł
219 ani
220 na
221 myśl
222 !
223 .
224 nie
225 ,
226 panie
227 .
228 po
229 chwili
230 i
231 już
232 o
233 ,
234 ale
235 ja
236 .
237 a
238 jeżeli
239 i
240 na
241 jego
242 na
243 myśl
244 o
245 nie
246 i
247 nie
248 .
249 po
250 dziś
251 na
252 obiad
253 ?
254 na
255 jej
256 ,
257 ażeby
258 mnie
259 do
260 pani
261 baronowej
262 nie
263 jest
264 o
265 do
266 i
267 .
268 a
269 jeżeli
270 do
271 mego
272 i
273 po
274 na
275 obiad
276 ?
277 ,
278 i
279 ja
280 .
281 pan
282 ,
283 i
284 po
285 południu
286 ,
287 ale
288 nawet
289 mi
290 o
291 mnie
292 !
293 co
294 na
295 co
296 do
297 ,
298 o
299 której
300 ,
301 ale
302 nie
303 mógł
304 mnie
305 ?
306 )
307 !
308 co
309 na
310 co
311 ,
312 na
313 i
314 ,
315 co
316 chwilę
317 na
318 myśl
319 i
320 ,
321 ale
322 nie
323 jest
324 ?
325 czy
326 może
327 i
328 pan
329 .
330 o
331 nie
332 ,
333 a
334 pani
335 ,
336 ale
337 ja
338 jestem
339 kupcem
340 ,
341 nie
342 ,
343 a
344 nawet
345 ,
346 kiedy
347 ?
348 a
349 ,
350 jak
351 ona
352 :
353 nie
354 mam
355 od
356 dwudziestu
357 i
358 i
359 do
360 pani
361 ;
362 lecz
363 i
364 o
365 jego
366 do
367 i
368 nawet
369 i
370 po
371 chwili
372 do
373 domu
374 ;
375 lecz
376 gdy
377 nie
378 ,
379 nie
380 może
381 nie
382 ma
383 ?
384 czy
385 do
386 .
387 na
388 co
389 i
390 o
391 mnie
392 ;
393 a
394 potem
395 ?
396 ,
397 czy
398 nie
399 było
400 na
401 niej
402 .
403 ,
404 czy
405 do
406 ciebie
407 ?
408 nie
409 o
410 ,
411 czy
412 na
413 jego
414 i
415 nie
416 na
417 jej
418 :
419 na
420 ,
421 i
422 jeszcze
423 dalej
424 do
425 głowy
426 nie
427 było
428 i
429 po
430 pokoju
431 do
432 ,
433 czy
434 ja
435 ,
436 i
437 już
438 o
439 mnie
440 i
441 po
442 francusku
443 :
444 co
445 ?
446 ,
447 który
448 i
449 ja
450 i
451 nie
452 jest
453 o
454 .
455 czy
456 już
457 był
458 bardzo
459 od
460 pani
461 krzeszowskiej
462 nie
463 było
464 do
465 ,
466 nie
467 na
468 jej
469 ,
470 ale
471 jeszcze

1793
train/train_test.tsv Normal file

File diff suppressed because it is too large Load Diff

7168
train/train_train.tsv Normal file

File diff suppressed because it is too large Load Diff