From 367053554ec0283fa3b259933e84c03ae5413023 Mon Sep 17 00:00:00 2001 From: kubapok Date: Mon, 17 May 2021 11:17:36 +0200 Subject: [PATCH] init --- Statystyczny model n gramowy odpowiedzi.ipynb | 6253 +++++++++++++++++ Statystyczny model n gramowy.ipynb | 6253 +++++++++++++++++ 2 files changed, 12506 insertions(+) create mode 100644 Statystyczny model n gramowy odpowiedzi.ipynb create mode 100644 Statystyczny model n gramowy.ipynb diff --git a/Statystyczny model n gramowy odpowiedzi.ipynb b/Statystyczny model n gramowy odpowiedzi.ipynb new file mode 100644 index 0000000..9753041 --- /dev/null +++ b/Statystyczny model n gramowy odpowiedzi.ipynb @@ -0,0 +1,6253 @@ +{ + "cells": [ + { + "cell_type": "code", + "execution_count": 1, + "metadata": { + "scrolled": true + }, + "outputs": [ + { + "name": "stderr", + "output_type": "stream", + "text": [ + "/media/kuba/ssdsam/anaconda3/lib/python3.8/site-packages/gensim/similarities/__init__.py:15: UserWarning: The gensim.similarities.levenshtein submodule is disabled, because the optional Levenshtein package is unavailable. Install Levenhstein (e.g. `pip install python-Levenshtein`) to suppress this warning.\n", + " warnings.warn(msg)\n" + ] + } + ], + "source": [ + "from gensim.utils import tokenize\n", + "from sklearn.datasets import fetch_20newsgroups\n", + "from collections import Counter\n", + "from nltk.util import ngrams \n", + "import numpy as np" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "https://web.stanford.edu/~jurafsky/slp3/3.pdf\n", + "\n", + "https://wolnelektury.pl/media/book/txt/pan-tadeusz.txt\n", + "\n", + "\n", + "Pierwsze 9000 linijek do train, reszta do test" + ] + }, + { + "cell_type": "code", + "execution_count": 2, + "metadata": {}, + "outputs": [], + "source": [ + "corpora_train = open('pan-tadeusz-train.txt').read()" + ] + }, + { + "cell_type": "code", + "execution_count": 3, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "'Adam Mickiewicz\\n\\nPan Tadeusz czyli ostatni zajazd na Litwie\\n\\n\\n\\n\\n\\n\\nKsięga pierwsza\\n\\n\\n\\nGospodarstwo\\n\\nP'" + ] + }, + "execution_count": 3, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "corpora_train[:100]" + ] + }, + { + "cell_type": "code", + "execution_count": 4, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "372474" + ] + }, + "execution_count": 4, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "len(corpora_train)" + ] + }, + { + "cell_type": "code", + "execution_count": 5, + "metadata": {}, + "outputs": [], + "source": [ + "corpora_train_tokenized = list(tokenize(corpora_train,lowercase = True))" + ] + }, + { + "cell_type": "code", + "execution_count": 6, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "57021" + ] + }, + "execution_count": 6, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "len(corpora_train_tokenized)" + ] + }, + { + "cell_type": "code", + "execution_count": 7, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "['adam',\n", + " 'mickiewicz',\n", + " 'pan',\n", + " 'tadeusz',\n", + " 'czyli',\n", + " 'ostatni',\n", + " 'zajazd',\n", + " 'na',\n", + " 'litwie',\n", + " 'księga']" + ] + }, + "execution_count": 7, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "corpora_train_tokenized[:10]" + ] + }, + { + "cell_type": "code", + "execution_count": 8, + "metadata": { + "scrolled": true + }, + "outputs": [], + "source": [ + "train_ngrams = list(ngrams(corpora_train_tokenized, 2))" + ] + }, + { + "cell_type": "code", + "execution_count": 9, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "[('adam', 'mickiewicz'),\n", + " ('mickiewicz', 'pan'),\n", + " ('pan', 'tadeusz'),\n", + " ('tadeusz', 'czyli'),\n", + " ('czyli', 'ostatni'),\n", + " ('ostatni', 'zajazd'),\n", + " ('zajazd', 'na'),\n", + " ('na', 'litwie'),\n", + " ('litwie', 'księga'),\n", + " ('księga', 'pierwsza'),\n", + " ('pierwsza', 'gospodarstwo'),\n", + " ('gospodarstwo', 'powrót'),\n", + " ('powrót', 'panicza'),\n", + " ('panicza', 'spotkanie'),\n", + " ('spotkanie', 'się'),\n", + " ('się', 'pierwsze'),\n", + " ('pierwsze', 'w'),\n", + " ('w', 'pokoiku'),\n", + " ('pokoiku', 'drugie'),\n", + " ('drugie', 'u'),\n", + " ('u', 'stołu'),\n", + " ('stołu', 'ważna'),\n", + " ('ważna', 'sędziego'),\n", + " ('sędziego', 'nauka'),\n", + " ('nauka', 'o'),\n", + " ('o', 'grzeczności'),\n", + " ('grzeczności', 'podkomorzego'),\n", + " ('podkomorzego', 'uwagi'),\n", + " ('uwagi', 'polityczne'),\n", + " ('polityczne', 'nad'),\n", + " ('nad', 'modami'),\n", + " ('modami', 'początek'),\n", + " ('początek', 'sporu'),\n", + " ('sporu', 'o'),\n", + " ('o', 'kusego'),\n", + " ('kusego', 'i'),\n", + " ('i', 'sokoła'),\n", + " ('sokoła', 'żale'),\n", + " ('żale', 'wojskiego'),\n", + " ('wojskiego', 'ostatni'),\n", + " ('ostatni', 'woźny'),\n", + " ('woźny', 'trybunału'),\n", + " ('trybunału', 'rzut'),\n", + " ('rzut', 'oka'),\n", + " ('oka', 'na'),\n", + " ('na', 'ówczesny'),\n", + " ('ówczesny', 'stan'),\n", + " ('stan', 'polityczny'),\n", + " ('polityczny', 'litwy'),\n", + " ('litwy', 'i'),\n", + " ('i', 'europy'),\n", + " ('europy', 'litwo'),\n", + " ('litwo', 'ojczyzno'),\n", + " ('ojczyzno', 'moja'),\n", + " ('moja', 'ty'),\n", + " ('ty', 'jesteś'),\n", + " ('jesteś', 'jak'),\n", + " ('jak', 'zdrowie'),\n", + " ('zdrowie', 'ile'),\n", + " ('ile', 'cię'),\n", + " ('cię', 'trzeba'),\n", + " ('trzeba', 'cenić'),\n", + " ('cenić', 'ten'),\n", + " ('ten', 'tylko'),\n", + " ('tylko', 'się'),\n", + " ('się', 'dowie'),\n", + " ('dowie', 'kto'),\n", + " ('kto', 'cię'),\n", + " ('cię', 'stracił'),\n", + " ('stracił', 'dziś'),\n", + " ('dziś', 'piękność'),\n", + " ('piękność', 'twą'),\n", + " ('twą', 'w'),\n", + " ('w', 'całej'),\n", + " ('całej', 'ozdobie'),\n", + " ('ozdobie', 'widzę'),\n", + " ('widzę', 'i'),\n", + " ('i', 'opisuję'),\n", + " ('opisuję', 'bo'),\n", + " ('bo', 'tęsknię'),\n", + " ('tęsknię', 'po'),\n", + " ('po', 'tobie'),\n", + " ('tobie', 'panno'),\n", + " ('panno', 'święta'),\n", + " ('święta', 'co'),\n", + " ('co', 'jasnej'),\n", + " ('jasnej', 'bronisz'),\n", + " ('bronisz', 'częstochowy'),\n", + " ('częstochowy', 'i'),\n", + " ('i', 'w'),\n", + " ('w', 'ostrej'),\n", + " ('ostrej', 'świecisz'),\n", + " ('świecisz', 'bramie'),\n", + " ('bramie', 'ty'),\n", + " ('ty', 'co'),\n", + " ('co', 'gród'),\n", + " ('gród', 'zamkowy'),\n", + " ('zamkowy', 'nowogródzki'),\n", + " ('nowogródzki', 'ochraniasz'),\n", + " ('ochraniasz', 'z'),\n", + " ('z', 'jego'),\n", + " ('jego', 'wiernym'),\n", + " ('wiernym', 'ludem'),\n", + " ('ludem', 'jak'),\n", + " ('jak', 'mnie'),\n", + " ('mnie', 'dziecko'),\n", + " ('dziecko', 'do'),\n", + " ('do', 'zdrowia'),\n", + " ('zdrowia', 'powróciłaś'),\n", + " ('powróciłaś', 'cudem'),\n", + " ('cudem', 'gdy'),\n", + " ('gdy', 'od'),\n", + " ('od', 'płaczącej'),\n", + " ('płaczącej', 'matki'),\n", + " ('matki', 'pod'),\n", + " ('pod', 'twoją'),\n", + " ('twoją', 'opiekę'),\n", + " ('opiekę', 'ofiarowany'),\n", + " ('ofiarowany', 'martwą'),\n", + " ('martwą', 'podniosłem'),\n", + " ('podniosłem', 'powiekę'),\n", + " ('powiekę', 'i'),\n", + " ('i', 'zaraz'),\n", + " ('zaraz', 'mogłem'),\n", + " ('mogłem', 'pieszo'),\n", + " ('pieszo', 'do'),\n", + " ('do', 'twych'),\n", + " ('twych', 'świątyń'),\n", + " ('świątyń', 'progu'),\n", + " ('progu', 'iść'),\n", + " ('iść', 'za'),\n", + " ('za', 'wrócone'),\n", + " ('wrócone', 'życie'),\n", + " ('życie', 'podziękować'),\n", + " ('podziękować', 'bogu'),\n", + " ('bogu', 'tak'),\n", + " ('tak', 'nas'),\n", + " ('nas', 'powrócisz'),\n", + " ('powrócisz', 'cudem'),\n", + " ('cudem', 'na'),\n", + " ('na', 'ojczyzny'),\n", + " ('ojczyzny', 'łono'),\n", + " ('łono', 'tymczasem'),\n", + " ('tymczasem', 'przenoś'),\n", + " ('przenoś', 'moją'),\n", + " ('moją', 'duszę'),\n", + " ('duszę', 'utęsknioną'),\n", + " ('utęsknioną', 'do'),\n", + " ('do', 'tych'),\n", + " ('tych', 'pagórków'),\n", + " ('pagórków', 'leśnych'),\n", + " ('leśnych', 'do'),\n", + " ('do', 'tych'),\n", + " ('tych', 'łąk'),\n", + " ('łąk', 'zielonych'),\n", + " ('zielonych', 'szeroko'),\n", + " ('szeroko', 'nad'),\n", + " ('nad', 'błękitnym'),\n", + " ('błękitnym', 'niemnem'),\n", + " ('niemnem', 'rozciągnionych'),\n", + " ('rozciągnionych', 'do'),\n", + " ('do', 'tych'),\n", + " ('tych', 'pól'),\n", + " ('pól', 'malowanych'),\n", + " ('malowanych', 'zbożem'),\n", + " ('zbożem', 'rozmaitem'),\n", + " ('rozmaitem', 'wyzłacanych'),\n", + " ('wyzłacanych', 'pszenicą'),\n", + " ('pszenicą', 'posrebrzanych'),\n", + " ('posrebrzanych', 'żytem'),\n", + " ('żytem', 'gdzie'),\n", + " ('gdzie', 'bursztynowy'),\n", + " ('bursztynowy', 'świerzop'),\n", + " ('świerzop', 'gryka'),\n", + " ('gryka', 'jak'),\n", + " ('jak', 'śnieg'),\n", + " ('śnieg', 'biała'),\n", + " ('biała', 'gdzie'),\n", + " ('gdzie', 'panieńskim'),\n", + " ('panieńskim', 'rumieńcem'),\n", + " ('rumieńcem', 'dzięcielina'),\n", + " ('dzięcielina', 'pała'),\n", + " ('pała', 'a'),\n", + " ('a', 'wszystko'),\n", + " ('wszystko', 'przepasane'),\n", + " ('przepasane', 'jakby'),\n", + " ('jakby', 'wstęgą'),\n", + " ('wstęgą', 'miedzą'),\n", + " ('miedzą', 'zieloną'),\n", + " ('zieloną', 'na'),\n", + " ('na', 'niej'),\n", + " ('niej', 'z'),\n", + " ('z', 'rzadka'),\n", + " ('rzadka', 'ciche'),\n", + " ('ciche', 'grusze'),\n", + " ('grusze', 'siedzą'),\n", + " ('siedzą', 'śród'),\n", + " ('śród', 'takich'),\n", + " ('takich', 'pól'),\n", + " ('pól', 'przed'),\n", + " ('przed', 'laty'),\n", + " ('laty', 'nad'),\n", + " ('nad', 'brzegiem'),\n", + " ('brzegiem', 'ruczaju'),\n", + " ('ruczaju', 'na'),\n", + " ('na', 'pagórku'),\n", + " ('pagórku', 'niewielkim'),\n", + " ('niewielkim', 'we'),\n", + " ('we', 'brzozowym'),\n", + " ('brzozowym', 'gaju'),\n", + " ('gaju', 'stał'),\n", + " ('stał', 'dwór'),\n", + " ('dwór', 'szlachecki'),\n", + " ('szlachecki', 'z'),\n", + " ('z', 'drzewa'),\n", + " ('drzewa', 'lecz'),\n", + " ('lecz', 'podmurowany'),\n", + " ('podmurowany', 'świeciły'),\n", + " ('świeciły', 'się'),\n", + " ('się', 'z'),\n", + " ('z', 'daleka'),\n", + " ('daleka', 'pobielane'),\n", + " ('pobielane', 'ściany'),\n", + " ('ściany', 'tym'),\n", + " ('tym', 'bielsze'),\n", + " ('bielsze', 'że'),\n", + " ('że', 'odbite'),\n", + " ('odbite', 'od'),\n", + " ('od', 'ciemnej'),\n", + " ('ciemnej', 'zieleni'),\n", + " ('zieleni', 'topoli'),\n", + " ('topoli', 'co'),\n", + " ('co', 'go'),\n", + " ('go', 'bronią'),\n", + " ('bronią', 'od'),\n", + " ('od', 'wiatrów'),\n", + " ('wiatrów', 'jesieni'),\n", + " ('jesieni', 'dom'),\n", + " ('dom', 'mieszkalny'),\n", + " ('mieszkalny', 'niewielki'),\n", + " ('niewielki', 'lecz'),\n", + " ('lecz', 'zewsząd'),\n", + " ('zewsząd', 'chędogi'),\n", + " ('chędogi', 'i'),\n", + " ('i', 'stodołę'),\n", + " ('stodołę', 'miał'),\n", + " ('miał', 'wielką'),\n", + " ('wielką', 'i'),\n", + " ('i', 'przy'),\n", + " ('przy', 'niej'),\n", + " ('niej', 'trzy'),\n", + " ('trzy', 'stogi'),\n", + " ('stogi', 'użątku'),\n", + " ('użątku', 'co'),\n", + " ('co', 'pod'),\n", + " ('pod', 'strzechą'),\n", + " ('strzechą', 'zmieścić'),\n", + " ('zmieścić', 'się'),\n", + " ('się', 'nie'),\n", + " ('nie', 'może'),\n", + " ('może', 'widać'),\n", + " ('widać', 'że'),\n", + " ('że', 'okolica'),\n", + " ('okolica', 'obfita'),\n", + " ('obfita', 'we'),\n", + " ('we', 'zboże'),\n", + " ('zboże', 'i'),\n", + " ('i', 'widać'),\n", + " ('widać', 'z'),\n", + " ('z', 'liczby'),\n", + " ('liczby', 'kopic'),\n", + " ('kopic', 'co'),\n", + " ('co', 'wzdłuż'),\n", + " ('wzdłuż', 'i'),\n", + " ('i', 'wszerz'),\n", + " ('wszerz', 'smugów'),\n", + " ('smugów', 'świecą'),\n", + " ('świecą', 'gęsto'),\n", + " ('gęsto', 'jak'),\n", + " ('jak', 'gwiazdy'),\n", + " ('gwiazdy', 'widać'),\n", + " ('widać', 'z'),\n", + " ('z', 'liczby'),\n", + " ('liczby', 'pługów'),\n", + " ('pługów', 'orzących'),\n", + " ('orzących', 'wcześnie'),\n", + " ('wcześnie', 'łany'),\n", + " ('łany', 'ogromne'),\n", + " ('ogromne', 'ugoru'),\n", + " ('ugoru', 'czarnoziemne'),\n", + " ('czarnoziemne', 'zapewne'),\n", + " ('zapewne', 'należne'),\n", + " ('należne', 'do'),\n", + " ('do', 'dworu'),\n", + " ('dworu', 'uprawne'),\n", + " ('uprawne', 'dobrze'),\n", + " ('dobrze', 'na'),\n", + " ('na', 'kształt'),\n", + " ('kształt', 'ogrodowych'),\n", + " ('ogrodowych', 'grządek'),\n", + " ('grządek', 'że'),\n", + " ('że', 'w'),\n", + " ('w', 'tym'),\n", + " ('tym', 'domu'),\n", + " ('domu', 'dostatek'),\n", + " ('dostatek', 'mieszka'),\n", + " ('mieszka', 'i'),\n", + " ('i', 'porządek'),\n", + " ('porządek', 'brama'),\n", + " ('brama', 'na'),\n", + " ('na', 'wciąż'),\n", + " ('wciąż', 'otwarta'),\n", + " ('otwarta', 'przechodniom'),\n", + " ('przechodniom', 'ogłasza'),\n", + " ('ogłasza', 'że'),\n", + " ('że', 'gościnna'),\n", + " ('gościnna', 'i'),\n", + " ('i', 'wszystkich'),\n", + " ('wszystkich', 'w'),\n", + " ('w', 'gościnę'),\n", + " ('gościnę', 'zaprasza'),\n", + " ('zaprasza', 'właśnie'),\n", + " ('właśnie', 'dwukonną'),\n", + " ('dwukonną', 'bryką'),\n", + " ('bryką', 'wjechał'),\n", + " ('wjechał', 'młody'),\n", + " ('młody', 'panek'),\n", + " ('panek', 'i'),\n", + " ('i', 'obiegłszy'),\n", + " ('obiegłszy', 'dziedziniec'),\n", + " ('dziedziniec', 'zawrócił'),\n", + " ('zawrócił', 'przed'),\n", + " ('przed', 'ganek'),\n", + " ('ganek', 'wysiadł'),\n", + " ('wysiadł', 'z'),\n", + " ('z', 'powozu'),\n", + " ('powozu', 'konie'),\n", + " ('konie', 'porzucone'),\n", + " ('porzucone', 'same'),\n", + " ('same', 'szczypiąc'),\n", + " ('szczypiąc', 'trawę'),\n", + " ('trawę', 'ciągnęły'),\n", + " ('ciągnęły', 'powoli'),\n", + " ('powoli', 'pod'),\n", + " ('pod', 'bramę'),\n", + " ('bramę', 'we'),\n", + " ('we', 'dworze'),\n", + " ('dworze', 'pusto'),\n", + " ('pusto', 'bo'),\n", + " ('bo', 'drzwi'),\n", + " ('drzwi', 'od'),\n", + " ('od', 'ganku'),\n", + " ('ganku', 'zamknięto'),\n", + " ('zamknięto', 'zaszczepkami'),\n", + " ('zaszczepkami', 'i'),\n", + " ('i', 'kołkiem'),\n", + " ('kołkiem', 'zaszczepki'),\n", + " ('zaszczepki', 'przetknięto'),\n", + " ('przetknięto', 'podróżny'),\n", + " ('podróżny', 'do'),\n", + " ('do', 'folwarku'),\n", + " ('folwarku', 'nie'),\n", + " ('nie', 'biegł'),\n", + " ('biegł', 'sług'),\n", + " ('sług', 'zapytać'),\n", + " ('zapytać', 'odemknął'),\n", + " ('odemknął', 'wbiegł'),\n", + " ('wbiegł', 'do'),\n", + " ('do', 'domu'),\n", + " ('domu', 'pragnął'),\n", + " ('pragnął', 'go'),\n", + " ('go', 'powitać'),\n", + " ('powitać', 'dawno'),\n", + " ('dawno', 'domu'),\n", + " ('domu', 'nie'),\n", + " ('nie', 'widział'),\n", + " ('widział', 'bo'),\n", + " ('bo', 'w'),\n", + " ('w', 'dalekim'),\n", + " ('dalekim', 'mieście'),\n", + " ('mieście', 'kończył'),\n", + " ('kończył', 'nauki'),\n", + " ('nauki', 'końca'),\n", + " ('końca', 'doczekał'),\n", + " ('doczekał', 'nareszcie'),\n", + " ('nareszcie', 'wbiega'),\n", + " ('wbiega', 'i'),\n", + " ('i', 'okiem'),\n", + " ('okiem', 'chciwie'),\n", + " ('chciwie', 'ściany'),\n", + " ('ściany', 'starodawne'),\n", + " ('starodawne', 'ogląda'),\n", + " ('ogląda', 'czule'),\n", + " ('czule', 'jako'),\n", + " ('jako', 'swe'),\n", + " ('swe', 'znajome'),\n", + " ('znajome', 'dawne'),\n", + " ('dawne', 'też'),\n", + " ('też', 'same'),\n", + " ('same', 'widzi'),\n", + " ('widzi', 'sprzęty'),\n", + " ('sprzęty', 'też'),\n", + " ('też', 'same'),\n", + " ('same', 'obicia'),\n", + " ('obicia', 'z'),\n", + " ('z', 'którymi'),\n", + " ('którymi', 'się'),\n", + " ('się', 'zabawiać'),\n", + " ('zabawiać', 'lubił'),\n", + " ('lubił', 'od'),\n", + " ('od', 'powicia'),\n", + " ('powicia', 'lecz'),\n", + " ('lecz', 'mniej'),\n", + " ('mniej', 'wielkie'),\n", + " ('wielkie', 'mniej'),\n", + " ('mniej', 'piękne'),\n", + " ('piękne', 'niż'),\n", + " ('niż', 'się'),\n", + " ('się', 'dawniej'),\n", + " ('dawniej', 'zdały'),\n", + " ('zdały', 'i'),\n", + " ('i', 'też'),\n", + " ('też', 'same'),\n", + " ('same', 'portrety'),\n", + " ('portrety', 'na'),\n", + " ('na', 'ścianach'),\n", + " ('ścianach', 'wisiały'),\n", + " ('wisiały', 'tu'),\n", + " ('tu', 'kościuszko'),\n", + " ('kościuszko', 'w'),\n", + " ('w', 'czamarce'),\n", + " ('czamarce', 'krakowskiej'),\n", + " ('krakowskiej', 'z'),\n", + " ('z', 'oczyma'),\n", + " ('oczyma', 'podniesionymi'),\n", + " ('podniesionymi', 'w'),\n", + " ('w', 'niebo'),\n", + " ('niebo', 'miecz'),\n", + " ('miecz', 'oburącz'),\n", + " ('oburącz', 'trzyma'),\n", + " ('trzyma', 'takim'),\n", + " ('takim', 'był'),\n", + " ('był', 'gdy'),\n", + " ('gdy', 'przysięgał'),\n", + " ('przysięgał', 'na'),\n", + " ('na', 'stopniach'),\n", + " ('stopniach', 'ołtarzów'),\n", + " ('ołtarzów', 'że'),\n", + " ('że', 'tym'),\n", + " ('tym', 'mieczem'),\n", + " ('mieczem', 'wypędzi'),\n", + " ('wypędzi', 'z'),\n", + " ('z', 'polski'),\n", + " ('polski', 'trzech'),\n", + " ('trzech', 'mocarzów'),\n", + " ('mocarzów', 'albo'),\n", + " ('albo', 'sam'),\n", + " ('sam', 'na'),\n", + " ('na', 'nim'),\n", + " ('nim', 'padnie'),\n", + " ('padnie', 'dalej'),\n", + " ('dalej', 'w'),\n", + " ('w', 'polskiej'),\n", + " ('polskiej', 'szacie'),\n", + " ('szacie', 'siedzi'),\n", + " ('siedzi', 'rejtan'),\n", + " ('rejtan', 'żałośny'),\n", + " ('żałośny', 'po'),\n", + " ('po', 'wolności'),\n", + " ('wolności', 'stracie'),\n", + " ('stracie', 'w'),\n", + " ('w', 'ręku'),\n", + " ('ręku', 'trzyma'),\n", + " ('trzyma', 'nóż'),\n", + " ('nóż', 'ostrzem'),\n", + " ('ostrzem', 'zwrócony'),\n", + " ('zwrócony', 'do'),\n", + " ('do', 'łona'),\n", + " ('łona', 'a'),\n", + " ('a', 'przed'),\n", + " ('przed', 'nim'),\n", + " ('nim', 'leży'),\n", + " ('leży', 'fedon'),\n", + " ('fedon', 'i'),\n", + " ('i', 'żywot'),\n", + " ('żywot', 'katona'),\n", + " ('katona', 'dalej'),\n", + " ('dalej', 'jasiński'),\n", + " ('jasiński', 'młodzian'),\n", + " ('młodzian', 'piękny'),\n", + " ('piękny', 'i'),\n", + " ('i', 'posępny'),\n", + " ('posępny', 'obok'),\n", + " ('obok', 'korsak'),\n", + " ('korsak', 'towarzysz'),\n", + " ('towarzysz', 'jego'),\n", + " ('jego', 'nieodstępny'),\n", + " ('nieodstępny', 'stoją'),\n", + " ('stoją', 'na'),\n", + " ('na', 'szańcach'),\n", + " ('szańcach', 'pragi'),\n", + " ('pragi', 'na'),\n", + " ('na', 'stosach'),\n", + " ('stosach', 'moskali'),\n", + " ('moskali', 'siekąc'),\n", + " ('siekąc', 'wrogów'),\n", + " ('wrogów', 'a'),\n", + " ('a', 'praga'),\n", + " ('praga', 'już'),\n", + " ('już', 'się'),\n", + " ('się', 'wkoło'),\n", + " ('wkoło', 'pali'),\n", + " ('pali', 'nawet'),\n", + " ('nawet', 'stary'),\n", + " ('stary', 'stojący'),\n", + " ('stojący', 'zegar'),\n", + " ('zegar', 'kurantowy'),\n", + " ('kurantowy', 'w'),\n", + " ('w', 'drewnianej'),\n", + " ('drewnianej', 'szafie'),\n", + " ('szafie', 'poznał'),\n", + " ('poznał', 'u'),\n", + " ('u', 'wniścia'),\n", + " ('wniścia', 'alkowy'),\n", + " ('alkowy', 'i'),\n", + " ('i', 'z'),\n", + " ('z', 'dziecinną'),\n", + " ('dziecinną', 'radością'),\n", + " ('radością', 'pociągnął'),\n", + " ('pociągnął', 'za'),\n", + " ('za', 'sznurek'),\n", + " ('sznurek', 'by'),\n", + " ('by', 'stary'),\n", + " ('stary', 'dąbrowskiego'),\n", + " ('dąbrowskiego', 'usłyszeć'),\n", + " ('usłyszeć', 'mazurek'),\n", + " ('mazurek', 'biegał'),\n", + " ('biegał', 'po'),\n", + " ('po', 'całym'),\n", + " ('całym', 'domu'),\n", + " ('domu', 'i'),\n", + " ('i', 'szukał'),\n", + " ('szukał', 'komnaty'),\n", + " ('komnaty', 'gdzie'),\n", + " ('gdzie', 'mieszkał'),\n", + " ('mieszkał', 'dzieckiem'),\n", + " ('dzieckiem', 'będąc'),\n", + " ('będąc', 'przed'),\n", + " ('przed', 'dziesięciu'),\n", + " ('dziesięciu', 'laty'),\n", + " ('laty', 'wchodzi'),\n", + " ('wchodzi', 'cofnął'),\n", + " ('cofnął', 'się'),\n", + " ('się', 'toczył'),\n", + " ('toczył', 'zdumione'),\n", + " ('zdumione', 'źrenice'),\n", + " ('źrenice', 'po'),\n", + " ('po', 'ścianach'),\n", + " ('ścianach', 'w'),\n", + " ('w', 'tej'),\n", + " ('tej', 'komnacie'),\n", + " ('komnacie', 'mieszkanie'),\n", + " ('mieszkanie', 'kobiéce'),\n", + " ('kobiéce', 'któż'),\n", + " ('któż', 'by'),\n", + " ('by', 'tu'),\n", + " ('tu', 'mieszkał'),\n", + " ('mieszkał', 'stary'),\n", + " ('stary', 'stryj'),\n", + " ('stryj', 'nie'),\n", + " ('nie', 'był'),\n", + " ('był', 'żonaty'),\n", + " ('żonaty', 'a'),\n", + " ('a', 'ciotka'),\n", + " ('ciotka', 'w'),\n", + " ('w', 'petersburgu'),\n", + " ('petersburgu', 'mieszkała'),\n", + " ('mieszkała', 'przed'),\n", + " ('przed', 'laty'),\n", + " ('laty', 'to'),\n", + " ('to', 'nie'),\n", + " ('nie', 'był'),\n", + " ('był', 'ochmistrzyni'),\n", + " ('ochmistrzyni', 'pokój'),\n", + " ('pokój', 'fortepiano'),\n", + " ('fortepiano', 'na'),\n", + " ('na', 'nim'),\n", + " ('nim', 'nuty'),\n", + " ('nuty', 'i'),\n", + " ('i', 'książki'),\n", + " ('książki', 'wszystko'),\n", + " ('wszystko', 'porzucano'),\n", + " ('porzucano', 'niedbale'),\n", + " ('niedbale', 'i'),\n", + " ('i', 'bezładnie'),\n", + " ('bezładnie', 'nieporządek'),\n", + " ('nieporządek', 'miły'),\n", + " ('miły', 'niestare'),\n", + " ('niestare', 'były'),\n", + " ('były', 'rączki'),\n", + " ('rączki', 'co'),\n", + " ('co', 'je'),\n", + " ('je', 'tak'),\n", + " ('tak', 'rzuciły'),\n", + " ('rzuciły', 'tuż'),\n", + " ('tuż', 'i'),\n", + " ('i', 'sukienka'),\n", + " ('sukienka', 'biała'),\n", + " ('biała', 'świeżo'),\n", + " ('świeżo', 'z'),\n", + " ('z', 'kołka'),\n", + " ('kołka', 'zdjęta'),\n", + " ('zdjęta', 'do'),\n", + " ('do', 'ubrania'),\n", + " ('ubrania', 'na'),\n", + " ('na', 'krzesła'),\n", + " ('krzesła', 'poręczu'),\n", + " ('poręczu', 'rozpięta'),\n", + " ('rozpięta', 'a'),\n", + " ('a', 'na'),\n", + " ('na', 'oknach'),\n", + " ('oknach', 'donice'),\n", + " ('donice', 'z'),\n", + " ('z', 'pachnącymi'),\n", + " ('pachnącymi', 'ziołki'),\n", + " ('ziołki', 'geranium'),\n", + " ('geranium', 'lewkonija'),\n", + " ('lewkonija', 'astry'),\n", + " ('astry', 'i'),\n", + " ('i', 'fijołki'),\n", + " ('fijołki', 'podróżny'),\n", + " ('podróżny', 'stanął'),\n", + " ('stanął', 'w'),\n", + " ('w', 'jednym'),\n", + " ('jednym', 'z'),\n", + " ('z', 'okien'),\n", + " ('okien', 'nowe'),\n", + " ('nowe', 'dziwo'),\n", + " ('dziwo', 'w'),\n", + " ('w', 'sadzie'),\n", + " ('sadzie', 'na'),\n", + " ('na', 'brzegu'),\n", + " ('brzegu', 'niegdyś'),\n", + " ('niegdyś', 'zarosłym'),\n", + " ('zarosłym', 'pokrzywą'),\n", + " ('pokrzywą', 'był'),\n", + " ('był', 'maleńki'),\n", + " ('maleńki', 'ogródek'),\n", + " ('ogródek', 'ścieżkami'),\n", + " ('ścieżkami', 'porznięty'),\n", + " ('porznięty', 'pełen'),\n", + " ('pełen', 'bukietów'),\n", + " ('bukietów', 'trawy'),\n", + " ('trawy', 'angielskiej'),\n", + " ('angielskiej', 'i'),\n", + " ('i', 'mięty'),\n", + " ('mięty', 'drewniany'),\n", + " ('drewniany', 'drobny'),\n", + " ('drobny', 'w'),\n", + " ('w', 'cyfrę'),\n", + " ('cyfrę', 'powiązany'),\n", + " ('powiązany', 'płotek'),\n", + " ('płotek', 'połyskał'),\n", + " ('połyskał', 'się'),\n", + " ('się', 'wstążkami'),\n", + " ('wstążkami', 'jaskrawych'),\n", + " ('jaskrawych', 'stokrotek'),\n", + " ('stokrotek', 'grządki'),\n", + " ('grządki', 'widać'),\n", + " ('widać', 'że'),\n", + " ('że', 'były'),\n", + " ('były', 'świeżo'),\n", + " ('świeżo', 'polewane'),\n", + " ('polewane', 'tuż'),\n", + " ('tuż', 'stało'),\n", + " ('stało', 'wody'),\n", + " ('wody', 'pełne'),\n", + " ('pełne', 'naczynie'),\n", + " ('naczynie', 'blaszane'),\n", + " ('blaszane', 'ale'),\n", + " ('ale', 'nigdzie'),\n", + " ('nigdzie', 'nie'),\n", + " ('nie', 'widać'),\n", + " ('widać', 'było'),\n", + " ('było', 'ogrodniczki'),\n", + " ('ogrodniczki', 'tylko'),\n", + " ('tylko', 'co'),\n", + " ('co', 'wyszła'),\n", + " ('wyszła', 'jeszcze'),\n", + " ('jeszcze', 'kołyszą'),\n", + " ('kołyszą', 'się'),\n", + " ('się', 'drzwiczki'),\n", + " ('drzwiczki', 'świeżo'),\n", + " ('świeżo', 'trącone'),\n", + " ('trącone', 'blisko'),\n", + " ('blisko', 'drzwi'),\n", + " ('drzwi', 'ślad'),\n", + " ('ślad', 'widać'),\n", + " ('widać', 'nóżki'),\n", + " ('nóżki', 'na'),\n", + " ('na', 'piasku'),\n", + " ('piasku', 'bez'),\n", + " ('bez', 'trzewika'),\n", + " ('trzewika', 'była'),\n", + " ('była', 'i'),\n", + " ('i', 'pończoszki'),\n", + " ('pończoszki', 'na'),\n", + " ('na', 'piasku'),\n", + " ('piasku', 'drobnym'),\n", + " ('drobnym', 'suchym'),\n", + " ('suchym', 'białym'),\n", + " ('białym', 'na'),\n", + " ('na', 'kształt'),\n", + " ('kształt', 'śniegu'),\n", + " ('śniegu', 'ślad'),\n", + " ('ślad', 'wyraźny'),\n", + " ('wyraźny', 'lecz'),\n", + " ('lecz', 'lekki'),\n", + " ('lekki', 'odgadniesz'),\n", + " ('odgadniesz', 'że'),\n", + " ('że', 'w'),\n", + " ('w', 'biegu'),\n", + " ('biegu', 'chybkim'),\n", + " ('chybkim', 'był'),\n", + " ('był', 'zostawiony'),\n", + " ('zostawiony', 'nóżkami'),\n", + " ('nóżkami', 'drobnemi'),\n", + " ('drobnemi', 'od'),\n", + " ('od', 'kogoś'),\n", + " ('kogoś', 'co'),\n", + " ('co', 'zaledwie'),\n", + " ('zaledwie', 'dotykał'),\n", + " ('dotykał', 'się'),\n", + " ('się', 'ziemi'),\n", + " ('ziemi', 'podróżny'),\n", + " ('podróżny', 'długo'),\n", + " ('długo', 'w'),\n", + " ('w', 'oknie'),\n", + " ('oknie', 'stał'),\n", + " ('stał', 'patrząc'),\n", + " ('patrząc', 'dumając'),\n", + " ('dumając', 'wonnymi'),\n", + " ('wonnymi', 'powiewami'),\n", + " ('powiewami', 'kwiatów'),\n", + " ('kwiatów', 'oddychając'),\n", + " ('oddychając', 'oblicze'),\n", + " ('oblicze', 'aż'),\n", + " ('aż', 'na'),\n", + " ('na', 'krzaki'),\n", + " ('krzaki', 'fijołkowe'),\n", + " ('fijołkowe', 'skłonił'),\n", + " ('skłonił', 'oczyma'),\n", + " ('oczyma', 'ciekawymi'),\n", + " ('ciekawymi', 'po'),\n", + " ('po', 'drożynach'),\n", + " ('drożynach', 'gonił'),\n", + " ('gonił', 'i'),\n", + " ('i', 'znowu'),\n", + " ('znowu', 'je'),\n", + " ('je', 'na'),\n", + " ('na', 'drobnych'),\n", + " ('drobnych', 'śladach'),\n", + " ('śladach', 'zatrzymywał'),\n", + " ('zatrzymywał', 'myślał'),\n", + " ('myślał', 'o'),\n", + " ('o', 'nich'),\n", + " ('nich', 'i'),\n", + " ('i', 'czyje'),\n", + " ('czyje', 'były'),\n", + " ('były', 'odgadywał'),\n", + " ('odgadywał', 'przypadkiem'),\n", + " ('przypadkiem', 'oczy'),\n", + " ('oczy', 'podniósł'),\n", + " ('podniósł', 'i'),\n", + " ('i', 'tuż'),\n", + " ('tuż', 'na'),\n", + " ('na', 'parkanie'),\n", + " ('parkanie', 'stała'),\n", + " ('stała', 'młoda'),\n", + " ('młoda', 'dziewczyna'),\n", + " ('dziewczyna', 'białe'),\n", + " ('białe', 'jej'),\n", + " ('jej', 'ubranie'),\n", + " ('ubranie', 'wysmukłą'),\n", + " ('wysmukłą', 'postać'),\n", + " ('postać', 'tylko'),\n", + " ('tylko', 'aż'),\n", + " ('aż', 'do'),\n", + " ('do', 'piersi'),\n", + " ('piersi', 'kryje'),\n", + " ('kryje', 'odsłaniając'),\n", + " ('odsłaniając', 'ramiona'),\n", + " ('ramiona', 'i'),\n", + " ('i', 'łabędzią'),\n", + " ('łabędzią', 'szyję'),\n", + " ('szyję', 'w'),\n", + " ('w', 'takim'),\n", + " ('takim', 'litwinka'),\n", + " ('litwinka', 'tylko'),\n", + " ('tylko', 'chodzić'),\n", + " ('chodzić', 'zwykła'),\n", + " ('zwykła', 'z'),\n", + " ('z', 'rana'),\n", + " ('rana', 'w'),\n", + " ('w', 'takim'),\n", + " ('takim', 'nigdy'),\n", + " ('nigdy', 'nie'),\n", + " ('nie', 'bywa'),\n", + " ('bywa', 'od'),\n", + " ('od', 'mężczyzn'),\n", + " ('mężczyzn', 'widziana'),\n", + " ('widziana', 'więc'),\n", + " ('więc', 'choć'),\n", + " ('choć', 'świadka'),\n", + " ('świadka', 'nie'),\n", + " ('nie', 'miała'),\n", + " ('miała', 'założyła'),\n", + " ('założyła', 'ręce'),\n", + " ('ręce', 'na'),\n", + " ('na', 'piersiach'),\n", + " ('piersiach', 'przydawając'),\n", + " ('przydawając', 'zasłony'),\n", + " ('zasłony', 'sukience'),\n", + " ('sukience', 'włos'),\n", + " ('włos', 'w'),\n", + " ('w', 'pukle'),\n", + " ('pukle', 'nierozwity'),\n", + " ('nierozwity', 'lecz'),\n", + " ('lecz', 'w'),\n", + " ('w', 'węzełki'),\n", + " ('węzełki', 'małe'),\n", + " ('małe', 'pokręcony'),\n", + " ('pokręcony', 'schowany'),\n", + " ('schowany', 'w'),\n", + " ('w', 'drobne'),\n", + " ('drobne', 'strączki'),\n", + " ('strączki', 'białe'),\n", + " ('białe', 'dziwnie'),\n", + " ('dziwnie', 'ozdabiał'),\n", + " ('ozdabiał', 'głowę'),\n", + " ('głowę', 'bo'),\n", + " ('bo', 'od'),\n", + " ('od', 'słońca'),\n", + " ('słońca', 'blasku'),\n", + " ('blasku', 'świecił'),\n", + " ('świecił', 'się'),\n", + " ('się', 'jak'),\n", + " ('jak', 'korona'),\n", + " ('korona', 'na'),\n", + " ('na', 'świętych'),\n", + " ('świętych', 'obrazku'),\n", + " ('obrazku', 'twarzy'),\n", + " ('twarzy', 'nie'),\n", + " ('nie', 'było'),\n", + " ('było', 'widać'),\n", + " ('widać', 'zwrócona'),\n", + " ('zwrócona', 'na'),\n", + " ('na', 'pole'),\n", + " ('pole', 'szukała'),\n", + " ('szukała', 'kogoś'),\n", + " ('kogoś', 'okiem'),\n", + " ('okiem', 'daleko'),\n", + " ('daleko', 'na'),\n", + " ('na', 'dole'),\n", + " ('dole', 'ujrzała'),\n", + " ('ujrzała', 'zaśmiała'),\n", + " ('zaśmiała', 'się'),\n", + " ('się', 'i'),\n", + " ('i', 'klasnęła'),\n", + " ('klasnęła', 'w'),\n", + " ('w', 'dłonie'),\n", + " ('dłonie', 'jak'),\n", + " ('jak', 'biały'),\n", + " ('biały', 'ptak'),\n", + " ('ptak', 'zleciała'),\n", + " ('zleciała', 'z'),\n", + " ('z', 'parkanu'),\n", + " ('parkanu', 'na'),\n", + " ('na', 'błonie'),\n", + " ('błonie', 'i'),\n", + " ('i', 'wionęła'),\n", + " ('wionęła', 'ogrodem'),\n", + " ('ogrodem', 'przez'),\n", + " ('przez', 'płotki'),\n", + " ('płotki', 'przez'),\n", + " ('przez', 'kwiaty'),\n", + " ('kwiaty', 'i'),\n", + " ('i', 'po'),\n", + " ('po', 'desce'),\n", + " ('desce', 'opartej'),\n", + " ('opartej', 'o'),\n", + " ('o', 'ścianę'),\n", + " ('ścianę', 'komnaty'),\n", + " ('komnaty', 'nim'),\n", + " ('nim', 'spostrzegł'),\n", + " ('spostrzegł', 'się'),\n", + " ('się', 'wleciała'),\n", + " ('wleciała', 'przez'),\n", + " ('przez', 'okno'),\n", + " ('okno', 'świecąca'),\n", + " ('świecąca', 'nagła'),\n", + " ('nagła', 'cicha'),\n", + " ('cicha', 'i'),\n", + " ('i', 'lekka'),\n", + " ('lekka', 'jak'),\n", + " ('jak', 'światłość'),\n", + " ('światłość', 'miesiąca'),\n", + " ('miesiąca', 'nucąc'),\n", + " ('nucąc', 'chwyciła'),\n", + " ('chwyciła', 'suknie'),\n", + " ('suknie', 'biegła'),\n", + " ('biegła', 'do'),\n", + " ('do', 'zwierciadła'),\n", + " ('zwierciadła', 'wtem'),\n", + " ('wtem', 'ujrzała'),\n", + " ('ujrzała', 'młodzieńca'),\n", + " ('młodzieńca', 'i'),\n", + " ('i', 'z'),\n", + " ('z', 'rąk'),\n", + " ('rąk', 'jej'),\n", + " ('jej', 'wypadła'),\n", + " ('wypadła', 'suknia'),\n", + " ('suknia', 'a'),\n", + " ('a', 'twarz'),\n", + " ('twarz', 'od'),\n", + " ('od', 'strachu'),\n", + " ('strachu', 'i'),\n", + " ('i', 'dziwu'),\n", + " ('dziwu', 'pobladła'),\n", + " ('pobladła', 'twarz'),\n", + " ('twarz', 'podróżnego'),\n", + " ('podróżnego', 'barwą'),\n", + " ('barwą', 'spłonęła'),\n", + " ('spłonęła', 'rumianą'),\n", + " ('rumianą', 'jak'),\n", + " ('jak', 'obłok'),\n", + " ('obłok', 'gdy'),\n", + " ('gdy', 'z'),\n", + " ('z', 'jutrzenką'),\n", + " ('jutrzenką', 'napotka'),\n", + " ('napotka', 'się'),\n", + " ('się', 'raną'),\n", + " ('raną', 'skromny'),\n", + " ('skromny', 'młodzieniec'),\n", + " ('młodzieniec', 'oczy'),\n", + " ('oczy', 'zmrużył'),\n", + " ('zmrużył', 'i'),\n", + " ('i', 'przysłonił'),\n", + " ('przysłonił', 'chciał'),\n", + " ('chciał', 'coś'),\n", + " ('coś', 'mówić'),\n", + " ('mówić', 'przepraszać'),\n", + " ('przepraszać', 'tylko'),\n", + " ('tylko', 'się'),\n", + " ('się', 'ukłonił'),\n", + " ('ukłonił', 'i'),\n", + " ('i', 'cofnął'),\n", + " ('cofnął', 'się'),\n", + " ('się', 'dziewica'),\n", + " ('dziewica', 'krzyknęła'),\n", + " ('krzyknęła', 'boleśnie'),\n", + " ('boleśnie', 'niewyraźnie'),\n", + " ('niewyraźnie', 'jak'),\n", + " ('jak', 'dziecko'),\n", + " ('dziecko', 'przestraszone'),\n", + " ('przestraszone', 'we'),\n", + " ('we', 'śnie'),\n", + " ('śnie', 'podróżny'),\n", + " ('podróżny', 'zląkł'),\n", + " ('zląkł', 'się'),\n", + " ('się', 'spojrzał'),\n", + " ('spojrzał', 'lecz'),\n", + " ('lecz', 'już'),\n", + " ('już', 'jej'),\n", + " ('jej', 'nie'),\n", + " ('nie', 'było'),\n", + " ('było', 'wyszedł'),\n", + " ('wyszedł', 'zmieszany'),\n", + " ('zmieszany', 'i'),\n", + " ('i', 'czuł'),\n", + " ('czuł', 'że'),\n", + " ('że', 'mu'),\n", + " ('mu', 'serce'),\n", + " ('serce', 'biło'),\n", + " ('biło', 'głośno'),\n", + " ('głośno', 'i'),\n", + " ('i', 'sam'),\n", + " ('sam', 'nie'),\n", + " ('nie', 'wiedział'),\n", + " ('wiedział', 'czy'),\n", + " ('czy', 'go'),\n", + " ('go', 'miało'),\n", + " ('miało', 'śmieszyć'),\n", + " ('śmieszyć', 'to'),\n", + " ('to', 'dziwaczne'),\n", + " ('dziwaczne', 'spotkanie'),\n", + " ('spotkanie', 'czy'),\n", + " ('czy', 'wstydzić'),\n", + " ('wstydzić', 'czy'),\n", + " ('czy', 'cieszyć'),\n", + " ...]" + ] + }, + "execution_count": 9, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "train_ngrams" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "### pytanie- ile jest ngramów?" + ] + }, + { + "cell_type": "code", + "execution_count": 10, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "57020" + ] + }, + "execution_count": 10, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "len(train_ngrams)" + ] + }, + { + "cell_type": "code", + "execution_count": 11, + "metadata": {}, + "outputs": [], + "source": [ + "cnt = Counter(train_ngrams)" + ] + }, + { + "cell_type": "code", + "execution_count": 12, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "Counter({('adam', 'mickiewicz'): 1,\n", + " ('mickiewicz', 'pan'): 1,\n", + " ('pan', 'tadeusz'): 8,\n", + " ('tadeusz', 'czyli'): 1,\n", + " ('czyli', 'ostatni'): 1,\n", + " ('ostatni', 'zajazd'): 1,\n", + " ('zajazd', 'na'): 1,\n", + " ('na', 'litwie'): 14,\n", + " ('litwie', 'księga'): 2,\n", + " ('księga', 'pierwsza'): 1,\n", + " ('pierwsza', 'gospodarstwo'): 1,\n", + " ('gospodarstwo', 'powrót'): 1,\n", + " ('powrót', 'panicza'): 1,\n", + " ('panicza', 'spotkanie'): 1,\n", + " ('spotkanie', 'się'): 3,\n", + " ('się', 'pierwsze'): 1,\n", + " ('pierwsze', 'w'): 1,\n", + " ('w', 'pokoiku'): 1,\n", + " ('pokoiku', 'drugie'): 1,\n", + " ('drugie', 'u'): 1,\n", + " ('u', 'stołu'): 5,\n", + " ('stołu', 'ważna'): 1,\n", + " ('ważna', 'sędziego'): 1,\n", + " ('sędziego', 'nauka'): 1,\n", + " ('nauka', 'o'): 1,\n", + " ('o', 'grzeczności'): 1,\n", + " ('grzeczności', 'podkomorzego'): 1,\n", + " ('podkomorzego', 'uwagi'): 1,\n", + " ('uwagi', 'polityczne'): 1,\n", + " ('polityczne', 'nad'): 1,\n", + " ('nad', 'modami'): 1,\n", + " ('modami', 'początek'): 1,\n", + " ('początek', 'sporu'): 1,\n", + " ('sporu', 'o'): 1,\n", + " ('o', 'kusego'): 4,\n", + " ('kusego', 'i'): 3,\n", + " ('i', 'sokoła'): 3,\n", + " ('sokoła', 'żale'): 1,\n", + " ('żale', 'wojskiego'): 1,\n", + " ('wojskiego', 'ostatni'): 1,\n", + " ('ostatni', 'woźny'): 1,\n", + " ('woźny', 'trybunału'): 2,\n", + " ('trybunału', 'rzut'): 1,\n", + " ('rzut', 'oka'): 2,\n", + " ('oka', 'na'): 1,\n", + " ('na', 'ówczesny'): 1,\n", + " ('ówczesny', 'stan'): 1,\n", + " ('stan', 'polityczny'): 1,\n", + " ('polityczny', 'litwy'): 1,\n", + " ('litwy', 'i'): 1,\n", + " ('i', 'europy'): 1,\n", + " ('europy', 'litwo'): 1,\n", + " ('litwo', 'ojczyzno'): 1,\n", + " ('ojczyzno', 'moja'): 1,\n", + " ('moja', 'ty'): 1,\n", + " ('ty', 'jesteś'): 3,\n", + " ('jesteś', 'jak'): 1,\n", + " ('jak', 'zdrowie'): 1,\n", + " ('zdrowie', 'ile'): 1,\n", + " ('ile', 'cię'): 1,\n", + " ('cię', 'trzeba'): 1,\n", + " ('trzeba', 'cenić'): 1,\n", + " ('cenić', 'ten'): 1,\n", + " ('ten', 'tylko'): 1,\n", + " ('tylko', 'się'): 5,\n", + " ('się', 'dowie'): 2,\n", + " ('dowie', 'kto'): 1,\n", + " ('kto', 'cię'): 1,\n", + " ('cię', 'stracił'): 1,\n", + " ('stracił', 'dziś'): 1,\n", + " ('dziś', 'piękność'): 1,\n", + " ('piękność', 'twą'): 1,\n", + " ('twą', 'w'): 1,\n", + " ('w', 'całej'): 4,\n", + " ('całej', 'ozdobie'): 1,\n", + " ('ozdobie', 'widzę'): 1,\n", + " ('widzę', 'i'): 1,\n", + " ('i', 'opisuję'): 1,\n", + " ('opisuję', 'bo'): 1,\n", + " ('bo', 'tęsknię'): 1,\n", + " ('tęsknię', 'po'): 1,\n", + " ('po', 'tobie'): 1,\n", + " ('tobie', 'panno'): 1,\n", + " ('panno', 'święta'): 1,\n", + " ('święta', 'co'): 1,\n", + " ('co', 'jasnej'): 1,\n", + " ('jasnej', 'bronisz'): 1,\n", + " ('bronisz', 'częstochowy'): 1,\n", + " ('częstochowy', 'i'): 1,\n", + " ('i', 'w'): 44,\n", + " ('w', 'ostrej'): 1,\n", + " ('ostrej', 'świecisz'): 1,\n", + " ('świecisz', 'bramie'): 1,\n", + " ('bramie', 'ty'): 1,\n", + " ('ty', 'co'): 1,\n", + " ('co', 'gród'): 1,\n", + " ('gród', 'zamkowy'): 1,\n", + " ('zamkowy', 'nowogródzki'): 1,\n", + " ('nowogródzki', 'ochraniasz'): 1,\n", + " ('ochraniasz', 'z'): 1,\n", + " ('z', 'jego'): 3,\n", + " ('jego', 'wiernym'): 1,\n", + " ('wiernym', 'ludem'): 1,\n", + " ('ludem', 'jak'): 1,\n", + " ('jak', 'mnie'): 3,\n", + " ('mnie', 'dziecko'): 1,\n", + " ('dziecko', 'do'): 1,\n", + " ('do', 'zdrowia'): 1,\n", + " ('zdrowia', 'powróciłaś'): 1,\n", + " ('powróciłaś', 'cudem'): 1,\n", + " ('cudem', 'gdy'): 1,\n", + " ('gdy', 'od'): 1,\n", + " ('od', 'płaczącej'): 1,\n", + " ('płaczącej', 'matki'): 1,\n", + " ('matki', 'pod'): 1,\n", + " ('pod', 'twoją'): 1,\n", + " ('twoją', 'opiekę'): 1,\n", + " ('opiekę', 'ofiarowany'): 1,\n", + " ('ofiarowany', 'martwą'): 1,\n", + " ('martwą', 'podniosłem'): 1,\n", + " ('podniosłem', 'powiekę'): 1,\n", + " ('powiekę', 'i'): 1,\n", + " ('i', 'zaraz'): 5,\n", + " ('zaraz', 'mogłem'): 1,\n", + " ('mogłem', 'pieszo'): 1,\n", + " ('pieszo', 'do'): 1,\n", + " ('do', 'twych'): 1,\n", + " ('twych', 'świątyń'): 1,\n", + " ('świątyń', 'progu'): 1,\n", + " ('progu', 'iść'): 1,\n", + " ('iść', 'za'): 1,\n", + " ('za', 'wrócone'): 1,\n", + " ('wrócone', 'życie'): 1,\n", + " ('życie', 'podziękować'): 1,\n", + " ('podziękować', 'bogu'): 1,\n", + " ('bogu', 'tak'): 1,\n", + " ('tak', 'nas'): 2,\n", + " ('nas', 'powrócisz'): 1,\n", + " ('powrócisz', 'cudem'): 1,\n", + " ('cudem', 'na'): 1,\n", + " ('na', 'ojczyzny'): 1,\n", + " ('ojczyzny', 'łono'): 1,\n", + " ('łono', 'tymczasem'): 1,\n", + " ('tymczasem', 'przenoś'): 1,\n", + " ('przenoś', 'moją'): 1,\n", + " ('moją', 'duszę'): 1,\n", + " ('duszę', 'utęsknioną'): 1,\n", + " ('utęsknioną', 'do'): 1,\n", + " ('do', 'tych'): 4,\n", + " ('tych', 'pagórków'): 1,\n", + " ('pagórków', 'leśnych'): 1,\n", + " ('leśnych', 'do'): 1,\n", + " ('tych', 'łąk'): 1,\n", + " ('łąk', 'zielonych'): 1,\n", + " ('zielonych', 'szeroko'): 1,\n", + " ('szeroko', 'nad'): 1,\n", + " ('nad', 'błękitnym'): 1,\n", + " ('błękitnym', 'niemnem'): 1,\n", + " ('niemnem', 'rozciągnionych'): 1,\n", + " ('rozciągnionych', 'do'): 1,\n", + " ('tych', 'pól'): 1,\n", + " ('pól', 'malowanych'): 1,\n", + " ('malowanych', 'zbożem'): 1,\n", + " ('zbożem', 'rozmaitem'): 1,\n", + " ('rozmaitem', 'wyzłacanych'): 1,\n", + " ('wyzłacanych', 'pszenicą'): 1,\n", + " ('pszenicą', 'posrebrzanych'): 1,\n", + " ('posrebrzanych', 'żytem'): 1,\n", + " ('żytem', 'gdzie'): 1,\n", + " ('gdzie', 'bursztynowy'): 1,\n", + " ('bursztynowy', 'świerzop'): 1,\n", + " ('świerzop', 'gryka'): 1,\n", + " ('gryka', 'jak'): 1,\n", + " ('jak', 'śnieg'): 2,\n", + " ('śnieg', 'biała'): 1,\n", + " ('biała', 'gdzie'): 1,\n", + " ('gdzie', 'panieńskim'): 1,\n", + " ('panieńskim', 'rumieńcem'): 1,\n", + " ('rumieńcem', 'dzięcielina'): 1,\n", + " ('dzięcielina', 'pała'): 1,\n", + " ('pała', 'a'): 1,\n", + " ('a', 'wszystko'): 4,\n", + " ('wszystko', 'przepasane'): 1,\n", + " ('przepasane', 'jakby'): 1,\n", + " ('jakby', 'wstęgą'): 1,\n", + " ('wstęgą', 'miedzą'): 1,\n", + " ('miedzą', 'zieloną'): 1,\n", + " ('zieloną', 'na'): 1,\n", + " ('na', 'niej'): 1,\n", + " ('niej', 'z'): 2,\n", + " ('z', 'rzadka'): 5,\n", + " ('rzadka', 'ciche'): 1,\n", + " ('ciche', 'grusze'): 1,\n", + " ('grusze', 'siedzą'): 1,\n", + " ('siedzą', 'śród'): 2,\n", + " ('śród', 'takich'): 1,\n", + " ('takich', 'pól'): 1,\n", + " ('pól', 'przed'): 1,\n", + " ('przed', 'laty'): 4,\n", + " ('laty', 'nad'): 1,\n", + " ('nad', 'brzegiem'): 2,\n", + " ('brzegiem', 'ruczaju'): 1,\n", + " ('ruczaju', 'na'): 1,\n", + " ('na', 'pagórku'): 1,\n", + " ('pagórku', 'niewielkim'): 1,\n", + " ('niewielkim', 'we'): 1,\n", + " ('we', 'brzozowym'): 1,\n", + " ('brzozowym', 'gaju'): 1,\n", + " ('gaju', 'stał'): 1,\n", + " ('stał', 'dwór'): 1,\n", + " ('dwór', 'szlachecki'): 1,\n", + " ('szlachecki', 'z'): 1,\n", + " ('z', 'drzewa'): 4,\n", + " ('drzewa', 'lecz'): 1,\n", + " ('lecz', 'podmurowany'): 1,\n", + " ('podmurowany', 'świeciły'): 1,\n", + " ('świeciły', 'się'): 3,\n", + " ('się', 'z'): 56,\n", + " ('z', 'daleka'): 8,\n", + " ('daleka', 'pobielane'): 1,\n", + " ('pobielane', 'ściany'): 1,\n", + " ('ściany', 'tym'): 1,\n", + " ('tym', 'bielsze'): 1,\n", + " ('bielsze', 'że'): 1,\n", + " ('że', 'odbite'): 1,\n", + " ('odbite', 'od'): 1,\n", + " ('od', 'ciemnej'): 1,\n", + " ('ciemnej', 'zieleni'): 1,\n", + " ('zieleni', 'topoli'): 1,\n", + " ('topoli', 'co'): 1,\n", + " ('co', 'go'): 2,\n", + " ('go', 'bronią'): 1,\n", + " ('bronią', 'od'): 1,\n", + " ('od', 'wiatrów'): 1,\n", + " ('wiatrów', 'jesieni'): 1,\n", + " ('jesieni', 'dom'): 1,\n", + " ('dom', 'mieszkalny'): 1,\n", + " ('mieszkalny', 'niewielki'): 1,\n", + " ('niewielki', 'lecz'): 1,\n", + " ('lecz', 'zewsząd'): 1,\n", + " ('zewsząd', 'chędogi'): 1,\n", + " ('chędogi', 'i'): 1,\n", + " ('i', 'stodołę'): 1,\n", + " ('stodołę', 'miał'): 1,\n", + " ('miał', 'wielką'): 1,\n", + " ('wielką', 'i'): 1,\n", + " ('i', 'przy'): 1,\n", + " ('przy', 'niej'): 1,\n", + " ('niej', 'trzy'): 1,\n", + " ('trzy', 'stogi'): 1,\n", + " ('stogi', 'użątku'): 1,\n", + " ('użątku', 'co'): 1,\n", + " ('co', 'pod'): 1,\n", + " ('pod', 'strzechą'): 2,\n", + " ('strzechą', 'zmieścić'): 1,\n", + " ('zmieścić', 'się'): 1,\n", + " ('się', 'nie'): 20,\n", + " ('nie', 'może'): 10,\n", + " ('może', 'widać'): 1,\n", + " ('widać', 'że'): 12,\n", + " ('że', 'okolica'): 1,\n", + " ('okolica', 'obfita'): 1,\n", + " ('obfita', 'we'): 1,\n", + " ('we', 'zboże'): 1,\n", + " ('zboże', 'i'): 2,\n", + " ('i', 'widać'): 3,\n", + " ('widać', 'z'): 7,\n", + " ('z', 'liczby'): 2,\n", + " ('liczby', 'kopic'): 1,\n", + " ('kopic', 'co'): 1,\n", + " ('co', 'wzdłuż'): 1,\n", + " ('wzdłuż', 'i'): 2,\n", + " ('i', 'wszerz'): 3,\n", + " ('wszerz', 'smugów'): 1,\n", + " ('smugów', 'świecą'): 1,\n", + " ('świecą', 'gęsto'): 1,\n", + " ('gęsto', 'jak'): 1,\n", + " ('jak', 'gwiazdy'): 1,\n", + " ('gwiazdy', 'widać'): 1,\n", + " ('liczby', 'pługów'): 1,\n", + " ('pługów', 'orzących'): 1,\n", + " ('orzących', 'wcześnie'): 1,\n", + " ('wcześnie', 'łany'): 1,\n", + " ('łany', 'ogromne'): 1,\n", + " ('ogromne', 'ugoru'): 1,\n", + " ('ugoru', 'czarnoziemne'): 1,\n", + " ('czarnoziemne', 'zapewne'): 1,\n", + " ('zapewne', 'należne'): 1,\n", + " ('należne', 'do'): 1,\n", + " ('do', 'dworu'): 9,\n", + " ('dworu', 'uprawne'): 1,\n", + " ('uprawne', 'dobrze'): 1,\n", + " ('dobrze', 'na'): 3,\n", + " ('na', 'kształt'): 20,\n", + " ('kształt', 'ogrodowych'): 1,\n", + " ('ogrodowych', 'grządek'): 1,\n", + " ('grządek', 'że'): 1,\n", + " ('że', 'w'): 19,\n", + " ('w', 'tym'): 20,\n", + " ('tym', 'domu'): 1,\n", + " ('domu', 'dostatek'): 1,\n", + " ('dostatek', 'mieszka'): 1,\n", + " ('mieszka', 'i'): 1,\n", + " ('i', 'porządek'): 1,\n", + " ('porządek', 'brama'): 1,\n", + " ('brama', 'na'): 1,\n", + " ('na', 'wciąż'): 1,\n", + " ('wciąż', 'otwarta'): 1,\n", + " ('otwarta', 'przechodniom'): 1,\n", + " ('przechodniom', 'ogłasza'): 1,\n", + " ('ogłasza', 'że'): 1,\n", + " ('że', 'gościnna'): 1,\n", + " ('gościnna', 'i'): 1,\n", + " ('i', 'wszystkich'): 2,\n", + " ('wszystkich', 'w'): 2,\n", + " ('w', 'gościnę'): 1,\n", + " ('gościnę', 'zaprasza'): 1,\n", + " ('zaprasza', 'właśnie'): 1,\n", + " ('właśnie', 'dwukonną'): 1,\n", + " ('dwukonną', 'bryką'): 1,\n", + " ('bryką', 'wjechał'): 1,\n", + " ('wjechał', 'młody'): 1,\n", + " ('młody', 'panek'): 1,\n", + " ('panek', 'i'): 1,\n", + " ('i', 'obiegłszy'): 1,\n", + " ('obiegłszy', 'dziedziniec'): 1,\n", + " ('dziedziniec', 'zawrócił'): 1,\n", + " ('zawrócił', 'przed'): 1,\n", + " ('przed', 'ganek'): 2,\n", + " ('ganek', 'wysiadł'): 1,\n", + " ('wysiadł', 'z'): 1,\n", + " ('z', 'powozu'): 1,\n", + " ('powozu', 'konie'): 1,\n", + " ('konie', 'porzucone'): 1,\n", + " ('porzucone', 'same'): 1,\n", + " ('same', 'szczypiąc'): 1,\n", + " ('szczypiąc', 'trawę'): 1,\n", + " ('trawę', 'ciągnęły'): 1,\n", + " ('ciągnęły', 'powoli'): 1,\n", + " ('powoli', 'pod'): 1,\n", + " ('pod', 'bramę'): 2,\n", + " ('bramę', 'we'): 1,\n", + " ('we', 'dworze'): 10,\n", + " ('dworze', 'pusto'): 1,\n", + " ('pusto', 'bo'): 1,\n", + " ('bo', 'drzwi'): 2,\n", + " ('drzwi', 'od'): 1,\n", + " ('od', 'ganku'): 1,\n", + " ('ganku', 'zamknięto'): 1,\n", + " ('zamknięto', 'zaszczepkami'): 1,\n", + " ('zaszczepkami', 'i'): 1,\n", + " ('i', 'kołkiem'): 1,\n", + " ('kołkiem', 'zaszczepki'): 1,\n", + " ('zaszczepki', 'przetknięto'): 1,\n", + " ('przetknięto', 'podróżny'): 1,\n", + " ('podróżny', 'do'): 1,\n", + " ('do', 'folwarku'): 3,\n", + " ('folwarku', 'nie'): 2,\n", + " ('nie', 'biegł'): 1,\n", + " ('biegł', 'sług'): 1,\n", + " ('sług', 'zapytać'): 1,\n", + " ('zapytać', 'odemknął'): 1,\n", + " ('odemknął', 'wbiegł'): 1,\n", + " ('wbiegł', 'do'): 1,\n", + " ('do', 'domu'): 12,\n", + " ('domu', 'pragnął'): 1,\n", + " ('pragnął', 'go'): 1,\n", + " ('go', 'powitać'): 1,\n", + " ('powitać', 'dawno'): 1,\n", + " ('dawno', 'domu'): 1,\n", + " ('domu', 'nie'): 1,\n", + " ('nie', 'widział'): 7,\n", + " ('widział', 'bo'): 2,\n", + " ('bo', 'w'): 8,\n", + " ('w', 'dalekim'): 1,\n", + " ('dalekim', 'mieście'): 1,\n", + " ('mieście', 'kończył'): 1,\n", + " ('kończył', 'nauki'): 1,\n", + " ('nauki', 'końca'): 1,\n", + " ('końca', 'doczekał'): 1,\n", + " ('doczekał', 'nareszcie'): 1,\n", + " ('nareszcie', 'wbiega'): 1,\n", + " ('wbiega', 'i'): 1,\n", + " ('i', 'okiem'): 2,\n", + " ('okiem', 'chciwie'): 1,\n", + " ('chciwie', 'ściany'): 1,\n", + " ('ściany', 'starodawne'): 1,\n", + " ('starodawne', 'ogląda'): 1,\n", + " ('ogląda', 'czule'): 1,\n", + " ('czule', 'jako'): 1,\n", + " ('jako', 'swe'): 1,\n", + " ('swe', 'znajome'): 1,\n", + " ('znajome', 'dawne'): 1,\n", + " ('dawne', 'też'): 1,\n", + " ('też', 'same'): 4,\n", + " ('same', 'widzi'): 1,\n", + " ('widzi', 'sprzęty'): 1,\n", + " ('sprzęty', 'też'): 1,\n", + " ('same', 'obicia'): 1,\n", + " ('obicia', 'z'): 1,\n", + " ('z', 'którymi'): 1,\n", + " ('którymi', 'się'): 1,\n", + " ('się', 'zabawiać'): 1,\n", + " ('zabawiać', 'lubił'): 1,\n", + " ('lubił', 'od'): 1,\n", + " ('od', 'powicia'): 1,\n", + " ('powicia', 'lecz'): 1,\n", + " ('lecz', 'mniej'): 1,\n", + " ('mniej', 'wielkie'): 1,\n", + " ('wielkie', 'mniej'): 1,\n", + " ('mniej', 'piękne'): 1,\n", + " ('piękne', 'niż'): 1,\n", + " ('niż', 'się'): 2,\n", + " ('się', 'dawniej'): 1,\n", + " ('dawniej', 'zdały'): 1,\n", + " ('zdały', 'i'): 1,\n", + " ('i', 'też'): 1,\n", + " ('same', 'portrety'): 1,\n", + " ('portrety', 'na'): 1,\n", + " ('na', 'ścianach'): 1,\n", + " ('ścianach', 'wisiały'): 1,\n", + " ('wisiały', 'tu'): 1,\n", + " ('tu', 'kościuszko'): 1,\n", + " ('kościuszko', 'w'): 1,\n", + " ('w', 'czamarce'): 1,\n", + " ('czamarce', 'krakowskiej'): 1,\n", + " ('krakowskiej', 'z'): 1,\n", + " ('z', 'oczyma'): 2,\n", + " ('oczyma', 'podniesionymi'): 1,\n", + " ('podniesionymi', 'w'): 1,\n", + " ('w', 'niebo'): 8,\n", + " ('niebo', 'miecz'): 1,\n", + " ('miecz', 'oburącz'): 1,\n", + " ('oburącz', 'trzyma'): 1,\n", + " ('trzyma', 'takim'): 1,\n", + " ('takim', 'był'): 1,\n", + " ('był', 'gdy'): 1,\n", + " ('gdy', 'przysięgał'): 1,\n", + " ('przysięgał', 'na'): 1,\n", + " ('na', 'stopniach'): 1,\n", + " ('stopniach', 'ołtarzów'): 1,\n", + " ('ołtarzów', 'że'): 1,\n", + " ('że', 'tym'): 1,\n", + " ('tym', 'mieczem'): 1,\n", + " ('mieczem', 'wypędzi'): 1,\n", + " ('wypędzi', 'z'): 1,\n", + " ('z', 'polski'): 2,\n", + " ('polski', 'trzech'): 1,\n", + " ('trzech', 'mocarzów'): 1,\n", + " ('mocarzów', 'albo'): 1,\n", + " ('albo', 'sam'): 1,\n", + " ('sam', 'na'): 3,\n", + " ('na', 'nim'): 10,\n", + " ('nim', 'padnie'): 1,\n", + " ('padnie', 'dalej'): 1,\n", + " ('dalej', 'w'): 3,\n", + " ('w', 'polskiej'): 1,\n", + " ('polskiej', 'szacie'): 1,\n", + " ('szacie', 'siedzi'): 1,\n", + " ('siedzi', 'rejtan'): 1,\n", + " ('rejtan', 'żałośny'): 1,\n", + " ('żałośny', 'po'): 1,\n", + " ('po', 'wolności'): 1,\n", + " ('wolności', 'stracie'): 1,\n", + " ('stracie', 'w'): 1,\n", + " ('w', 'ręku'): 15,\n", + " ('ręku', 'trzyma'): 1,\n", + " ('trzyma', 'nóż'): 1,\n", + " ('nóż', 'ostrzem'): 1,\n", + " ('ostrzem', 'zwrócony'): 1,\n", + " ('zwrócony', 'do'): 2,\n", + " ('do', 'łona'): 1,\n", + " ('łona', 'a'): 1,\n", + " ('a', 'przed'): 2,\n", + " ('przed', 'nim'): 5,\n", + " ('nim', 'leży'): 1,\n", + " ('leży', 'fedon'): 1,\n", + " ('fedon', 'i'): 1,\n", + " ('i', 'żywot'): 1,\n", + " ('żywot', 'katona'): 1,\n", + " ('katona', 'dalej'): 1,\n", + " ('dalej', 'jasiński'): 1,\n", + " ('jasiński', 'młodzian'): 1,\n", + " ('młodzian', 'piękny'): 1,\n", + " ('piękny', 'i'): 1,\n", + " ('i', 'posępny'): 2,\n", + " ('posępny', 'obok'): 1,\n", + " ('obok', 'korsak'): 1,\n", + " ('korsak', 'towarzysz'): 1,\n", + " ('towarzysz', 'jego'): 1,\n", + " ('jego', 'nieodstępny'): 1,\n", + " ('nieodstępny', 'stoją'): 1,\n", + " ('stoją', 'na'): 2,\n", + " ('na', 'szańcach'): 1,\n", + " ('szańcach', 'pragi'): 1,\n", + " ('pragi', 'na'): 1,\n", + " ('na', 'stosach'): 1,\n", + " ('stosach', 'moskali'): 1,\n", + " ('moskali', 'siekąc'): 1,\n", + " ('siekąc', 'wrogów'): 1,\n", + " ('wrogów', 'a'): 2,\n", + " ('a', 'praga'): 1,\n", + " ('praga', 'już'): 1,\n", + " ('już', 'się'): 5,\n", + " ('się', 'wkoło'): 5,\n", + " ('wkoło', 'pali'): 1,\n", + " ('pali', 'nawet'): 1,\n", + " ('nawet', 'stary'): 1,\n", + " ('stary', 'stojący'): 1,\n", + " ('stojący', 'zegar'): 1,\n", + " ('zegar', 'kurantowy'): 1,\n", + " ('kurantowy', 'w'): 1,\n", + " ('w', 'drewnianej'): 1,\n", + " ('drewnianej', 'szafie'): 1,\n", + " ('szafie', 'poznał'): 1,\n", + " ('poznał', 'u'): 1,\n", + " ('u', 'wniścia'): 1,\n", + " ('wniścia', 'alkowy'): 1,\n", + " ('alkowy', 'i'): 1,\n", + " ('i', 'z'): 54,\n", + " ('z', 'dziecinną'): 1,\n", + " ('dziecinną', 'radością'): 1,\n", + " ('radością', 'pociągnął'): 1,\n", + " ('pociągnął', 'za'): 1,\n", + " ('za', 'sznurek'): 1,\n", + " ('sznurek', 'by'): 1,\n", + " ('by', 'stary'): 1,\n", + " ('stary', 'dąbrowskiego'): 1,\n", + " ('dąbrowskiego', 'usłyszeć'): 1,\n", + " ('usłyszeć', 'mazurek'): 1,\n", + " ('mazurek', 'biegał'): 1,\n", + " ('biegał', 'po'): 2,\n", + " ('po', 'całym'): 2,\n", + " ('całym', 'domu'): 1,\n", + " ('domu', 'i'): 5,\n", + " ('i', 'szukał'): 2,\n", + " ('szukał', 'komnaty'): 1,\n", + " ('komnaty', 'gdzie'): 1,\n", + " ('gdzie', 'mieszkał'): 1,\n", + " ('mieszkał', 'dzieckiem'): 1,\n", + " ('dzieckiem', 'będąc'): 1,\n", + " ('będąc', 'przed'): 1,\n", + " ('przed', 'dziesięciu'): 1,\n", + " ('dziesięciu', 'laty'): 1,\n", + " ('laty', 'wchodzi'): 1,\n", + " ('wchodzi', 'cofnął'): 1,\n", + " ('cofnął', 'się'): 4,\n", + " ('się', 'toczył'): 2,\n", + " ('toczył', 'zdumione'): 1,\n", + " ('zdumione', 'źrenice'): 1,\n", + " ('źrenice', 'po'): 1,\n", + " ('po', 'ścianach'): 1,\n", + " ('ścianach', 'w'): 1,\n", + " ('w', 'tej'): 13,\n", + " ('tej', 'komnacie'): 1,\n", + " ('komnacie', 'mieszkanie'): 1,\n", + " ('mieszkanie', 'kobiéce'): 1,\n", + " ('kobiéce', 'któż'): 1,\n", + " ('któż', 'by'): 3,\n", + " ('by', 'tu'): 1,\n", + " ('tu', 'mieszkał'): 1,\n", + " ('mieszkał', 'stary'): 1,\n", + " ('stary', 'stryj'): 1,\n", + " ('stryj', 'nie'): 1,\n", + " ('nie', 'był'): 10,\n", + " ('był', 'żonaty'): 1,\n", + " ('żonaty', 'a'): 1,\n", + " ('a', 'ciotka'): 1,\n", + " ('ciotka', 'w'): 1,\n", + " ('w', 'petersburgu'): 1,\n", + " ('petersburgu', 'mieszkała'): 1,\n", + " ('mieszkała', 'przed'): 1,\n", + " ('laty', 'to'): 1,\n", + " ('to', 'nie'): 13,\n", + " ('był', 'ochmistrzyni'): 1,\n", + " ('ochmistrzyni', 'pokój'): 1,\n", + " ('pokój', 'fortepiano'): 1,\n", + " ('fortepiano', 'na'): 1,\n", + " ('nim', 'nuty'): 1,\n", + " ('nuty', 'i'): 1,\n", + " ('i', 'książki'): 1,\n", + " ('książki', 'wszystko'): 1,\n", + " ('wszystko', 'porzucano'): 1,\n", + " ('porzucano', 'niedbale'): 1,\n", + " ('niedbale', 'i'): 1,\n", + " ('i', 'bezładnie'): 1,\n", + " ('bezładnie', 'nieporządek'): 1,\n", + " ('nieporządek', 'miły'): 1,\n", + " ('miły', 'niestare'): 1,\n", + " ('niestare', 'były'): 1,\n", + " ('były', 'rączki'): 1,\n", + " ('rączki', 'co'): 1,\n", + " ('co', 'je'): 2,\n", + " ('je', 'tak'): 1,\n", + " ('tak', 'rzuciły'): 1,\n", + " ('rzuciły', 'tuż'): 1,\n", + " ('tuż', 'i'): 2,\n", + " ('i', 'sukienka'): 1,\n", + " ('sukienka', 'biała'): 1,\n", + " ('biała', 'świeżo'): 1,\n", + " ('świeżo', 'z'): 1,\n", + " ('z', 'kołka'): 2,\n", + " ('kołka', 'zdjęta'): 1,\n", + " ('zdjęta', 'do'): 1,\n", + " ('do', 'ubrania'): 2,\n", + " ('ubrania', 'na'): 1,\n", + " ('na', 'krzesła'): 1,\n", + " ('krzesła', 'poręczu'): 1,\n", + " ('poręczu', 'rozpięta'): 1,\n", + " ('rozpięta', 'a'): 1,\n", + " ('a', 'na'): 15,\n", + " ('na', 'oknach'): 1,\n", + " ('oknach', 'donice'): 1,\n", + " ('donice', 'z'): 1,\n", + " ('z', 'pachnącymi'): 1,\n", + " ('pachnącymi', 'ziołki'): 1,\n", + " ('ziołki', 'geranium'): 1,\n", + " ('geranium', 'lewkonija'): 1,\n", + " ('lewkonija', 'astry'): 1,\n", + " ('astry', 'i'): 1,\n", + " ('i', 'fijołki'): 1,\n", + " ('fijołki', 'podróżny'): 1,\n", + " ('podróżny', 'stanął'): 1,\n", + " ('stanął', 'w'): 3,\n", + " ('w', 'jednym'): 2,\n", + " ('jednym', 'z'): 1,\n", + " ('z', 'okien'): 1,\n", + " ('okien', 'nowe'): 1,\n", + " ('nowe', 'dziwo'): 1,\n", + " ('dziwo', 'w'): 1,\n", + " ('w', 'sadzie'): 2,\n", + " ('sadzie', 'na'): 1,\n", + " ('na', 'brzegu'): 1,\n", + " ('brzegu', 'niegdyś'): 1,\n", + " ('niegdyś', 'zarosłym'): 1,\n", + " ('zarosłym', 'pokrzywą'): 1,\n", + " ('pokrzywą', 'był'): 1,\n", + " ('był', 'maleńki'): 1,\n", + " ('maleńki', 'ogródek'): 1,\n", + " ('ogródek', 'ścieżkami'): 1,\n", + " ('ścieżkami', 'porznięty'): 1,\n", + " ('porznięty', 'pełen'): 1,\n", + " ('pełen', 'bukietów'): 1,\n", + " ('bukietów', 'trawy'): 1,\n", + " ('trawy', 'angielskiej'): 1,\n", + " ('angielskiej', 'i'): 1,\n", + " ('i', 'mięty'): 1,\n", + " ('mięty', 'drewniany'): 1,\n", + " ('drewniany', 'drobny'): 1,\n", + " ('drobny', 'w'): 1,\n", + " ('w', 'cyfrę'): 1,\n", + " ('cyfrę', 'powiązany'): 1,\n", + " ('powiązany', 'płotek'): 1,\n", + " ('płotek', 'połyskał'): 1,\n", + " ('połyskał', 'się'): 2,\n", + " ('się', 'wstążkami'): 1,\n", + " ('wstążkami', 'jaskrawych'): 1,\n", + " ('jaskrawych', 'stokrotek'): 1,\n", + " ('stokrotek', 'grządki'): 1,\n", + " ('grządki', 'widać'): 1,\n", + " ('że', 'były'): 1,\n", + " ('były', 'świeżo'): 1,\n", + " ('świeżo', 'polewane'): 1,\n", + " ('polewane', 'tuż'): 1,\n", + " ('tuż', 'stało'): 1,\n", + " ('stało', 'wody'): 1,\n", + " ('wody', 'pełne'): 1,\n", + " ('pełne', 'naczynie'): 1,\n", + " ('naczynie', 'blaszane'): 1,\n", + " ('blaszane', 'ale'): 1,\n", + " ('ale', 'nigdzie'): 1,\n", + " ('nigdzie', 'nie'): 1,\n", + " ('nie', 'widać'): 3,\n", + " ('widać', 'było'): 6,\n", + " ('było', 'ogrodniczki'): 1,\n", + " ('ogrodniczki', 'tylko'): 1,\n", + " ('tylko', 'co'): 2,\n", + " ('co', 'wyszła'): 1,\n", + " ('wyszła', 'jeszcze'): 1,\n", + " ('jeszcze', 'kołyszą'): 1,\n", + " ('kołyszą', 'się'): 1,\n", + " ('się', 'drzwiczki'): 1,\n", + " ('drzwiczki', 'świeżo'): 1,\n", + " ('świeżo', 'trącone'): 1,\n", + " ('trącone', 'blisko'): 1,\n", + " ('blisko', 'drzwi'): 1,\n", + " ('drzwi', 'ślad'): 1,\n", + " ('ślad', 'widać'): 1,\n", + " ('widać', 'nóżki'): 1,\n", + " ('nóżki', 'na'): 1,\n", + " ('na', 'piasku'): 2,\n", + " ('piasku', 'bez'): 1,\n", + " ('bez', 'trzewika'): 1,\n", + " ('trzewika', 'była'): 1,\n", + " ('była', 'i'): 2,\n", + " ('i', 'pończoszki'): 1,\n", + " ('pończoszki', 'na'): 1,\n", + " ('piasku', 'drobnym'): 1,\n", + " ('drobnym', 'suchym'): 1,\n", + " ('suchym', 'białym'): 1,\n", + " ('białym', 'na'): 1,\n", + " ('kształt', 'śniegu'): 1,\n", + " ('śniegu', 'ślad'): 1,\n", + " ('ślad', 'wyraźny'): 1,\n", + " ('wyraźny', 'lecz'): 1,\n", + " ('lecz', 'lekki'): 1,\n", + " ('lekki', 'odgadniesz'): 1,\n", + " ('odgadniesz', 'że'): 1,\n", + " ('w', 'biegu'): 6,\n", + " ('biegu', 'chybkim'): 1,\n", + " ('chybkim', 'był'): 1,\n", + " ('był', 'zostawiony'): 1,\n", + " ('zostawiony', 'nóżkami'): 1,\n", + " ('nóżkami', 'drobnemi'): 1,\n", + " ('drobnemi', 'od'): 1,\n", + " ('od', 'kogoś'): 1,\n", + " ('kogoś', 'co'): 1,\n", + " ('co', 'zaledwie'): 1,\n", + " ('zaledwie', 'dotykał'): 1,\n", + " ('dotykał', 'się'): 1,\n", + " ('się', 'ziemi'): 1,\n", + " ('ziemi', 'podróżny'): 1,\n", + " ('podróżny', 'długo'): 1,\n", + " ('długo', 'w'): 4,\n", + " ('w', 'oknie'): 1,\n", + " ('oknie', 'stał'): 1,\n", + " ('stał', 'patrząc'): 1,\n", + " ('patrząc', 'dumając'): 1,\n", + " ('dumając', 'wonnymi'): 1,\n", + " ('wonnymi', 'powiewami'): 1,\n", + " ('powiewami', 'kwiatów'): 1,\n", + " ('kwiatów', 'oddychając'): 1,\n", + " ('oddychając', 'oblicze'): 1,\n", + " ('oblicze', 'aż'): 1,\n", + " ('aż', 'na'): 4,\n", + " ('na', 'krzaki'): 1,\n", + " ('krzaki', 'fijołkowe'): 1,\n", + " ('fijołkowe', 'skłonił'): 1,\n", + " ('skłonił', 'oczyma'): 1,\n", + " ('oczyma', 'ciekawymi'): 1,\n", + " ('ciekawymi', 'po'): 1,\n", + " ('po', 'drożynach'): 1,\n", + " ('drożynach', 'gonił'): 1,\n", + " ('gonił', 'i'): 2,\n", + " ('i', 'znowu'): 10,\n", + " ('znowu', 'je'): 1,\n", + " ('je', 'na'): 2,\n", + " ('na', 'drobnych'): 1,\n", + " ('drobnych', 'śladach'): 1,\n", + " ('śladach', 'zatrzymywał'): 1,\n", + " ('zatrzymywał', 'myślał'): 1,\n", + " ('myślał', 'o'): 1,\n", + " ('o', 'nich'): 2,\n", + " ('nich', 'i'): 1,\n", + " ('i', 'czyje'): 1,\n", + " ('czyje', 'były'): 1,\n", + " ('były', 'odgadywał'): 1,\n", + " ('odgadywał', 'przypadkiem'): 1,\n", + " ('przypadkiem', 'oczy'): 1,\n", + " ('oczy', 'podniósł'): 2,\n", + " ('podniósł', 'i'): 2,\n", + " ('i', 'tuż'): 1,\n", + " ('tuż', 'na'): 1,\n", + " ('na', 'parkanie'): 3,\n", + " ('parkanie', 'stała'): 1,\n", + " ('stała', 'młoda'): 1,\n", + " ('młoda', 'dziewczyna'): 1,\n", + " ('dziewczyna', 'białe'): 1,\n", + " ('białe', 'jej'): 1,\n", + " ('jej', 'ubranie'): 1,\n", + " ('ubranie', 'wysmukłą'): 1,\n", + " ('wysmukłą', 'postać'): 1,\n", + " ('postać', 'tylko'): 1,\n", + " ('tylko', 'aż'): 1,\n", + " ('aż', 'do'): 10,\n", + " ('do', 'piersi'): 2,\n", + " ('piersi', 'kryje'): 1,\n", + " ('kryje', 'odsłaniając'): 1,\n", + " ('odsłaniając', 'ramiona'): 1,\n", + " ('ramiona', 'i'): 2,\n", + " ('i', 'łabędzią'): 1,\n", + " ('łabędzią', 'szyję'): 1,\n", + " ('szyję', 'w'): 1,\n", + " ('w', 'takim'): 4,\n", + " ('takim', 'litwinka'): 1,\n", + " ('litwinka', 'tylko'): 1,\n", + " ('tylko', 'chodzić'): 1,\n", + " ('chodzić', 'zwykła'): 1,\n", + " ('zwykła', 'z'): 1,\n", + " ('z', 'rana'): 7,\n", + " ('rana', 'w'): 1,\n", + " ('takim', 'nigdy'): 1,\n", + " ('nigdy', 'nie'): 13,\n", + " ('nie', 'bywa'): 1,\n", + " ('bywa', 'od'): 1,\n", + " ('od', 'mężczyzn'): 1,\n", + " ('mężczyzn', 'widziana'): 1,\n", + " ('widziana', 'więc'): 1,\n", + " ('więc', 'choć'): 1,\n", + " ('choć', 'świadka'): 1,\n", + " ('świadka', 'nie'): 1,\n", + " ('nie', 'miała'): 3,\n", + " ('miała', 'założyła'): 1,\n", + " ('założyła', 'ręce'): 1,\n", + " ('ręce', 'na'): 2,\n", + " ('na', 'piersiach'): 3,\n", + " ('piersiach', 'przydawając'): 1,\n", + " ('przydawając', 'zasłony'): 1,\n", + " ('zasłony', 'sukience'): 1,\n", + " ('sukience', 'włos'): 1,\n", + " ('włos', 'w'): 1,\n", + " ('w', 'pukle'): 2,\n", + " ('pukle', 'nierozwity'): 1,\n", + " ('nierozwity', 'lecz'): 1,\n", + " ('lecz', 'w'): 6,\n", + " ('w', 'węzełki'): 1,\n", + " ('węzełki', 'małe'): 1,\n", + " ('małe', 'pokręcony'): 1,\n", + " ('pokręcony', 'schowany'): 1,\n", + " ('schowany', 'w'): 1,\n", + " ('w', 'drobne'): 2,\n", + " ('drobne', 'strączki'): 1,\n", + " ('strączki', 'białe'): 1,\n", + " ('białe', 'dziwnie'): 1,\n", + " ('dziwnie', 'ozdabiał'): 1,\n", + " ('ozdabiał', 'głowę'): 1,\n", + " ('głowę', 'bo'): 1,\n", + " ('bo', 'od'): 3,\n", + " ('od', 'słońca'): 5,\n", + " ('słońca', 'blasku'): 2,\n", + " ('blasku', 'świecił'): 1,\n", + " ('świecił', 'się'): 2,\n", + " ('się', 'jak'): 17,\n", + " ('jak', 'korona'): 2,\n", + " ('korona', 'na'): 2,\n", + " ('na', 'świętych'): 2,\n", + " ('świętych', 'obrazku'): 2,\n", + " ('obrazku', 'twarzy'): 1,\n", + " ('twarzy', 'nie'): 3,\n", + " ('nie', 'było'): 13,\n", + " ('było', 'widać'): 2,\n", + " ('widać', 'zwrócona'): 1,\n", + " ('zwrócona', 'na'): 1,\n", + " ('na', 'pole'): 6,\n", + " ('pole', 'szukała'): 1,\n", + " ('szukała', 'kogoś'): 1,\n", + " ('kogoś', 'okiem'): 1,\n", + " ('okiem', 'daleko'): 1,\n", + " ('daleko', 'na'): 3,\n", + " ('na', 'dole'): 3,\n", + " ('dole', 'ujrzała'): 1,\n", + " ('ujrzała', 'zaśmiała'): 1,\n", + " ('zaśmiała', 'się'): 2,\n", + " ('się', 'i'): 46,\n", + " ('i', 'klasnęła'): 2,\n", + " ('klasnęła', 'w'): 2,\n", + " ('w', 'dłonie'): 2,\n", + " ('dłonie', 'jak'): 1,\n", + " ('jak', 'biały'): 1,\n", + " ('biały', 'ptak'): 1,\n", + " ('ptak', 'zleciała'): 1,\n", + " ('zleciała', 'z'): 1,\n", + " ('z', 'parkanu'): 1,\n", + " ('parkanu', 'na'): 1,\n", + " ('na', 'błonie'): 2,\n", + " ('błonie', 'i'): 1,\n", + " ('i', 'wionęła'): 1,\n", + " ('wionęła', 'ogrodem'): 1,\n", + " ('ogrodem', 'przez'): 1,\n", + " ('przez', 'płotki'): 1,\n", + " ('płotki', 'przez'): 1,\n", + " ('przez', 'kwiaty'): 1,\n", + " ('kwiaty', 'i'): 2,\n", + " ('i', 'po'): 16,\n", + " ('po', 'desce'): 1,\n", + " ('desce', 'opartej'): 1,\n", + " ('opartej', 'o'): 1,\n", + " ('o', 'ścianę'): 2,\n", + " ('ścianę', 'komnaty'): 1,\n", + " ('komnaty', 'nim'): 1,\n", + " ('nim', 'spostrzegł'): 1,\n", + " ('spostrzegł', 'się'): 1,\n", + " ('się', 'wleciała'): 1,\n", + " ('wleciała', 'przez'): 1,\n", + " ('przez', 'okno'): 5,\n", + " ('okno', 'świecąca'): 1,\n", + " ('świecąca', 'nagła'): 1,\n", + " ('nagła', 'cicha'): 1,\n", + " ('cicha', 'i'): 2,\n", + " ('i', 'lekka'): 1,\n", + " ('lekka', 'jak'): 1,\n", + " ('jak', 'światłość'): 1,\n", + " ('światłość', 'miesiąca'): 1,\n", + " ('miesiąca', 'nucąc'): 1,\n", + " ('nucąc', 'chwyciła'): 1,\n", + " ('chwyciła', 'suknie'): 1,\n", + " ('suknie', 'biegła'): 1,\n", + " ('biegła', 'do'): 1,\n", + " ('do', 'zwierciadła'): 1,\n", + " ('zwierciadła', 'wtem'): 1,\n", + " ('wtem', 'ujrzała'): 1,\n", + " ('ujrzała', 'młodzieńca'): 1,\n", + " ('młodzieńca', 'i'): 1,\n", + " ('z', 'rąk'): 8,\n", + " ('rąk', 'jej'): 1,\n", + " ('jej', 'wypadła'): 1,\n", + " ('wypadła', 'suknia'): 1,\n", + " ('suknia', 'a'): 1,\n", + " ('a', 'twarz'): 1,\n", + " ('twarz', 'od'): 1,\n", + " ('od', 'strachu'): 1,\n", + " ('strachu', 'i'): 1,\n", + " ('i', 'dziwu'): 1,\n", + " ('dziwu', 'pobladła'): 1,\n", + " ('pobladła', 'twarz'): 1,\n", + " ('twarz', 'podróżnego'): 1,\n", + " ('podróżnego', 'barwą'): 1,\n", + " ('barwą', 'spłonęła'): 1,\n", + " ('spłonęła', 'rumianą'): 1,\n", + " ('rumianą', 'jak'): 1,\n", + " ('jak', 'obłok'): 1,\n", + " ('obłok', 'gdy'): 1,\n", + " ('gdy', 'z'): 5,\n", + " ('z', 'jutrzenką'): 1,\n", + " ('jutrzenką', 'napotka'): 1,\n", + " ('napotka', 'się'): 1,\n", + " ('się', 'raną'): 1,\n", + " ('raną', 'skromny'): 1,\n", + " ('skromny', 'młodzieniec'): 1,\n", + " ('młodzieniec', 'oczy'): 1,\n", + " ('oczy', 'zmrużył'): 2,\n", + " ('zmrużył', 'i'): 1,\n", + " ('i', 'przysłonił'): 1,\n", + " ('przysłonił', 'chciał'): 1,\n", + " ('chciał', 'coś'): 2,\n", + " ('coś', 'mówić'): 2,\n", + " ('mówić', 'przepraszać'): 1,\n", + " ('przepraszać', 'tylko'): 1,\n", + " ('się', 'ukłonił'): 1,\n", + " ('ukłonił', 'i'): 1,\n", + " ('i', 'cofnął'): 1,\n", + " ('się', 'dziewica'): 1,\n", + " ('dziewica', 'krzyknęła'): 1,\n", + " ('krzyknęła', 'boleśnie'): 1,\n", + " ('boleśnie', 'niewyraźnie'): 1,\n", + " ('niewyraźnie', 'jak'): 1,\n", + " ('jak', 'dziecko'): 2,\n", + " ('dziecko', 'przestraszone'): 1,\n", + " ('przestraszone', 'we'): 1,\n", + " ('we', 'śnie'): 2,\n", + " ('śnie', 'podróżny'): 1,\n", + " ('podróżny', 'zląkł'): 1,\n", + " ('zląkł', 'się'): 3,\n", + " ('się', 'spojrzał'): 1,\n", + " ('spojrzał', 'lecz'): 1,\n", + " ('lecz', 'już'): 1,\n", + " ('już', 'jej'): 1,\n", + " ('jej', 'nie'): 4,\n", + " ('było', 'wyszedł'): 1,\n", + " ('wyszedł', 'zmieszany'): 1,\n", + " ('zmieszany', 'i'): 1,\n", + " ('i', 'czuł'): 3,\n", + " ('czuł', 'że'): 7,\n", + " ('że', 'mu'): 5,\n", + " ('mu', 'serce'): 1,\n", + " ('serce', 'biło'): 1,\n", + " ('biło', 'głośno'): 1,\n", + " ('głośno', 'i'): 1,\n", + " ('i', 'sam'): 5,\n", + " ('sam', 'nie'): 9,\n", + " ('nie', 'wiedział'): 8,\n", + " ('wiedział', 'czy'): 2,\n", + " ('czy', 'go'): 1,\n", + " ('go', 'miało'): 1,\n", + " ('miało', 'śmieszyć'): 1,\n", + " ('śmieszyć', 'to'): 1,\n", + " ('to', 'dziwaczne'): 1,\n", + " ('dziwaczne', 'spotkanie'): 1,\n", + " ('spotkanie', 'czy'): 1,\n", + " ('czy', 'wstydzić'): 1,\n", + " ('wstydzić', 'czy'): 1,\n", + " ('czy', 'cieszyć'): 1,\n", + " ('cieszyć', 'tymczasem'): 1,\n", + " ('tymczasem', 'na'): 2,\n", + " ('na', 'folwarku'): 1,\n", + " ('nie', 'uszło'): 1,\n", + " ('uszło', 'baczności'): 1,\n", + " ('baczności', 'że'): 1,\n", + " ('że', 'przed'): 1,\n", + " ('ganek', 'zajechał'): 1,\n", + " ('zajechał', 'któryś'): 1,\n", + " ('któryś', 'z'): 1,\n", + " ('z', 'nowych'): 1,\n", + " ('nowych', 'gości'): 1,\n", + " ('gości', 'już'): 1,\n", + " ('już', 'konie'): 1,\n", + " ('konie', 'w'): 1,\n", + " ('w', 'stajnią'): 1,\n", + " ('stajnią', 'wzięto'): 1,\n", + " ('wzięto', 'już'): 1,\n", + " ...})" + ] + }, + "execution_count": 12, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "cnt" + ] + }, + { + "cell_type": "code", + "execution_count": 13, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "[(('się', 'w'), 67),\n", + " (('się', 'z'), 56),\n", + " (('i', 'z'), 54),\n", + " (('się', 'i'), 46),\n", + " (('i', 'w'), 44),\n", + " (('się', 'na'), 43),\n", + " (('i', 'na'), 31),\n", + " (('i', 'tak'), 30),\n", + " (('co', 'się'), 29),\n", + " (('za', 'nim'), 25),\n", + " (('w', 'domu'), 24),\n", + " (('z', 'nim'), 24),\n", + " (('o', 'tym'), 24),\n", + " (('że', 'się'), 23),\n", + " (('jak', 'gdyby'), 22),\n", + " (('jak', 'w'), 22),\n", + " (('się', 'do'), 21),\n", + " (('z', 'wolna'), 21),\n", + " (('nic', 'nie'), 21),\n", + " (('się', 'nie'), 20),\n", + " (('na', 'kształt'), 20),\n", + " (('w', 'tym'), 20),\n", + " (('na', 'koniec'), 20),\n", + " (('że', 'w'), 19),\n", + " (('na', 'to'), 19),\n", + " (('i', 'nie'), 19),\n", + " (('z', 'tyłu'), 19),\n", + " (('nie', 'jest'), 18),\n", + " (('się', 'jak'), 17),\n", + " (('u', 'nas'), 17),\n", + " (('i', 'po'), 16),\n", + " (('nie', 'mógł'), 16),\n", + " (('nie', 'ma'), 16),\n", + " (('w', 'ręku'), 15),\n", + " (('a', 'na'), 15),\n", + " (('pan', 'sędzia'), 15),\n", + " (('jak', 'na'), 15),\n", + " (('na', 'świecie'), 15),\n", + " (('w', 'końcu'), 15),\n", + " (('w', 'środku'), 15),\n", + " (('co', 'to'), 15),\n", + " (('do', 'góry'), 15),\n", + " (('na', 'litwie'), 14),\n", + " (('już', 'nie'), 14),\n", + " (('w', 'litwie'), 14),\n", + " (('z', 'góry'), 14),\n", + " (('z', 'sobą'), 14),\n", + " (('się', 'że'), 14),\n", + " (('w', 'tej'), 13),\n", + " (('to', 'nie'), 13),\n", + " (('nigdy', 'nie'), 13),\n", + " (('nie', 'było'), 13),\n", + " (('i', 'już'), 13),\n", + " (('a', 'w'), 13),\n", + " (('tak', 'się'), 13),\n", + " (('a', 'potem'), 13),\n", + " (('że', 'go'), 13),\n", + " (('w', 'tył'), 13),\n", + " (('w', 'pole'), 13),\n", + " (('hrabia', 'z'), 13),\n", + " (('widać', 'że'), 12),\n", + " (('do', 'domu'), 12),\n", + " (('był', 'w'), 12),\n", + " (('i', 'rzekł'), 12),\n", + " (('był', 'to'), 12),\n", + " (('po', 'co'), 12),\n", + " (('że', 'z'), 12),\n", + " (('czy', 'to'), 12),\n", + " (('w', 'górę'), 12),\n", + " (('a', 'z'), 12),\n", + " (('bić', 'się'), 12),\n", + " (('pan', 'hrabia'), 11),\n", + " (('i', 'że'), 11),\n", + " (('a', 'co'), 11),\n", + " (('nie', 'miał'), 11),\n", + " (('widząc', 'że'), 11),\n", + " (('a', 'za'), 11),\n", + " (('że', 'to'), 11),\n", + " (('do', 'siebie'), 11),\n", + " (('rzekł', 'sędzia'), 11),\n", + " (('za', 'czym'), 11),\n", + " (('na', 'czele'), 11),\n", + " (('nie', 'może'), 10),\n", + " (('we', 'dworze'), 10),\n", + " (('na', 'nim'), 10),\n", + " (('nie', 'był'), 10),\n", + " (('i', 'znowu'), 10),\n", + " (('aż', 'do'), 10),\n", + " (('z', 'nich'), 10),\n", + " (('się', 'po'), 10),\n", + " (('w', 'las'), 10),\n", + " (('się', 'o'), 10),\n", + " (('w', 'oczy'), 10),\n", + " (('to', 'był'), 10),\n", + " (('to', 'jest'), 10),\n", + " (('się', 'za'), 10),\n", + " (('na', 'ziemi'), 10),\n", + " (('się', 'ku'), 10),\n", + " (('w', 'niej'), 10),\n", + " (('jak', 'się'), 10),\n", + " (('i', 'do'), 10),\n", + " (('i', 'ja'), 10),\n", + " (('hejże', 'na'), 10),\n", + " (('do', 'dworu'), 9),\n", + " (('sam', 'nie'), 9),\n", + " (('z', 'dala'), 9),\n", + " (('gdy', 'się'), 9),\n", + " (('i', 'tam'), 9),\n", + " (('w', 'zamku'), 9),\n", + " (('to', 'mówiąc'), 9),\n", + " (('do', 'nas'), 9),\n", + " (('pan', 'rejent'), 9),\n", + " (('się', 'od'), 9),\n", + " (('lecz', 'nie'), 9),\n", + " (('z', 'tych'), 9),\n", + " (('a', 'pan'), 9),\n", + " (('do', 'zamku'), 9),\n", + " (('się', 'pod'), 9),\n", + " (('z', 'drugiej'), 9),\n", + " (('na', 'koń'), 9),\n", + " (('czy', 'nie'), 9),\n", + " (('kto', 'wie'), 9),\n", + " (('do', 'ziemi'), 9),\n", + " (('z', 'oczu'), 9),\n", + " (('z', 'przodu'), 9),\n", + " (('pan', 'tadeusz'), 8),\n", + " (('z', 'daleka'), 8),\n", + " (('bo', 'w'), 8),\n", + " (('w', 'niebo'), 8),\n", + " (('z', 'rąk'), 8),\n", + " (('nie', 'wiedział'), 8),\n", + " (('w', 'czasie'), 8),\n", + " (('z', 'panem'), 8),\n", + " (('mi', 'się'), 8),\n", + " (('o', 'nim'), 8),\n", + " (('nie', 'wiem'), 8),\n", + " (('pierwszy', 'raz'), 8),\n", + " (('to', 'rzecz'), 8),\n", + " (('po', 'cichu'), 8),\n", + " (('nie', 'mogę'), 8),\n", + " (('tadeusz', 'z'), 8),\n", + " (('aż', 'się'), 8),\n", + " (('mu', 'się'), 8),\n", + " (('do', 'mnie'), 8),\n", + " (('na', 'nich'), 8),\n", + " (('nie', 'będzie'), 8),\n", + " (('wpadł', 'w'), 8),\n", + " (('jak', 'to'), 8),\n", + " (('w', 'lasach'), 8),\n", + " (('w', 'nim'), 8),\n", + " (('jest', 'to'), 8),\n", + " (('a', 'nie'), 8),\n", + " (('w', 'dobrzynie'), 8),\n", + " (('widać', 'z'), 7),\n", + " (('nie', 'widział'), 7),\n", + " (('z', 'rana'), 7),\n", + " (('czuł', 'że'), 7),\n", + " (('ale', 'nie'), 7),\n", + " (('się', 'pan'), 7),\n", + " (('pan', 'wojski'), 7),\n", + " (('więc', 'do'), 7),\n", + " (('się', 'już'), 7),\n", + " (('że', 'nie'), 7),\n", + " (('na', 'tym'), 7),\n", + " (('była', 'to'), 7),\n", + " (('w', 'milczeniu'), 7),\n", + " (('ich', 'nie'), 7),\n", + " (('już', 'w'), 7),\n", + " (('na', 'wsi'), 7),\n", + " (('i', 'jak'), 7),\n", + " (('miał', 'w'), 7),\n", + " (('w', 'powiecie'), 7),\n", + " (('ozwał', 'się'), 7),\n", + " (('jak', 'z'), 7),\n", + " (('ksiądz', 'robak'), 7),\n", + " (('hrabia', 'na'), 7),\n", + " (('rzekł', 'hrabia'), 7),\n", + " (('z', 'tego'), 7),\n", + " (('to', 'w'), 7),\n", + " (('nikt', 'z'), 7),\n", + " (('zdaje', 'się'), 7),\n", + " (('w', 'sercu'), 7),\n", + " (('i', 'cóż'), 7),\n", + " (('a', 'to'), 7),\n", + " (('to', 'mi'), 7),\n", + " (('tu', 'nie'), 7),\n", + " (('nie', 'z'), 7),\n", + " (('w', 'oczach'), 7),\n", + " (('ku', 'niemu'), 7),\n", + " (('po', 'raz'), 7),\n", + " (('mu', 'na'), 7),\n", + " (('bo', 'to'), 7),\n", + " (('ja', 'z'), 7),\n", + " (('i', 'to'), 7),\n", + " (('widać', 'było'), 6),\n", + " (('w', 'biegu'), 6),\n", + " (('lecz', 'w'), 6),\n", + " (('na', 'pole'), 6),\n", + " (('nie', 'chciał'), 6),\n", + " (('i', 'pan'), 6),\n", + " (('i', 'jeszcze'), 6),\n", + " (('pana', 'tadeusza'), 6),\n", + " (('weszli', 'w'), 6),\n", + " (('za', 'stołem'), 6),\n", + " (('tuż', 'przy'), 6),\n", + " (('ja', 'sam'), 6),\n", + " (('go', 'nie'), 6),\n", + " (('z', 'kim'), 6),\n", + " (('i', 'stąd'), 6),\n", + " (('było', 'że'), 6),\n", + " (('pan', 'bóg'), 6),\n", + " (('że', 'po'), 6),\n", + " (('ja', 'nie'), 6),\n", + " (('a', 'on'), 6),\n", + " (('z', 'rejentem'), 6),\n", + " (('w', 'którym'), 6),\n", + " (('w', 'pół'), 6),\n", + " (('na', 'prawo'), 6),\n", + " (('w', 'prawo'), 6),\n", + " (('na', 'lewo'), 6),\n", + " (('drugiej', 'strony'), 6),\n", + " (('tuż', 'nad'), 6),\n", + " (('że', 'tak'), 6),\n", + " (('gdy', 'w'), 6),\n", + " (('ja', 'w'), 6),\n", + " (('na', 'końcu'), 6),\n", + " (('i', 'za'), 6),\n", + " (('gdzie', 'się'), 6),\n", + " (('i', 'o'), 6),\n", + " (('nie', 'tylko'), 6),\n", + " (('ostatniego', 'z'), 6),\n", + " (('kto', 'z'), 6),\n", + " (('się', 'nad'), 6),\n", + " (('wszystko', 'to'), 6),\n", + " (('w', 'polu'), 6),\n", + " (('pan', 'nie'), 6),\n", + " (('z', 'głową'), 6),\n", + " (('zwał', 'się'), 6),\n", + " (('i', 'ten'), 6),\n", + " (('wie', 'co'), 6),\n", + " (('a', 'już'), 6),\n", + " (('jakby', 'w'), 6),\n", + " (('to', 'za'), 6),\n", + " (('w', 'nocy'), 6),\n", + " (('a', 'ja'), 6),\n", + " (('już', 'był'), 6),\n", + " (('ode', 'mnie'), 6),\n", + " (('w', 'nich'), 6),\n", + " (('by', 'się'), 6),\n", + " (('ku', 'nim'), 6),\n", + " (('w', 'ogrodzie'), 6),\n", + " (('z', 'telimeną'), 6),\n", + " (('o', 'to'), 6),\n", + " (('prawda', 'że'), 6),\n", + " (('nikt', 'nie'), 6),\n", + " (('zaraz', 'w'), 6),\n", + " (('na', 'świat'), 6),\n", + " (('wszak', 'to'), 6),\n", + " (('gdy', 'mu'), 6),\n", + " (('a', 'tymczasem'), 6),\n", + " (('za', 'sobą'), 6),\n", + " (('o', 'co'), 6),\n", + " (('na', 'soplicę'), 6),\n", + " (('się', 'a'), 6),\n", + " (('i', 'teraz'), 6),\n", + " (('u', 'stołu'), 5),\n", + " (('tylko', 'się'), 5),\n", + " (('i', 'zaraz'), 5),\n", + " (('z', 'rzadka'), 5),\n", + " (('przed', 'nim'), 5),\n", + " (('już', 'się'), 5),\n", + " (('się', 'wkoło'), 5),\n", + " (('domu', 'i'), 5),\n", + " (('od', 'słońca'), 5),\n", + " (('przez', 'okno'), 5),\n", + " (('gdy', 'z'), 5),\n", + " (('że', 'mu'), 5),\n", + " (('i', 'sam'), 5),\n", + " (('za', 'domem'), 5),\n", + " (('on', 'w'), 5),\n", + " (('po', 'kryjomu'), 5),\n", + " (('wiedział', 'że'), 5),\n", + " (('do', 'lasu'), 5),\n", + " (('wojski', 'z'), 5),\n", + " (('nie', 'mogą'), 5),\n", + " (('nad', 'nim'), 5),\n", + " (('w', 'jakim'), 5),\n", + " (('po', 'cóż'), 5),\n", + " (('po', 'kądzieli'), 5),\n", + " (('o', 'tem'), 5),\n", + " (('potem', 'w'), 5),\n", + " (('powiadał', 'że'), 5),\n", + " (('kłaniał', 'się'), 5),\n", + " (('przy', 'nim'), 5),\n", + " (('i', 'tadeusz'), 5),\n", + " (('na', 'miejscu'), 5),\n", + " (('z', 'których'), 5),\n", + " (('stary', 'i'), 5),\n", + " (('nie', 'na'), 5),\n", + " (('w', 'każdej'), 5),\n", + " (('między', 'szlachtą'), 5),\n", + " (('kiedy', 'się'), 5),\n", + " (('podkomorzy', 'i'), 5),\n", + " (('po', 'francusku'), 5),\n", + " (('a', 'więc'), 5),\n", + " (('kapitan', 'ryków'), 5),\n", + " (('stał', 'w'), 5),\n", + " (('lecz', 'na'), 5),\n", + " (('się', 'jako'), 5),\n", + " (('które', 'na'), 5),\n", + " (('zdała', 'się'), 5),\n", + " (('wszystko', 'się'), 5),\n", + " (('czuł', 'się'), 5),\n", + " (('na', 'koniu'), 5),\n", + " (('w', 'twarz'), 5),\n", + " (('się', 'lecz'), 5),\n", + " (('w', 'lewo'), 5),\n", + " (('i', 'ręce'), 5),\n", + " (('już', 'to'), 5),\n", + " (('mu', 'z'), 5),\n", + " (('i', 'hrabia'), 5),\n", + " (('też', 'nie'), 5),\n", + " (('ją', 'w'), 5),\n", + " (('cóż', 'by'), 5),\n", + " (('to', 'o'), 5),\n", + " (('na', 'swym'), 5),\n", + " (('tak', 'było'), 5),\n", + " (('jednej', 'strony'), 5),\n", + " (('w', 'zamek'), 5),\n", + " (('za', 'mych'), 5),\n", + " (('mych', 'czasów'), 5),\n", + " (('z', 'wami'), 5),\n", + " (('z', 'horeszków'), 5),\n", + " (('na', 'siebie'), 5),\n", + " (('więc', 'na'), 5),\n", + " (('na', 'wiatr'), 5),\n", + " (('że', 'ma'), 5),\n", + " (('w', 'istocie'), 5),\n", + " (('choć', 'nie'), 5),\n", + " (('w', 'jednej'), 5),\n", + " (('jeszcze', 'raz'), 5),\n", + " (('że', 'pan'), 5),\n", + " (('gerwazy', 'z'), 5),\n", + " (('niech', 'no'), 5),\n", + " (('nie', 'wie'), 5),\n", + " (('niech', 'się'), 5),\n", + " (('który', 'był'), 5),\n", + " (('było', 'to'), 5),\n", + " (('choć', 'w'), 5),\n", + " (('za', 'mną'), 5),\n", + " (('z', 'żalu'), 5),\n", + " (('z', 'tej'), 5),\n", + " (('na', 'nią'), 5),\n", + " (('kręci', 'się'), 5),\n", + " (('w', 'drugiej'), 5),\n", + " (('w', 'miejscu'), 5),\n", + " (('po', 'chwili'), 5),\n", + " (('w', 'polszcze'), 5),\n", + " (('ale', 'w'), 5),\n", + " (('w', 'izbie'), 5),\n", + " (('co', 'za'), 5),\n", + " (('jest', 'w'), 5),\n", + " (('się', 'być'), 5),\n", + " (('wierz', 'mi'), 5),\n", + " (('że', 'jej'), 5),\n", + " (('a', 'wtem'), 5),\n", + " (('od', 'razu'), 5),\n", + " (('na', 'dziedziniec'), 5),\n", + " (('w', 'ustach'), 5),\n", + " (('za', 'to'), 5),\n", + " (('nie', 'tak'), 5),\n", + " (('to', 'na'), 5),\n", + " (('z', 'łaski'), 5),\n", + " (('nawet', 'nie'), 5),\n", + " (('jest', 'na'), 5),\n", + " (('cóż', 'to'), 5),\n", + " (('się', 'to'), 5),\n", + " (('do', 'zosi'), 5),\n", + " (('a', 'jeśli'), 5),\n", + " (('w', 'soplicowie'), 5),\n", + " (('z', 'kolei'), 5),\n", + " (('więc', 'z'), 5),\n", + " (('w', 'kolej'), 5),\n", + " (('z', 'ust'), 5),\n", + " (('też', 'i'), 5),\n", + " (('u', 'mnie'), 5),\n", + " (('się', 'tak'), 5),\n", + " (('raz', 'po'), 5),\n", + " (('zwrócił', 'się'), 5),\n", + " (('za', 'nimi'), 5),\n", + " (('niech', 'żyje'), 5),\n", + " (('z', 'radości'), 5),\n", + " (('że', 'kto'), 5),\n", + " (('się', 'bo'), 5),\n", + " (('to', 'znaczy'), 5),\n", + " (('zawołał', 'klucznik'), 5),\n", + " (('na', 'bok'), 5),\n", + " (('cofa', 'się'), 5),\n", + " (('z', 'hrabią'), 5),\n", + " (('na', 'niebie'), 5),\n", + " (('wiem', 'że'), 5),\n", + " (('na', 'znak'), 5),\n", + " (('kropić', 'kropić'), 5),\n", + " (('już', 'jest'), 5),\n", + " (('na', 'przemiany'), 5),\n", + " (('ze', 'mną'), 5),\n", + " (('na', 'wpół'), 5),\n", + " (('nie', 'mogłem'), 5),\n", + " (('cha', 'cha'), 5),\n", + " (('o', 'kusego'), 4),\n", + " (('w', 'całej'), 4),\n", + " (('do', 'tych'), 4),\n", + " (('a', 'wszystko'), 4),\n", + " (('przed', 'laty'), 4),\n", + " (('z', 'drzewa'), 4),\n", + " (('też', 'same'), 4),\n", + " (('cofnął', 'się'), 4),\n", + " (('długo', 'w'), 4),\n", + " (('aż', 'na'), 4),\n", + " (('w', 'takim'), 4),\n", + " (('jej', 'nie'), 4),\n", + " (('jako', 'w'), 4),\n", + " (('domu', 'sędziego'), 4),\n", + " (('nim', 'się'), 4),\n", + " (('i', 'on'), 4),\n", + " (('bo', 'nie'), 4),\n", + " (('od', 'rana'), 4),\n", + " (('u', 'wieczerzy'), 4),\n", + " (('w', 'której'), 4),\n", + " (('właśnie', 'kiedy'), 4),\n", + " (('jest', 'z'), 4),\n", + " (('bawić', 'się'), 4),\n", + " (('i', 'wnet'), 4),\n", + " (('z', 'nieba'), 4),\n", + " (('właśnie', 'z'), 4),\n", + " (('z', 'lasu'), 4),\n", + " (('w', 'porządku'), 4),\n", + " (('szedł', 'z'), 4),\n", + " (('pan', 'podkomorzy'), 4),\n", + " (('tuż', 'za'), 4),\n", + " (('z', 'boru'), 4),\n", + " (('gości', 'nie'), 4),\n", + " (('z', 'domu'), 4),\n", + " (('już', 'późno'), 4),\n", + " (('po', 'drodze'), 4),\n", + " (('nic', 'to'), 4),\n", + " (('wyszedł', 'z'), 4),\n", + " (('sędzia', 'z'), 4),\n", + " (('nie', 'zaś'), 4),\n", + " (('że', 'hrabia'), 4),\n", + " (('znowu', 'w'), 4),\n", + " (('brał', 'miejsce'), 4),\n", + " (('z', 'wieku'), 4),\n", + " (('wieku', 'mu'), 4),\n", + " (('mu', 'i'), 4),\n", + " (('z', 'urzędu'), 4),\n", + " (('urzędu', 'ten'), 4),\n", + " (('ten', 'zaszczyt'), 4),\n", + " (('zaszczyt', 'należy'), 4),\n", + " (('należy', 'idąc'), 4),\n", + " (('idąc', 'kłaniał'), 4),\n", + " (('i', 'młodzieży'), 4),\n", + " (('po', 'łacinie'), 4),\n", + " (('nim', 'na'), 4),\n", + " (('bo', 'on'), 4),\n", + " (('z', 'boku'), 4),\n", + " (('na', 'tadeusza'), 4),\n", + " (('z', 'uśmiechem'), 4),\n", + " (('pod', 'strażą'), 4),\n", + " (('nie', 'w'), 4),\n", + " (('już', 'do'), 4),\n", + " (('bo', 'już'), 4),\n", + " (('która', 'się'), 4),\n", + " (('o', 'jej'), 4),\n", + " (('wiadomo', 'że'), 4),\n", + " (('tam', 'w'), 4),\n", + " (('za', 'granicę'), 4),\n", + " (('to', 'już'), 4),\n", + " (('tak', 'na'), 4),\n", + " (('rzekł', 'do'), 4),\n", + " (('do', 'warszawy'), 4),\n", + " (('ja', 'to'), 4),\n", + " (('ruskie', 'przysłowie'), 4),\n", + " (('tak', 'i'), 4),\n", + " (('raz', 'w'), 4),\n", + " (('końcu', 'stoła'), 4),\n", + " (('na', 'złość'), 4),\n", + " (('z', 'nami'), 4),\n", + " (('może', 'by'), 4),\n", + " (('w', 'wilnie'), 4),\n", + " (('bo', 'z'), 4),\n", + " (('by', 'nie'), 4),\n", + " (('nie', 'lada'), 4),\n", + " (('prosto', 'w'), 4),\n", + " (('nim', 'w'), 4),\n", + " (('na', 'stół'), 4),\n", + " (('strony', 'i'), 4),\n", + " (('tadeusz', 'i'), 4),\n", + " (('lasu', 'i'), 4),\n", + " (('je', 'w'), 4),\n", + " (('na', 'wielkim'), 4),\n", + " (('z', 'całej'), 4),\n", + " (('rzekł', 'z'), 4),\n", + " (('w', 'stolicy'), 4),\n", + " (('krzyknęli', 'wszyscy'), 4),\n", + " (('z', 'całym'), 4),\n", + " (('go', 'na'), 4),\n", + " (('oczu', 'nie'), 4),\n", + " (('z', 'jednej'), 4),\n", + " (('ten', 'zamek'), 4),\n", + " (('uciszcie', 'się'), 4),\n", + " (('na', 'ziemię'), 4),\n", + " (('jak', 'on'), 4),\n", + " (('i', 'gdzie'), 4),\n", + " (('nagle', 'z'), 4),\n", + " (('w', 'okolicy'), 4),\n", + " (('i', 'tylko'), 4),\n", + " (('z', 'nas'), 4),\n", + " (('ze', 'strzelbą'), 4),\n", + " (('bo', 'na'), 4),\n", + " (('nad', 'głową'), 4),\n", + " (('i', 'przez'), 4),\n", + " (('już', 'na'), 4),\n", + " (('za', 'drugim'), 4),\n", + " (('asesor', 'z'), 4),\n", + " (('asesor', 'i'), 4),\n", + " (('w', 'jego'), 4),\n", + " (('odbijał', 'się'), 4),\n", + " (('z', 'drogi'), 4),\n", + " (('od', 'lat'), 4),\n", + " (('stąd', 'też'), 4),\n", + " (('to', 'prawda'), 4),\n", + " (('w', 'ręce'), 4),\n", + " (('lub', 'w'), 4),\n", + " (('gerwazy', 'w'), 4),\n", + " (('szlachty', 'i'), 4),\n", + " (('na', 'ścianie'), 4),\n", + " (('do', 'stołu'), 4),\n", + " (('aż', 'tu'), 4),\n", + " (('czy', 'z'), 4),\n", + " (('we', 'mnie'), 4),\n", + " (('nie', 'mogąc'), 4),\n", + " (('w', 'ich'), 4),\n", + " (('prawą', 'rękę'), 4),\n", + " (('nie', 'dla'), 4),\n", + " (('śmiejąc', 'się'), 4),\n", + " (('w', 'ogród'), 4),\n", + " (('oczy', 'w'), 4),\n", + " (('znak', 'że'), 4),\n", + " (('o', 'łowach'), 4),\n", + " (('już', 'go'), 4),\n", + " (('nie', 'są'), 4),\n", + " (('przed', 'światem'), 4),\n", + " (('może', 'z'), 4),\n", + " (('to', 'się'), 4),\n", + " (('tam', 'z'), 4),\n", + " (('w', 'biurku'), 4),\n", + " (('do', 'ogrodu'), 4),\n", + " (('nie', 'chcę'), 4),\n", + " (('jeszcze', 'nie'), 4),\n", + " (('w', 'tłumie'), 4),\n", + " (('za', 'nią'), 4),\n", + " (('a', 'tak'), 4),\n", + " (('gdy', 'na'), 4),\n", + " (('przeze', 'drzwi'), 4),\n", + " (('gdy', 'już'), 4),\n", + " (('tyłu', 'za'), 4),\n", + " (('się', 'jeszcze'), 4),\n", + " (('się', 'ożenił'), 4),\n", + " (('i', 'gdy'), 4),\n", + " (('a', 'drugą'), 4),\n", + " (('telimena', 'w'), 4),\n", + " (('się', 'zdawało'), 4),\n", + " (('zdawało', 'że'), 4),\n", + " (('a', 'nawet'), 4),\n", + " (('teraz', 'w'), 4),\n", + " (('do', 'ust'), 4),\n", + " (('jak', 'wąż'), 4),\n", + " (('ale', 'z'), 4),\n", + " (('na', 'wskroś'), 4),\n", + " (('bo', 'gdy'), 4),\n", + " (('w', 'tyle'), 4),\n", + " (('było', 'po'), 4),\n", + " (('ten', 'z'), 4),\n", + " (('po', 'wierzchu'), 4),\n", + " (('było', 'w'), 4),\n", + " (('tu', 'z'), 4),\n", + " (('tylko', 'w'), 4),\n", + " (('bez', 'liku'), 4),\n", + " (('schyla', 'się'), 4),\n", + " (('się', 'bokiem'), 4),\n", + " (('od', 'której'), 4),\n", + " (('okiem', 'i'), 4),\n", + " (('od', 'czasu'), 4),\n", + " (('nie', 'chce'), 4),\n", + " (('bóg', 'wie'), 4),\n", + " (('żeby', 'się'), 4),\n", + " (('na', 'przykład'), 4),\n", + " (('za', 'młodu'), 4),\n", + " (('byłem', 'w'), 4),\n", + " (('to', 'nic'), 4),\n", + " (('w', 'karczmie'), 4),\n", + " (('i', 'ręką'), 4),\n", + " (('nie', 'można'), 4),\n", + " (('i', 'coraz'), 4),\n", + " (('to', 'jak'), 4),\n", + " (('co', 'jest'), 4),\n", + " (('na', 'pierś'), 4),\n", + " (('się', 'ale'), 4),\n", + " (('go', 'po'), 4),\n", + " (('co', 'mu'), 4),\n", + " (('zerwał', 'się'), 4),\n", + " (('w', 'górze'), 4),\n", + " (('i', 'bez'), 4),\n", + " (('ze', 'szlachty'), 4),\n", + " (('słychać', 'że'), 4),\n", + " (('z', 'niej'), 4),\n", + " (('spojrzał', 'na'), 4),\n", + " (('w', 'wojsku'), 4),\n", + " (('się', 'ja'), 4),\n", + " (('stąd', 'to'), 4),\n", + " (('o', 'tobie'), 4),\n", + " (('hrabię', 'i'), 4),\n", + " (('w', 'głąb'), 4),\n", + " (('wszystkim', 'się'), 4),\n", + " (('z', 'prawej'), 4),\n", + " (('strzelać', 'się'), 4),\n", + " (('horeszków', 'chociaż'), 4),\n", + " (('chociaż', 'po'), 4),\n", + " (('zjawił', 'się'), 4),\n", + " (('krzyknął', 'sędzia'), 4),\n", + " (('do', 'zgody'), 4),\n", + " (('ręką', 'jak'), 4),\n", + " (('że', 'już'), 4),\n", + " (('dwa', 'lata'), 4),\n", + " (('lecz', 'z'), 4),\n", + " (('telimena', 'nie'), 4),\n", + " (('nie', 'mogła'), 4),\n", + " (('o', 'głos'), 4),\n", + " (('na', 'ten'), 4),\n", + " (('się', 'oba'), 4),\n", + " (('po', 'staremu'), 4),\n", + " (('w', 'drogę'), 4),\n", + " (('siedział', 'na'), 4),\n", + " (('ja', 'go'), 4),\n", + " (('za', 'drzwi'), 4),\n", + " (('ja', 'cię'), 4),\n", + " (('krzyknął', 'w'), 4),\n", + " (('i', 'gerwazy'), 4),\n", + " (('rzekł', 'klucznik'), 4),\n", + " (('robak', 'z'), 4),\n", + " (('wznosi', 'się'), 4),\n", + " (('to', 'co'), 4),\n", + " (('co', 'do'), 4),\n", + " (('o', 'czym'), 4),\n", + " (('to', 'tylko'), 4),\n", + " (('co', 'myślisz'), 4),\n", + " (('tej', 'chwili'), 4),\n", + " (('mnie', 'na'), 4),\n", + " (('z', 'bliska'), 4),\n", + " (('ręce', 'obie'), 4),\n", + " (('panie', 'buchman'), 4),\n", + " (('prawą', 'ręką'), 4),\n", + " (('głupi', 'a'), 4),\n", + " (('na', 'was'), 4),\n", + " (('to', 'rzekł'), 4),\n", + " (('ten', 'za'), 4),\n", + " (('że', 'mnie'), 4),\n", + " (('lecz', 'sędzia'), 4),\n", + " (('ja', 'was'), 4),\n", + " (('rzekł', 'major'), 4),\n", + " (('plac', 'boju'), 4),\n", + " (('dobrzy', 'do'), 4),\n", + " (('pro', 'publico'), 4),\n", + " (('publico', 'bono'), 4),\n", + " (('spotkanie', 'się'), 3),\n", + " (('kusego', 'i'), 3),\n", + " (('i', 'sokoła'), 3),\n", + " (('ty', 'jesteś'), 3),\n", + " (('z', 'jego'), 3),\n", + " (('jak', 'mnie'), 3),\n", + " (('świeciły', 'się'), 3),\n", + " (('i', 'widać'), 3),\n", + " (('i', 'wszerz'), 3),\n", + " (('dobrze', 'na'), 3),\n", + " (('do', 'folwarku'), 3),\n", + " (('sam', 'na'), 3),\n", + " (('dalej', 'w'), 3),\n", + " (('któż', 'by'), 3),\n", + " (('stanął', 'w'), 3),\n", + " (('nie', 'widać'), 3),\n", + " (('na', 'parkanie'), 3),\n", + " (('nie', 'miała'), 3),\n", + " (('na', 'piersiach'), 3),\n", + " (('bo', 'od'), 3),\n", + " (('twarzy', 'nie'), 3),\n", + " (('daleko', 'na'), 3),\n", + " (('na', 'dole'), 3),\n", + " (('zląkł', 'się'), 3),\n", + " (('i', 'czuł'), 3),\n", + " (('bo', 'sędzia'), 3),\n", + " (('pod', 'lasem'), 3),\n", + " (('jeszcze', 'się'), 3),\n", + " (('do', 'woli'), 3),\n", + " (('boru', 'i'), 3),\n", + " (('u', 'niego'), 3),\n", + " (('jak', 'długo'), 3),\n", + " (('cieszą', 'się'), 3),\n", + " (('młodzież', 'na'), 3),\n", + " (('tak', 'każe'), 3),\n", + " (('tam', 'nie'), 3),\n", + " (('sędzia', 'w'), 3),\n", + " (('domy', 'i'), 3),\n", + " (('a', 'choć'), 3),\n", + " (('wzgląd', 'na'), 3),\n", + " (('było', 'z'), 3),\n", + " (('sędzia', 'choć'), 3),\n", + " (('chociaż', 'w'), 3),\n", + " (('się', 'sam'), 3),\n", + " (('w', 'niebytność'), 3),\n", + " (('w', 'pośrodku'), 3),\n", + " (('widne', 'były'), 3),\n", + " (('sień', 'wielka'), 3),\n", + " (('z', 'miny'), 3),\n", + " (('lecz', 'hrabia'), 3),\n", + " (('z', 'opieki'), 3),\n", + " (('i', 'goście'), 3),\n", + " (('goście', 'weszli'), 3),\n", + " (('porządku', 'i'), 3),\n", + " (('i', 'stanęli'), 3),\n", + " (('stanęli', 'kołem'), 3),\n", + " (('kołem', 'podkomorzy'), 3),\n", + " (('podkomorzy', 'najwyższe'), 3),\n", + " (('najwyższe', 'brał'), 3),\n", + " (('miejsce', 'za'), 3),\n", + " (('stołem', 'z'), 3),\n", + " (('się', 'damom'), 3),\n", + " (('damom', 'starcom'), 3),\n", + " (('starcom', 'i'), 3),\n", + " (('kwestarz', 'sędzia'), 3),\n", + " (('sędzia', 'tuż'), 3),\n", + " (('przy', 'bernardynie'), 3),\n", + " (('wszyscy', 'siedli'), 3),\n", + " (('siedli', 'i'), 3),\n", + " (('żwawo', 'jedli'), 3),\n", + " (('nim', 'i'), 3),\n", + " (('puste', 'miejsce'), 3),\n", + " (('ku', 'drzwiom'), 3),\n", + " (('po', 'tym'), 3),\n", + " (('od', 'stołu'), 3),\n", + " (('tadeusza', 'i'), 3),\n", + " (('do', 'stolicy'), 3),\n", + " (('co', 'dzień'), 3),\n", + " (('z', 'ludźmi'), 3),\n", + " (('za', 'kolana'), 3),\n", + " (('na', 'jego'), 3),\n", + " (('w', 'moim'), 3),\n", + " (('jest', 'bez'), 3),\n", + " (('trzeba', 'się'), 3),\n", + " (('ażeby', 'nie'), 3),\n", + " (('nie', 'pytaj'), 3),\n", + " (('milczeniu', 'głębokiem'), 3),\n", + " (('i', 'dalej'), 3),\n", + " (('stąd', 'się'), 3),\n", + " (('rzekł', 'mój'), 3),\n", + " (('kiedy', 'do'), 3),\n", + " (('prawa', 'i'), 3),\n", + " (('w', 'różne'), 3),\n", + " (('nie', 'śmieli'), 3),\n", + " (('chodził', 'po'), 3),\n", + " (('jak', 'od'), 3),\n", + " (('w', 'wielkiej'), 3),\n", + " (('a', 'my'), 3),\n", + " (('w', 'świecie'), 3),\n", + " (('nic', 'a'), 3),\n", + " (('a', 'nic'), 3),\n", + " (('to', 'są'), 3),\n", + " (('cóż', 'o'), 3),\n", + " (('są', 'tu'), 3),\n", + " (('to', 'pan'), 3),\n", + " (('prosił', 'na'), 3),\n", + " (('ojczyzna', 'ja'), 3),\n", + " (('to', 'my'), 3),\n", + " (('jak', 'po'), 3),\n", + " (('majora', 'płuta'), 3),\n", + " (('czy', 'na'), 3),\n", + " (('to', 'on'), 3),\n", + " (('nas', 'w'), 3),\n", + " (('się', 'stało'), 3),\n", + " (('dla', 'zabawki'), 3),\n", + " (('pukle', 'i'), 3),\n", + " (('że', 'zbyt'), 3),\n", + " (('suwała', 'się'), 3),\n", + " (('nie', 'stało'), 3),\n", + " (('trzeba', 'było'), 3),\n", + " (('nieco', 'i'), 3),\n", + " (('na', 'pana'), 3),\n", + " (('że', 'on'), 3),\n", + " (('z', 'podkomorzym'), 3),\n", + " (('strony', 'obie'), 3),\n", + " (('się', 'serce'), 3),\n", + " (('serce', 'mu'), 3),\n", + " (('a', 'u'), 3),\n", + " (('zdawała', 'się'), 3),\n", + " (('zda', 'się'), 3),\n", + " (('od', 'dzieciństwa'), 3),\n", + " (('i', 'serce'), 3),\n", + " (('ale', 'razem'), 3),\n", + " (('na', 'wychowanie'), 3),\n", + " (('siedząc', 'w'), 3),\n", + " (('te', 'wszystkie'), 3),\n", + " (('z', 'której'), 3),\n", + " (('ilekroć', 'z'), 3),\n", + " (('z', 'jej'), 3),\n", + " (('i', 'cztery'), 3),\n", + " (('tadeusz', 'na'), 3),\n", + " (('rzecz', 'o'), 3),\n", + " (('pół', 'godziny'), 3),\n", + " (('bo', 'tam'), 3),\n", + " (('się', 'nagle'), 3),\n", + " (('się', 'strony'), 3),\n", + " (('przy', 'boku'), 3),\n", + " (('i', 'asesor'), 3),\n", + " (('się', 'przed'), 3),\n", + " (('nad', 'uchem'), 3),\n", + " (('właśnie', 'w'), 3),\n", + " (('puścił', 'z'), 3),\n", + " (('w', 'języku'), 3),\n", + " (('jeszcze', 'z'), 3),\n", + " (('a', 'był'), 3),\n", + " (('pani', 'telimena'), 3),\n", + " (('nie', 'gadał'), 3),\n", + " (('on', 'się'), 3),\n", + " (('skłonił', 'i'), 3),\n", + " (('w', 'nią'), 3),\n", + " (('na', 'jutro'), 3),\n", + " (('polowanie', 'i'), 3),\n", + " (('głową', 'rzekł'), 3),\n", + " (('z', 'gorzkim'), 3),\n", + " (('gorzkim', 'uśmiechem'), 3),\n", + " (('rzekł', 'na'), 3),\n", + " (('a', 'od'), 3),\n", + " (('na', 'polowanie'), 3),\n", + " (('przed', 'oczyma'), 3),\n", + " (('jaśnie', 'wielmożny'), 3),\n", + " (('wielmożny', 'podkomorzy'), 3),\n", + " (('niech', 'mi'), 3),\n", + " (('nigdy', 'na'), 3),\n", + " (('lecz', 'go'), 3),\n", + " (('i', 'kończył'), 3),\n", + " (('na', 'świadki'), 3),\n", + " (('z', 'kieszeni'), 3),\n", + " (('sam', 'siebie'), 3),\n", + " (('do', 'stoła'), 3),\n", + " (('on', 'za'), 3),\n", + " (('jenerał', 'dąbrowski'), 3),\n", + " (('z', 'ziemi'), 3),\n", + " (('do', 'kraju'), 3),\n", + " (('skradał', 'się'), 3),\n", + " (('kryć', 'się'), 3),\n", + " (('na', 'wzgórek'), 3),\n", + " (('i', 'ziemię'), 3),\n", + " (('na', 'skarb'), 3),\n", + " (('wieść', 'o'), 3),\n", + " (('po', 'tych'), 3),\n", + " (('rozeszła', 'się'), 3),\n", + " (('w', 'sąsiedztwie'), 3),\n", + " (('ten', 'nie'), 3),\n", + " (('nie', 'dostał'), 3),\n", + " (('miał', 'coś'), 3),\n", + " (('pan', 'z'), 3),\n", + " (('jednym', 'razem'), 3),\n", + " (('razem', 'jakby'), 3),\n", + " (('i', 'słowa'), 3),\n", + " (('tym', 'co'), 3),\n", + " (('w', 'cudzych'), 3),\n", + " (('ostatni', 'z'), 3),\n", + " (('w', 'trawie'), 3),\n", + " (('w', 'niebie'), 3),\n", + " (('broń', 'na'), 3),\n", + " (('odezwały', 'się'), 3),\n", + " (('bo', 'też'), 3),\n", + " (('że', 'o'), 3),\n", + " (('kręcił', 'się'), 3),\n", + " (('w', 'wodę'), 3),\n", + " (('na', 'dziedzińcu'), 3),\n", + " (('choć', 'na'), 3),\n", + " (('idąc', 'na'), 3),\n", + " (('nie', 'zdoła'), 3),\n", + " (('dawno', 'już'), 3),\n", + " (('i', 'pod'), 3),\n", + " (('pod', 'opoką'), 3),\n", + " (('ten', 'pan'), 3),\n", + " (('do', 'nich'), 3),\n", + " (('i', 'znów'), 3),\n", + " (('jak', 'kot'), 3),\n", + " (('w', 'kieszenie'), 3),\n", + " (('lat', 'wielu'), 3),\n", + " (('o', 'jego'), 3),\n", + " (('dla', 'siebie'), 3),\n", + " (('z', 'głowy'), 3),\n", + " (('pan', 'mój'), 3),\n", + " (('z', 'soplicami'), 3),\n", + " (('z', 'konia'), 3),\n", + " (('w', 'progu'), 3),\n", + " (('lub', 'na'), 3),\n", + " (('na', 'łowy'), 3),\n", + " (('a', 'gdy'), 3),\n", + " (('chciał', 'mówić'), 3),\n", + " (('machnął', 'ręką'), 3),\n", + " (('że', 'je'), 3),\n", + " (('to', 'wszystko'), 3),\n", + " (('jacek', 'soplica'), 3),\n", + " (('pan', 'stolnik'), 3),\n", + " (('w', 'czas'), 3),\n", + " (('gdy', 'nagle'), 3),\n", + " (('więc', 'za'), 3),\n", + " (('z', 'dołu'), 3),\n", + " (('trzy', 'razy'), 3),\n", + " (('na', 'ganek'), 3),\n", + " (('po', 'wzroście'), 3),\n", + " (('na', 'cel'), 3),\n", + " (('dwa', 'razy'), 3),\n", + " (('na', 'odsiecz'), 3),\n", + " (('który', 'by'), 3),\n", + " (('się', 'tam'), 3),\n", + " (('dotąd', 'i'), 3),\n", + " (('tu', 'w'), 3),\n", + " (('a', 'ty'), 3),\n", + " (('szkoda', 'że'), 3),\n", + " (('o', 'jakimś'), 3),\n", + " (('a', 'gerwazy'), 3),\n", + " (('o', 'wszystkim'), 3),\n", + " (('przy', 'płocie'), 3),\n", + " (('aż', 'w'), 3),\n", + " (('na', 'ręku'), 3),\n", + " (('rękami', 'i'), 3),\n", + " (('dał', 'znak'), 3),\n", + " (('oczyma', 'i'), 3),\n", + " (('ale', 'już'), 3),\n", + " (('wszczął', 'się'), 3),\n", + " (('tak', 'jak'), 3),\n", + " (('i', 'sędzia'), 3),\n", + " (('dawnego', 'zwyczaju'), 3),\n", + " (('jest', 'do'), 3),\n", + " (('lub', 'z'), 3),\n", + " (('we', 'dwóch'), 3),\n", + " (('nikt', 'pewnie'), 3),\n", + " (('pewnie', 'nie'), 3),\n", + " (('ni', 'w'), 3),\n", + " (('się', 'dowiedział'), 3),\n", + " (('dowiedział', 'że'), 3),\n", + " (('i', 'nawet'), 3),\n", + " (('chował', 'się'), 3),\n", + " (('się', 'hrabia'), 3),\n", + " (('znam', 'ja'), 3),\n", + " (('jak', 'tam'), 3),\n", + " (('i', 'kręcił'), 3),\n", + " (('u', 'nóg'), 3),\n", + " (('w', 'podarunku'), 3),\n", + " (('pyta', 'się'), 3),\n", + " (('za', 'uszy'), 3),\n", + " (('że', 'sam'), 3),\n", + " (('głową', 'i'), 3),\n", + " (('wziąć', 'w'), 3),\n", + " (('w', 'areszt'), 3),\n", + " (('nas', 'nie'), 3),\n", + " (('z', 'lewej'), 3),\n", + " (('nie', 'dziw'), 3),\n", + " (('lecz', 'wojski'), 3),\n", + " (('się', 'mocno'), 3),\n", + " (('strzelców', 'i'), 3),\n", + " (('wielki', 'jak'), 3),\n", + " (('drzwi', 'na'), 3),\n", + " (('i', 'bardzo'), 3),\n", + " (('miał', 'ochoty'), 3),\n", + " (('między', 'dwiema'), 3),\n", + " (('się', 'oczy'), 3),\n", + " (('ze', 'skóry'), 3),\n", + " (('spotkać', 'się'), 3),\n", + " (('gdzie', 'jest'), 3),\n", + " (('od', 'pana'), 3),\n", + " (('wtenczas', 'na'), 3),\n", + " (('jej', 'w'), 3),\n", + " (('zostać', 'w'), 3),\n", + " (('rękę', 'a'), 3),\n", + " (('w', 'świątyni'), 3),\n", + " (('świątyni', 'dumania'), 3),\n", + " (('a', 'sam'), 3),\n", + " (('a', 'hrabia'), 3),\n", + " (('głowę', 'i'), 3),\n", + " (('tu', 'i'), 3),\n", + " (('tym', 'łacniej'), 3),\n", + " (('w', 'piasku'), 3),\n", + " (('się', 'razem'), 3),\n", + " (('w', 'powietrzu'), 3),\n", + " (('nie', 'wiedząc'), 3),\n", + " (('już', 'z'), 3),\n", + " (('przez', 'zagony'), 3),\n", + " (('się', 'nisko'), 3),\n", + " ...]" + ] + }, + "execution_count": 13, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "cnt.most_common()" + ] + }, + { + "cell_type": "code", + "execution_count": 14, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "Counter({('adam', 'mickiewicz'): 1,\n", + " ('mickiewicz', 'pan'): 1,\n", + " ('pan', 'tadeusz'): 8,\n", + " ('tadeusz', 'czyli'): 1,\n", + " ('czyli', 'ostatni'): 1,\n", + " ('ostatni', 'zajazd'): 1,\n", + " ('zajazd', 'na'): 1,\n", + " ('na', 'litwie'): 14,\n", + " ('litwie', 'księga'): 2,\n", + " ('księga', 'pierwsza'): 1,\n", + " ('pierwsza', 'gospodarstwo'): 1,\n", + " ('gospodarstwo', 'powrót'): 1,\n", + " ('powrót', 'panicza'): 1,\n", + " ('panicza', 'spotkanie'): 1,\n", + " ('spotkanie', 'się'): 3,\n", + " ('się', 'pierwsze'): 1,\n", + " ('pierwsze', 'w'): 1,\n", + " ('w', 'pokoiku'): 1,\n", + " ('pokoiku', 'drugie'): 1,\n", + " ('drugie', 'u'): 1,\n", + " ('u', 'stołu'): 5,\n", + " ('stołu', 'ważna'): 1,\n", + " ('ważna', 'sędziego'): 1,\n", + " ('sędziego', 'nauka'): 1,\n", + " ('nauka', 'o'): 1,\n", + " ('o', 'grzeczności'): 1,\n", + " ('grzeczności', 'podkomorzego'): 1,\n", + " ('podkomorzego', 'uwagi'): 1,\n", + " ('uwagi', 'polityczne'): 1,\n", + " ('polityczne', 'nad'): 1,\n", + " ('nad', 'modami'): 1,\n", + " ('modami', 'początek'): 1,\n", + " ('początek', 'sporu'): 1,\n", + " ('sporu', 'o'): 1,\n", + " ('o', 'kusego'): 4,\n", + " ('kusego', 'i'): 3,\n", + " ('i', 'sokoła'): 3,\n", + " ('sokoła', 'żale'): 1,\n", + " ('żale', 'wojskiego'): 1,\n", + " ('wojskiego', 'ostatni'): 1,\n", + " ('ostatni', 'woźny'): 1,\n", + " ('woźny', 'trybunału'): 2,\n", + " ('trybunału', 'rzut'): 1,\n", + " ('rzut', 'oka'): 2,\n", + " ('oka', 'na'): 1,\n", + " ('na', 'ówczesny'): 1,\n", + " ('ówczesny', 'stan'): 1,\n", + " ('stan', 'polityczny'): 1,\n", + " ('polityczny', 'litwy'): 1,\n", + " ('litwy', 'i'): 1,\n", + " ('i', 'europy'): 1,\n", + " ('europy', 'litwo'): 1,\n", + " ('litwo', 'ojczyzno'): 1,\n", + " ('ojczyzno', 'moja'): 1,\n", + " ('moja', 'ty'): 1,\n", + " ('ty', 'jesteś'): 3,\n", + " ('jesteś', 'jak'): 1,\n", + " ('jak', 'zdrowie'): 1,\n", + " ('zdrowie', 'ile'): 1,\n", + " ('ile', 'cię'): 1,\n", + " ('cię', 'trzeba'): 1,\n", + " ('trzeba', 'cenić'): 1,\n", + " ('cenić', 'ten'): 1,\n", + " ('ten', 'tylko'): 1,\n", + " ('tylko', 'się'): 5,\n", + " ('się', 'dowie'): 2,\n", + " ('dowie', 'kto'): 1,\n", + " ('kto', 'cię'): 1,\n", + " ('cię', 'stracił'): 1,\n", + " ('stracił', 'dziś'): 1,\n", + " ('dziś', 'piękność'): 1,\n", + " ('piękność', 'twą'): 1,\n", + " ('twą', 'w'): 1,\n", + " ('w', 'całej'): 4,\n", + " ('całej', 'ozdobie'): 1,\n", + " ('ozdobie', 'widzę'): 1,\n", + " ('widzę', 'i'): 1,\n", + " ('i', 'opisuję'): 1,\n", + " ('opisuję', 'bo'): 1,\n", + " ('bo', 'tęsknię'): 1,\n", + " ('tęsknię', 'po'): 1,\n", + " ('po', 'tobie'): 1,\n", + " ('tobie', 'panno'): 1,\n", + " ('panno', 'święta'): 1,\n", + " ('święta', 'co'): 1,\n", + " ('co', 'jasnej'): 1,\n", + " ('jasnej', 'bronisz'): 1,\n", + " ('bronisz', 'częstochowy'): 1,\n", + " ('częstochowy', 'i'): 1,\n", + " ('i', 'w'): 44,\n", + " ('w', 'ostrej'): 1,\n", + " ('ostrej', 'świecisz'): 1,\n", + " ('świecisz', 'bramie'): 1,\n", + " ('bramie', 'ty'): 1,\n", + " ('ty', 'co'): 1,\n", + " ('co', 'gród'): 1,\n", + " ('gród', 'zamkowy'): 1,\n", + " ('zamkowy', 'nowogródzki'): 1,\n", + " ('nowogródzki', 'ochraniasz'): 1,\n", + " ('ochraniasz', 'z'): 1,\n", + " ('z', 'jego'): 3,\n", + " ('jego', 'wiernym'): 1,\n", + " ('wiernym', 'ludem'): 1,\n", + " ('ludem', 'jak'): 1,\n", + " ('jak', 'mnie'): 3,\n", + " ('mnie', 'dziecko'): 1,\n", + " ('dziecko', 'do'): 1,\n", + " ('do', 'zdrowia'): 1,\n", + " ('zdrowia', 'powróciłaś'): 1,\n", + " ('powróciłaś', 'cudem'): 1,\n", + " ('cudem', 'gdy'): 1,\n", + " ('gdy', 'od'): 1,\n", + " ('od', 'płaczącej'): 1,\n", + " ('płaczącej', 'matki'): 1,\n", + " ('matki', 'pod'): 1,\n", + " ('pod', 'twoją'): 1,\n", + " ('twoją', 'opiekę'): 1,\n", + " ('opiekę', 'ofiarowany'): 1,\n", + " ('ofiarowany', 'martwą'): 1,\n", + " ('martwą', 'podniosłem'): 1,\n", + " ('podniosłem', 'powiekę'): 1,\n", + " ('powiekę', 'i'): 1,\n", + " ('i', 'zaraz'): 5,\n", + " ('zaraz', 'mogłem'): 1,\n", + " ('mogłem', 'pieszo'): 1,\n", + " ('pieszo', 'do'): 1,\n", + " ('do', 'twych'): 1,\n", + " ('twych', 'świątyń'): 1,\n", + " ('świątyń', 'progu'): 1,\n", + " ('progu', 'iść'): 1,\n", + " ('iść', 'za'): 1,\n", + " ('za', 'wrócone'): 1,\n", + " ('wrócone', 'życie'): 1,\n", + " ('życie', 'podziękować'): 1,\n", + " ('podziękować', 'bogu'): 1,\n", + " ('bogu', 'tak'): 1,\n", + " ('tak', 'nas'): 2,\n", + " ('nas', 'powrócisz'): 1,\n", + " ('powrócisz', 'cudem'): 1,\n", + " ('cudem', 'na'): 1,\n", + " ('na', 'ojczyzny'): 1,\n", + " ('ojczyzny', 'łono'): 1,\n", + " ('łono', 'tymczasem'): 1,\n", + " ('tymczasem', 'przenoś'): 1,\n", + " ('przenoś', 'moją'): 1,\n", + " ('moją', 'duszę'): 1,\n", + " ('duszę', 'utęsknioną'): 1,\n", + " ('utęsknioną', 'do'): 1,\n", + " ('do', 'tych'): 4,\n", + " ('tych', 'pagórków'): 1,\n", + " ('pagórków', 'leśnych'): 1,\n", + " ('leśnych', 'do'): 1,\n", + " ('tych', 'łąk'): 1,\n", + " ('łąk', 'zielonych'): 1,\n", + " ('zielonych', 'szeroko'): 1,\n", + " ('szeroko', 'nad'): 1,\n", + " ('nad', 'błękitnym'): 1,\n", + " ('błękitnym', 'niemnem'): 1,\n", + " ('niemnem', 'rozciągnionych'): 1,\n", + " ('rozciągnionych', 'do'): 1,\n", + " ('tych', 'pól'): 1,\n", + " ('pól', 'malowanych'): 1,\n", + " ('malowanych', 'zbożem'): 1,\n", + " ('zbożem', 'rozmaitem'): 1,\n", + " ('rozmaitem', 'wyzłacanych'): 1,\n", + " ('wyzłacanych', 'pszenicą'): 1,\n", + " ('pszenicą', 'posrebrzanych'): 1,\n", + " ('posrebrzanych', 'żytem'): 1,\n", + " ('żytem', 'gdzie'): 1,\n", + " ('gdzie', 'bursztynowy'): 1,\n", + " ('bursztynowy', 'świerzop'): 1,\n", + " ('świerzop', 'gryka'): 1,\n", + " ('gryka', 'jak'): 1,\n", + " ('jak', 'śnieg'): 2,\n", + " ('śnieg', 'biała'): 1,\n", + " ('biała', 'gdzie'): 1,\n", + " ('gdzie', 'panieńskim'): 1,\n", + " ('panieńskim', 'rumieńcem'): 1,\n", + " ('rumieńcem', 'dzięcielina'): 1,\n", + " ('dzięcielina', 'pała'): 1,\n", + " ('pała', 'a'): 1,\n", + " ('a', 'wszystko'): 4,\n", + " ('wszystko', 'przepasane'): 1,\n", + " ('przepasane', 'jakby'): 1,\n", + " ('jakby', 'wstęgą'): 1,\n", + " ('wstęgą', 'miedzą'): 1,\n", + " ('miedzą', 'zieloną'): 1,\n", + " ('zieloną', 'na'): 1,\n", + " ('na', 'niej'): 1,\n", + " ('niej', 'z'): 2,\n", + " ('z', 'rzadka'): 5,\n", + " ('rzadka', 'ciche'): 1,\n", + " ('ciche', 'grusze'): 1,\n", + " ('grusze', 'siedzą'): 1,\n", + " ('siedzą', 'śród'): 2,\n", + " ('śród', 'takich'): 1,\n", + " ('takich', 'pól'): 1,\n", + " ('pól', 'przed'): 1,\n", + " ('przed', 'laty'): 4,\n", + " ('laty', 'nad'): 1,\n", + " ('nad', 'brzegiem'): 2,\n", + " ('brzegiem', 'ruczaju'): 1,\n", + " ('ruczaju', 'na'): 1,\n", + " ('na', 'pagórku'): 1,\n", + " ('pagórku', 'niewielkim'): 1,\n", + " ('niewielkim', 'we'): 1,\n", + " ('we', 'brzozowym'): 1,\n", + " ('brzozowym', 'gaju'): 1,\n", + " ('gaju', 'stał'): 1,\n", + " ('stał', 'dwór'): 1,\n", + " ('dwór', 'szlachecki'): 1,\n", + " ('szlachecki', 'z'): 1,\n", + " ('z', 'drzewa'): 4,\n", + " ('drzewa', 'lecz'): 1,\n", + " ('lecz', 'podmurowany'): 1,\n", + " ('podmurowany', 'świeciły'): 1,\n", + " ('świeciły', 'się'): 3,\n", + " ('się', 'z'): 56,\n", + " ('z', 'daleka'): 8,\n", + " ('daleka', 'pobielane'): 1,\n", + " ('pobielane', 'ściany'): 1,\n", + " ('ściany', 'tym'): 1,\n", + " ('tym', 'bielsze'): 1,\n", + " ('bielsze', 'że'): 1,\n", + " ('że', 'odbite'): 1,\n", + " ('odbite', 'od'): 1,\n", + " ('od', 'ciemnej'): 1,\n", + " ('ciemnej', 'zieleni'): 1,\n", + " ('zieleni', 'topoli'): 1,\n", + " ('topoli', 'co'): 1,\n", + " ('co', 'go'): 2,\n", + " ('go', 'bronią'): 1,\n", + " ('bronią', 'od'): 1,\n", + " ('od', 'wiatrów'): 1,\n", + " ('wiatrów', 'jesieni'): 1,\n", + " ('jesieni', 'dom'): 1,\n", + " ('dom', 'mieszkalny'): 1,\n", + " ('mieszkalny', 'niewielki'): 1,\n", + " ('niewielki', 'lecz'): 1,\n", + " ('lecz', 'zewsząd'): 1,\n", + " ('zewsząd', 'chędogi'): 1,\n", + " ('chędogi', 'i'): 1,\n", + " ('i', 'stodołę'): 1,\n", + " ('stodołę', 'miał'): 1,\n", + " ('miał', 'wielką'): 1,\n", + " ('wielką', 'i'): 1,\n", + " ('i', 'przy'): 1,\n", + " ('przy', 'niej'): 1,\n", + " ('niej', 'trzy'): 1,\n", + " ('trzy', 'stogi'): 1,\n", + " ('stogi', 'użątku'): 1,\n", + " ('użątku', 'co'): 1,\n", + " ('co', 'pod'): 1,\n", + " ('pod', 'strzechą'): 2,\n", + " ('strzechą', 'zmieścić'): 1,\n", + " ('zmieścić', 'się'): 1,\n", + " ('się', 'nie'): 20,\n", + " ('nie', 'może'): 10,\n", + " ('może', 'widać'): 1,\n", + " ('widać', 'że'): 12,\n", + " ('że', 'okolica'): 1,\n", + " ('okolica', 'obfita'): 1,\n", + " ('obfita', 'we'): 1,\n", + " ('we', 'zboże'): 1,\n", + " ('zboże', 'i'): 2,\n", + " ('i', 'widać'): 3,\n", + " ('widać', 'z'): 7,\n", + " ('z', 'liczby'): 2,\n", + " ('liczby', 'kopic'): 1,\n", + " ('kopic', 'co'): 1,\n", + " ('co', 'wzdłuż'): 1,\n", + " ('wzdłuż', 'i'): 2,\n", + " ('i', 'wszerz'): 3,\n", + " ('wszerz', 'smugów'): 1,\n", + " ('smugów', 'świecą'): 1,\n", + " ('świecą', 'gęsto'): 1,\n", + " ('gęsto', 'jak'): 1,\n", + " ('jak', 'gwiazdy'): 1,\n", + " ('gwiazdy', 'widać'): 1,\n", + " ('liczby', 'pługów'): 1,\n", + " ('pługów', 'orzących'): 1,\n", + " ('orzących', 'wcześnie'): 1,\n", + " ('wcześnie', 'łany'): 1,\n", + " ('łany', 'ogromne'): 1,\n", + " ('ogromne', 'ugoru'): 1,\n", + " ('ugoru', 'czarnoziemne'): 1,\n", + " ('czarnoziemne', 'zapewne'): 1,\n", + " ('zapewne', 'należne'): 1,\n", + " ('należne', 'do'): 1,\n", + " ('do', 'dworu'): 9,\n", + " ('dworu', 'uprawne'): 1,\n", + " ('uprawne', 'dobrze'): 1,\n", + " ('dobrze', 'na'): 3,\n", + " ('na', 'kształt'): 20,\n", + " ('kształt', 'ogrodowych'): 1,\n", + " ('ogrodowych', 'grządek'): 1,\n", + " ('grządek', 'że'): 1,\n", + " ('że', 'w'): 19,\n", + " ('w', 'tym'): 20,\n", + " ('tym', 'domu'): 1,\n", + " ('domu', 'dostatek'): 1,\n", + " ('dostatek', 'mieszka'): 1,\n", + " ('mieszka', 'i'): 1,\n", + " ('i', 'porządek'): 1,\n", + " ('porządek', 'brama'): 1,\n", + " ('brama', 'na'): 1,\n", + " ('na', 'wciąż'): 1,\n", + " ('wciąż', 'otwarta'): 1,\n", + " ('otwarta', 'przechodniom'): 1,\n", + " ('przechodniom', 'ogłasza'): 1,\n", + " ('ogłasza', 'że'): 1,\n", + " ('że', 'gościnna'): 1,\n", + " ('gościnna', 'i'): 1,\n", + " ('i', 'wszystkich'): 2,\n", + " ('wszystkich', 'w'): 2,\n", + " ('w', 'gościnę'): 1,\n", + " ('gościnę', 'zaprasza'): 1,\n", + " ('zaprasza', 'właśnie'): 1,\n", + " ('właśnie', 'dwukonną'): 1,\n", + " ('dwukonną', 'bryką'): 1,\n", + " ('bryką', 'wjechał'): 1,\n", + " ('wjechał', 'młody'): 1,\n", + " ('młody', 'panek'): 1,\n", + " ('panek', 'i'): 1,\n", + " ('i', 'obiegłszy'): 1,\n", + " ('obiegłszy', 'dziedziniec'): 1,\n", + " ('dziedziniec', 'zawrócił'): 1,\n", + " ('zawrócił', 'przed'): 1,\n", + " ('przed', 'ganek'): 2,\n", + " ('ganek', 'wysiadł'): 1,\n", + " ('wysiadł', 'z'): 1,\n", + " ('z', 'powozu'): 1,\n", + " ('powozu', 'konie'): 1,\n", + " ('konie', 'porzucone'): 1,\n", + " ('porzucone', 'same'): 1,\n", + " ('same', 'szczypiąc'): 1,\n", + " ('szczypiąc', 'trawę'): 1,\n", + " ('trawę', 'ciągnęły'): 1,\n", + " ('ciągnęły', 'powoli'): 1,\n", + " ('powoli', 'pod'): 1,\n", + " ('pod', 'bramę'): 2,\n", + " ('bramę', 'we'): 1,\n", + " ('we', 'dworze'): 10,\n", + " ('dworze', 'pusto'): 1,\n", + " ('pusto', 'bo'): 1,\n", + " ('bo', 'drzwi'): 2,\n", + " ('drzwi', 'od'): 1,\n", + " ('od', 'ganku'): 1,\n", + " ('ganku', 'zamknięto'): 1,\n", + " ('zamknięto', 'zaszczepkami'): 1,\n", + " ('zaszczepkami', 'i'): 1,\n", + " ('i', 'kołkiem'): 1,\n", + " ('kołkiem', 'zaszczepki'): 1,\n", + " ('zaszczepki', 'przetknięto'): 1,\n", + " ('przetknięto', 'podróżny'): 1,\n", + " ('podróżny', 'do'): 1,\n", + " ('do', 'folwarku'): 3,\n", + " ('folwarku', 'nie'): 2,\n", + " ('nie', 'biegł'): 1,\n", + " ('biegł', 'sług'): 1,\n", + " ('sług', 'zapytać'): 1,\n", + " ('zapytać', 'odemknął'): 1,\n", + " ('odemknął', 'wbiegł'): 1,\n", + " ('wbiegł', 'do'): 1,\n", + " ('do', 'domu'): 12,\n", + " ('domu', 'pragnął'): 1,\n", + " ('pragnął', 'go'): 1,\n", + " ('go', 'powitać'): 1,\n", + " ('powitać', 'dawno'): 1,\n", + " ('dawno', 'domu'): 1,\n", + " ('domu', 'nie'): 1,\n", + " ('nie', 'widział'): 7,\n", + " ('widział', 'bo'): 2,\n", + " ('bo', 'w'): 8,\n", + " ('w', 'dalekim'): 1,\n", + " ('dalekim', 'mieście'): 1,\n", + " ('mieście', 'kończył'): 1,\n", + " ('kończył', 'nauki'): 1,\n", + " ('nauki', 'końca'): 1,\n", + " ('końca', 'doczekał'): 1,\n", + " ('doczekał', 'nareszcie'): 1,\n", + " ('nareszcie', 'wbiega'): 1,\n", + " ('wbiega', 'i'): 1,\n", + " ('i', 'okiem'): 2,\n", + " ('okiem', 'chciwie'): 1,\n", + " ('chciwie', 'ściany'): 1,\n", + " ('ściany', 'starodawne'): 1,\n", + " ('starodawne', 'ogląda'): 1,\n", + " ('ogląda', 'czule'): 1,\n", + " ('czule', 'jako'): 1,\n", + " ('jako', 'swe'): 1,\n", + " ('swe', 'znajome'): 1,\n", + " ('znajome', 'dawne'): 1,\n", + " ('dawne', 'też'): 1,\n", + " ('też', 'same'): 4,\n", + " ('same', 'widzi'): 1,\n", + " ('widzi', 'sprzęty'): 1,\n", + " ('sprzęty', 'też'): 1,\n", + " ('same', 'obicia'): 1,\n", + " ('obicia', 'z'): 1,\n", + " ('z', 'którymi'): 1,\n", + " ('którymi', 'się'): 1,\n", + " ('się', 'zabawiać'): 1,\n", + " ('zabawiać', 'lubił'): 1,\n", + " ('lubił', 'od'): 1,\n", + " ('od', 'powicia'): 1,\n", + " ('powicia', 'lecz'): 1,\n", + " ('lecz', 'mniej'): 1,\n", + " ('mniej', 'wielkie'): 1,\n", + " ('wielkie', 'mniej'): 1,\n", + " ('mniej', 'piękne'): 1,\n", + " ('piękne', 'niż'): 1,\n", + " ('niż', 'się'): 2,\n", + " ('się', 'dawniej'): 1,\n", + " ('dawniej', 'zdały'): 1,\n", + " ('zdały', 'i'): 1,\n", + " ('i', 'też'): 1,\n", + " ('same', 'portrety'): 1,\n", + " ('portrety', 'na'): 1,\n", + " ('na', 'ścianach'): 1,\n", + " ('ścianach', 'wisiały'): 1,\n", + " ('wisiały', 'tu'): 1,\n", + " ('tu', 'kościuszko'): 1,\n", + " ('kościuszko', 'w'): 1,\n", + " ('w', 'czamarce'): 1,\n", + " ('czamarce', 'krakowskiej'): 1,\n", + " ('krakowskiej', 'z'): 1,\n", + " ('z', 'oczyma'): 2,\n", + " ('oczyma', 'podniesionymi'): 1,\n", + " ('podniesionymi', 'w'): 1,\n", + " ('w', 'niebo'): 8,\n", + " ('niebo', 'miecz'): 1,\n", + " ('miecz', 'oburącz'): 1,\n", + " ('oburącz', 'trzyma'): 1,\n", + " ('trzyma', 'takim'): 1,\n", + " ('takim', 'był'): 1,\n", + " ('był', 'gdy'): 1,\n", + " ('gdy', 'przysięgał'): 1,\n", + " ('przysięgał', 'na'): 1,\n", + " ('na', 'stopniach'): 1,\n", + " ('stopniach', 'ołtarzów'): 1,\n", + " ('ołtarzów', 'że'): 1,\n", + " ('że', 'tym'): 1,\n", + " ('tym', 'mieczem'): 1,\n", + " ('mieczem', 'wypędzi'): 1,\n", + " ('wypędzi', 'z'): 1,\n", + " ('z', 'polski'): 2,\n", + " ('polski', 'trzech'): 1,\n", + " ('trzech', 'mocarzów'): 1,\n", + " ('mocarzów', 'albo'): 1,\n", + " ('albo', 'sam'): 1,\n", + " ('sam', 'na'): 3,\n", + " ('na', 'nim'): 10,\n", + " ('nim', 'padnie'): 1,\n", + " ('padnie', 'dalej'): 1,\n", + " ('dalej', 'w'): 3,\n", + " ('w', 'polskiej'): 1,\n", + " ('polskiej', 'szacie'): 1,\n", + " ('szacie', 'siedzi'): 1,\n", + " ('siedzi', 'rejtan'): 1,\n", + " ('rejtan', 'żałośny'): 1,\n", + " ('żałośny', 'po'): 1,\n", + " ('po', 'wolności'): 1,\n", + " ('wolności', 'stracie'): 1,\n", + " ('stracie', 'w'): 1,\n", + " ('w', 'ręku'): 15,\n", + " ('ręku', 'trzyma'): 1,\n", + " ('trzyma', 'nóż'): 1,\n", + " ('nóż', 'ostrzem'): 1,\n", + " ('ostrzem', 'zwrócony'): 1,\n", + " ('zwrócony', 'do'): 2,\n", + " ('do', 'łona'): 1,\n", + " ('łona', 'a'): 1,\n", + " ('a', 'przed'): 2,\n", + " ('przed', 'nim'): 5,\n", + " ('nim', 'leży'): 1,\n", + " ('leży', 'fedon'): 1,\n", + " ('fedon', 'i'): 1,\n", + " ('i', 'żywot'): 1,\n", + " ('żywot', 'katona'): 1,\n", + " ('katona', 'dalej'): 1,\n", + " ('dalej', 'jasiński'): 1,\n", + " ('jasiński', 'młodzian'): 1,\n", + " ('młodzian', 'piękny'): 1,\n", + " ('piękny', 'i'): 1,\n", + " ('i', 'posępny'): 2,\n", + " ('posępny', 'obok'): 1,\n", + " ('obok', 'korsak'): 1,\n", + " ('korsak', 'towarzysz'): 1,\n", + " ('towarzysz', 'jego'): 1,\n", + " ('jego', 'nieodstępny'): 1,\n", + " ('nieodstępny', 'stoją'): 1,\n", + " ('stoją', 'na'): 2,\n", + " ('na', 'szańcach'): 1,\n", + " ('szańcach', 'pragi'): 1,\n", + " ('pragi', 'na'): 1,\n", + " ('na', 'stosach'): 1,\n", + " ('stosach', 'moskali'): 1,\n", + " ('moskali', 'siekąc'): 1,\n", + " ('siekąc', 'wrogów'): 1,\n", + " ('wrogów', 'a'): 2,\n", + " ('a', 'praga'): 1,\n", + " ('praga', 'już'): 1,\n", + " ('już', 'się'): 5,\n", + " ('się', 'wkoło'): 5,\n", + " ('wkoło', 'pali'): 1,\n", + " ('pali', 'nawet'): 1,\n", + " ('nawet', 'stary'): 1,\n", + " ('stary', 'stojący'): 1,\n", + " ('stojący', 'zegar'): 1,\n", + " ('zegar', 'kurantowy'): 1,\n", + " ('kurantowy', 'w'): 1,\n", + " ('w', 'drewnianej'): 1,\n", + " ('drewnianej', 'szafie'): 1,\n", + " ('szafie', 'poznał'): 1,\n", + " ('poznał', 'u'): 1,\n", + " ('u', 'wniścia'): 1,\n", + " ('wniścia', 'alkowy'): 1,\n", + " ('alkowy', 'i'): 1,\n", + " ('i', 'z'): 54,\n", + " ('z', 'dziecinną'): 1,\n", + " ('dziecinną', 'radością'): 1,\n", + " ('radością', 'pociągnął'): 1,\n", + " ('pociągnął', 'za'): 1,\n", + " ('za', 'sznurek'): 1,\n", + " ('sznurek', 'by'): 1,\n", + " ('by', 'stary'): 1,\n", + " ('stary', 'dąbrowskiego'): 1,\n", + " ('dąbrowskiego', 'usłyszeć'): 1,\n", + " ('usłyszeć', 'mazurek'): 1,\n", + " ('mazurek', 'biegał'): 1,\n", + " ('biegał', 'po'): 2,\n", + " ('po', 'całym'): 2,\n", + " ('całym', 'domu'): 1,\n", + " ('domu', 'i'): 5,\n", + " ('i', 'szukał'): 2,\n", + " ('szukał', 'komnaty'): 1,\n", + " ('komnaty', 'gdzie'): 1,\n", + " ('gdzie', 'mieszkał'): 1,\n", + " ('mieszkał', 'dzieckiem'): 1,\n", + " ('dzieckiem', 'będąc'): 1,\n", + " ('będąc', 'przed'): 1,\n", + " ('przed', 'dziesięciu'): 1,\n", + " ('dziesięciu', 'laty'): 1,\n", + " ('laty', 'wchodzi'): 1,\n", + " ('wchodzi', 'cofnął'): 1,\n", + " ('cofnął', 'się'): 4,\n", + " ('się', 'toczył'): 2,\n", + " ('toczył', 'zdumione'): 1,\n", + " ('zdumione', 'źrenice'): 1,\n", + " ('źrenice', 'po'): 1,\n", + " ('po', 'ścianach'): 1,\n", + " ('ścianach', 'w'): 1,\n", + " ('w', 'tej'): 13,\n", + " ('tej', 'komnacie'): 1,\n", + " ('komnacie', 'mieszkanie'): 1,\n", + " ('mieszkanie', 'kobiéce'): 1,\n", + " ('kobiéce', 'któż'): 1,\n", + " ('któż', 'by'): 3,\n", + " ('by', 'tu'): 1,\n", + " ('tu', 'mieszkał'): 1,\n", + " ('mieszkał', 'stary'): 1,\n", + " ('stary', 'stryj'): 1,\n", + " ('stryj', 'nie'): 1,\n", + " ('nie', 'był'): 10,\n", + " ('był', 'żonaty'): 1,\n", + " ('żonaty', 'a'): 1,\n", + " ('a', 'ciotka'): 1,\n", + " ('ciotka', 'w'): 1,\n", + " ('w', 'petersburgu'): 1,\n", + " ('petersburgu', 'mieszkała'): 1,\n", + " ('mieszkała', 'przed'): 1,\n", + " ('laty', 'to'): 1,\n", + " ('to', 'nie'): 13,\n", + " ('był', 'ochmistrzyni'): 1,\n", + " ('ochmistrzyni', 'pokój'): 1,\n", + " ('pokój', 'fortepiano'): 1,\n", + " ('fortepiano', 'na'): 1,\n", + " ('nim', 'nuty'): 1,\n", + " ('nuty', 'i'): 1,\n", + " ('i', 'książki'): 1,\n", + " ('książki', 'wszystko'): 1,\n", + " ('wszystko', 'porzucano'): 1,\n", + " ('porzucano', 'niedbale'): 1,\n", + " ('niedbale', 'i'): 1,\n", + " ('i', 'bezładnie'): 1,\n", + " ('bezładnie', 'nieporządek'): 1,\n", + " ('nieporządek', 'miły'): 1,\n", + " ('miły', 'niestare'): 1,\n", + " ('niestare', 'były'): 1,\n", + " ('były', 'rączki'): 1,\n", + " ('rączki', 'co'): 1,\n", + " ('co', 'je'): 2,\n", + " ('je', 'tak'): 1,\n", + " ('tak', 'rzuciły'): 1,\n", + " ('rzuciły', 'tuż'): 1,\n", + " ('tuż', 'i'): 2,\n", + " ('i', 'sukienka'): 1,\n", + " ('sukienka', 'biała'): 1,\n", + " ('biała', 'świeżo'): 1,\n", + " ('świeżo', 'z'): 1,\n", + " ('z', 'kołka'): 2,\n", + " ('kołka', 'zdjęta'): 1,\n", + " ('zdjęta', 'do'): 1,\n", + " ('do', 'ubrania'): 2,\n", + " ('ubrania', 'na'): 1,\n", + " ('na', 'krzesła'): 1,\n", + " ('krzesła', 'poręczu'): 1,\n", + " ('poręczu', 'rozpięta'): 1,\n", + " ('rozpięta', 'a'): 1,\n", + " ('a', 'na'): 15,\n", + " ('na', 'oknach'): 1,\n", + " ('oknach', 'donice'): 1,\n", + " ('donice', 'z'): 1,\n", + " ('z', 'pachnącymi'): 1,\n", + " ('pachnącymi', 'ziołki'): 1,\n", + " ('ziołki', 'geranium'): 1,\n", + " ('geranium', 'lewkonija'): 1,\n", + " ('lewkonija', 'astry'): 1,\n", + " ('astry', 'i'): 1,\n", + " ('i', 'fijołki'): 1,\n", + " ('fijołki', 'podróżny'): 1,\n", + " ('podróżny', 'stanął'): 1,\n", + " ('stanął', 'w'): 3,\n", + " ('w', 'jednym'): 2,\n", + " ('jednym', 'z'): 1,\n", + " ('z', 'okien'): 1,\n", + " ('okien', 'nowe'): 1,\n", + " ('nowe', 'dziwo'): 1,\n", + " ('dziwo', 'w'): 1,\n", + " ('w', 'sadzie'): 2,\n", + " ('sadzie', 'na'): 1,\n", + " ('na', 'brzegu'): 1,\n", + " ('brzegu', 'niegdyś'): 1,\n", + " ('niegdyś', 'zarosłym'): 1,\n", + " ('zarosłym', 'pokrzywą'): 1,\n", + " ('pokrzywą', 'był'): 1,\n", + " ('był', 'maleńki'): 1,\n", + " ('maleńki', 'ogródek'): 1,\n", + " ('ogródek', 'ścieżkami'): 1,\n", + " ('ścieżkami', 'porznięty'): 1,\n", + " ('porznięty', 'pełen'): 1,\n", + " ('pełen', 'bukietów'): 1,\n", + " ('bukietów', 'trawy'): 1,\n", + " ('trawy', 'angielskiej'): 1,\n", + " ('angielskiej', 'i'): 1,\n", + " ('i', 'mięty'): 1,\n", + " ('mięty', 'drewniany'): 1,\n", + " ('drewniany', 'drobny'): 1,\n", + " ('drobny', 'w'): 1,\n", + " ('w', 'cyfrę'): 1,\n", + " ('cyfrę', 'powiązany'): 1,\n", + " ('powiązany', 'płotek'): 1,\n", + " ('płotek', 'połyskał'): 1,\n", + " ('połyskał', 'się'): 2,\n", + " ('się', 'wstążkami'): 1,\n", + " ('wstążkami', 'jaskrawych'): 1,\n", + " ('jaskrawych', 'stokrotek'): 1,\n", + " ('stokrotek', 'grządki'): 1,\n", + " ('grządki', 'widać'): 1,\n", + " ('że', 'były'): 1,\n", + " ('były', 'świeżo'): 1,\n", + " ('świeżo', 'polewane'): 1,\n", + " ('polewane', 'tuż'): 1,\n", + " ('tuż', 'stało'): 1,\n", + " ('stało', 'wody'): 1,\n", + " ('wody', 'pełne'): 1,\n", + " ('pełne', 'naczynie'): 1,\n", + " ('naczynie', 'blaszane'): 1,\n", + " ('blaszane', 'ale'): 1,\n", + " ('ale', 'nigdzie'): 1,\n", + " ('nigdzie', 'nie'): 1,\n", + " ('nie', 'widać'): 3,\n", + " ('widać', 'było'): 6,\n", + " ('było', 'ogrodniczki'): 1,\n", + " ('ogrodniczki', 'tylko'): 1,\n", + " ('tylko', 'co'): 2,\n", + " ('co', 'wyszła'): 1,\n", + " ('wyszła', 'jeszcze'): 1,\n", + " ('jeszcze', 'kołyszą'): 1,\n", + " ('kołyszą', 'się'): 1,\n", + " ('się', 'drzwiczki'): 1,\n", + " ('drzwiczki', 'świeżo'): 1,\n", + " ('świeżo', 'trącone'): 1,\n", + " ('trącone', 'blisko'): 1,\n", + " ('blisko', 'drzwi'): 1,\n", + " ('drzwi', 'ślad'): 1,\n", + " ('ślad', 'widać'): 1,\n", + " ('widać', 'nóżki'): 1,\n", + " ('nóżki', 'na'): 1,\n", + " ('na', 'piasku'): 2,\n", + " ('piasku', 'bez'): 1,\n", + " ('bez', 'trzewika'): 1,\n", + " ('trzewika', 'była'): 1,\n", + " ('była', 'i'): 2,\n", + " ('i', 'pończoszki'): 1,\n", + " ('pończoszki', 'na'): 1,\n", + " ('piasku', 'drobnym'): 1,\n", + " ('drobnym', 'suchym'): 1,\n", + " ('suchym', 'białym'): 1,\n", + " ('białym', 'na'): 1,\n", + " ('kształt', 'śniegu'): 1,\n", + " ('śniegu', 'ślad'): 1,\n", + " ('ślad', 'wyraźny'): 1,\n", + " ('wyraźny', 'lecz'): 1,\n", + " ('lecz', 'lekki'): 1,\n", + " ('lekki', 'odgadniesz'): 1,\n", + " ('odgadniesz', 'że'): 1,\n", + " ('w', 'biegu'): 6,\n", + " ('biegu', 'chybkim'): 1,\n", + " ('chybkim', 'był'): 1,\n", + " ('był', 'zostawiony'): 1,\n", + " ('zostawiony', 'nóżkami'): 1,\n", + " ('nóżkami', 'drobnemi'): 1,\n", + " ('drobnemi', 'od'): 1,\n", + " ('od', 'kogoś'): 1,\n", + " ('kogoś', 'co'): 1,\n", + " ('co', 'zaledwie'): 1,\n", + " ('zaledwie', 'dotykał'): 1,\n", + " ('dotykał', 'się'): 1,\n", + " ('się', 'ziemi'): 1,\n", + " ('ziemi', 'podróżny'): 1,\n", + " ('podróżny', 'długo'): 1,\n", + " ('długo', 'w'): 4,\n", + " ('w', 'oknie'): 1,\n", + " ('oknie', 'stał'): 1,\n", + " ('stał', 'patrząc'): 1,\n", + " ('patrząc', 'dumając'): 1,\n", + " ('dumając', 'wonnymi'): 1,\n", + " ('wonnymi', 'powiewami'): 1,\n", + " ('powiewami', 'kwiatów'): 1,\n", + " ('kwiatów', 'oddychając'): 1,\n", + " ('oddychając', 'oblicze'): 1,\n", + " ('oblicze', 'aż'): 1,\n", + " ('aż', 'na'): 4,\n", + " ('na', 'krzaki'): 1,\n", + " ('krzaki', 'fijołkowe'): 1,\n", + " ('fijołkowe', 'skłonił'): 1,\n", + " ('skłonił', 'oczyma'): 1,\n", + " ('oczyma', 'ciekawymi'): 1,\n", + " ('ciekawymi', 'po'): 1,\n", + " ('po', 'drożynach'): 1,\n", + " ('drożynach', 'gonił'): 1,\n", + " ('gonił', 'i'): 2,\n", + " ('i', 'znowu'): 10,\n", + " ('znowu', 'je'): 1,\n", + " ('je', 'na'): 2,\n", + " ('na', 'drobnych'): 1,\n", + " ('drobnych', 'śladach'): 1,\n", + " ('śladach', 'zatrzymywał'): 1,\n", + " ('zatrzymywał', 'myślał'): 1,\n", + " ('myślał', 'o'): 1,\n", + " ('o', 'nich'): 2,\n", + " ('nich', 'i'): 1,\n", + " ('i', 'czyje'): 1,\n", + " ('czyje', 'były'): 1,\n", + " ('były', 'odgadywał'): 1,\n", + " ('odgadywał', 'przypadkiem'): 1,\n", + " ('przypadkiem', 'oczy'): 1,\n", + " ('oczy', 'podniósł'): 2,\n", + " ('podniósł', 'i'): 2,\n", + " ('i', 'tuż'): 1,\n", + " ('tuż', 'na'): 1,\n", + " ('na', 'parkanie'): 3,\n", + " ('parkanie', 'stała'): 1,\n", + " ('stała', 'młoda'): 1,\n", + " ('młoda', 'dziewczyna'): 1,\n", + " ('dziewczyna', 'białe'): 1,\n", + " ('białe', 'jej'): 1,\n", + " ('jej', 'ubranie'): 1,\n", + " ('ubranie', 'wysmukłą'): 1,\n", + " ('wysmukłą', 'postać'): 1,\n", + " ('postać', 'tylko'): 1,\n", + " ('tylko', 'aż'): 1,\n", + " ('aż', 'do'): 10,\n", + " ('do', 'piersi'): 2,\n", + " ('piersi', 'kryje'): 1,\n", + " ('kryje', 'odsłaniając'): 1,\n", + " ('odsłaniając', 'ramiona'): 1,\n", + " ('ramiona', 'i'): 2,\n", + " ('i', 'łabędzią'): 1,\n", + " ('łabędzią', 'szyję'): 1,\n", + " ('szyję', 'w'): 1,\n", + " ('w', 'takim'): 4,\n", + " ('takim', 'litwinka'): 1,\n", + " ('litwinka', 'tylko'): 1,\n", + " ('tylko', 'chodzić'): 1,\n", + " ('chodzić', 'zwykła'): 1,\n", + " ('zwykła', 'z'): 1,\n", + " ('z', 'rana'): 7,\n", + " ('rana', 'w'): 1,\n", + " ('takim', 'nigdy'): 1,\n", + " ('nigdy', 'nie'): 13,\n", + " ('nie', 'bywa'): 1,\n", + " ('bywa', 'od'): 1,\n", + " ('od', 'mężczyzn'): 1,\n", + " ('mężczyzn', 'widziana'): 1,\n", + " ('widziana', 'więc'): 1,\n", + " ('więc', 'choć'): 1,\n", + " ('choć', 'świadka'): 1,\n", + " ('świadka', 'nie'): 1,\n", + " ('nie', 'miała'): 3,\n", + " ('miała', 'założyła'): 1,\n", + " ('założyła', 'ręce'): 1,\n", + " ('ręce', 'na'): 2,\n", + " ('na', 'piersiach'): 3,\n", + " ('piersiach', 'przydawając'): 1,\n", + " ('przydawając', 'zasłony'): 1,\n", + " ('zasłony', 'sukience'): 1,\n", + " ('sukience', 'włos'): 1,\n", + " ('włos', 'w'): 1,\n", + " ('w', 'pukle'): 2,\n", + " ('pukle', 'nierozwity'): 1,\n", + " ('nierozwity', 'lecz'): 1,\n", + " ('lecz', 'w'): 6,\n", + " ('w', 'węzełki'): 1,\n", + " ('węzełki', 'małe'): 1,\n", + " ('małe', 'pokręcony'): 1,\n", + " ('pokręcony', 'schowany'): 1,\n", + " ('schowany', 'w'): 1,\n", + " ('w', 'drobne'): 2,\n", + " ('drobne', 'strączki'): 1,\n", + " ('strączki', 'białe'): 1,\n", + " ('białe', 'dziwnie'): 1,\n", + " ('dziwnie', 'ozdabiał'): 1,\n", + " ('ozdabiał', 'głowę'): 1,\n", + " ('głowę', 'bo'): 1,\n", + " ('bo', 'od'): 3,\n", + " ('od', 'słońca'): 5,\n", + " ('słońca', 'blasku'): 2,\n", + " ('blasku', 'świecił'): 1,\n", + " ('świecił', 'się'): 2,\n", + " ('się', 'jak'): 17,\n", + " ('jak', 'korona'): 2,\n", + " ('korona', 'na'): 2,\n", + " ('na', 'świętych'): 2,\n", + " ('świętych', 'obrazku'): 2,\n", + " ('obrazku', 'twarzy'): 1,\n", + " ('twarzy', 'nie'): 3,\n", + " ('nie', 'było'): 13,\n", + " ('było', 'widać'): 2,\n", + " ('widać', 'zwrócona'): 1,\n", + " ('zwrócona', 'na'): 1,\n", + " ('na', 'pole'): 6,\n", + " ('pole', 'szukała'): 1,\n", + " ('szukała', 'kogoś'): 1,\n", + " ('kogoś', 'okiem'): 1,\n", + " ('okiem', 'daleko'): 1,\n", + " ('daleko', 'na'): 3,\n", + " ('na', 'dole'): 3,\n", + " ('dole', 'ujrzała'): 1,\n", + " ('ujrzała', 'zaśmiała'): 1,\n", + " ('zaśmiała', 'się'): 2,\n", + " ('się', 'i'): 46,\n", + " ('i', 'klasnęła'): 2,\n", + " ('klasnęła', 'w'): 2,\n", + " ('w', 'dłonie'): 2,\n", + " ('dłonie', 'jak'): 1,\n", + " ('jak', 'biały'): 1,\n", + " ('biały', 'ptak'): 1,\n", + " ('ptak', 'zleciała'): 1,\n", + " ('zleciała', 'z'): 1,\n", + " ('z', 'parkanu'): 1,\n", + " ('parkanu', 'na'): 1,\n", + " ('na', 'błonie'): 2,\n", + " ('błonie', 'i'): 1,\n", + " ('i', 'wionęła'): 1,\n", + " ('wionęła', 'ogrodem'): 1,\n", + " ('ogrodem', 'przez'): 1,\n", + " ('przez', 'płotki'): 1,\n", + " ('płotki', 'przez'): 1,\n", + " ('przez', 'kwiaty'): 1,\n", + " ('kwiaty', 'i'): 2,\n", + " ('i', 'po'): 16,\n", + " ('po', 'desce'): 1,\n", + " ('desce', 'opartej'): 1,\n", + " ('opartej', 'o'): 1,\n", + " ('o', 'ścianę'): 2,\n", + " ('ścianę', 'komnaty'): 1,\n", + " ('komnaty', 'nim'): 1,\n", + " ('nim', 'spostrzegł'): 1,\n", + " ('spostrzegł', 'się'): 1,\n", + " ('się', 'wleciała'): 1,\n", + " ('wleciała', 'przez'): 1,\n", + " ('przez', 'okno'): 5,\n", + " ('okno', 'świecąca'): 1,\n", + " ('świecąca', 'nagła'): 1,\n", + " ('nagła', 'cicha'): 1,\n", + " ('cicha', 'i'): 2,\n", + " ('i', 'lekka'): 1,\n", + " ('lekka', 'jak'): 1,\n", + " ('jak', 'światłość'): 1,\n", + " ('światłość', 'miesiąca'): 1,\n", + " ('miesiąca', 'nucąc'): 1,\n", + " ('nucąc', 'chwyciła'): 1,\n", + " ('chwyciła', 'suknie'): 1,\n", + " ('suknie', 'biegła'): 1,\n", + " ('biegła', 'do'): 1,\n", + " ('do', 'zwierciadła'): 1,\n", + " ('zwierciadła', 'wtem'): 1,\n", + " ('wtem', 'ujrzała'): 1,\n", + " ('ujrzała', 'młodzieńca'): 1,\n", + " ('młodzieńca', 'i'): 1,\n", + " ('z', 'rąk'): 8,\n", + " ('rąk', 'jej'): 1,\n", + " ('jej', 'wypadła'): 1,\n", + " ('wypadła', 'suknia'): 1,\n", + " ('suknia', 'a'): 1,\n", + " ('a', 'twarz'): 1,\n", + " ('twarz', 'od'): 1,\n", + " ('od', 'strachu'): 1,\n", + " ('strachu', 'i'): 1,\n", + " ('i', 'dziwu'): 1,\n", + " ('dziwu', 'pobladła'): 1,\n", + " ('pobladła', 'twarz'): 1,\n", + " ('twarz', 'podróżnego'): 1,\n", + " ('podróżnego', 'barwą'): 1,\n", + " ('barwą', 'spłonęła'): 1,\n", + " ('spłonęła', 'rumianą'): 1,\n", + " ('rumianą', 'jak'): 1,\n", + " ('jak', 'obłok'): 1,\n", + " ('obłok', 'gdy'): 1,\n", + " ('gdy', 'z'): 5,\n", + " ('z', 'jutrzenką'): 1,\n", + " ('jutrzenką', 'napotka'): 1,\n", + " ('napotka', 'się'): 1,\n", + " ('się', 'raną'): 1,\n", + " ('raną', 'skromny'): 1,\n", + " ('skromny', 'młodzieniec'): 1,\n", + " ('młodzieniec', 'oczy'): 1,\n", + " ('oczy', 'zmrużył'): 2,\n", + " ('zmrużył', 'i'): 1,\n", + " ('i', 'przysłonił'): 1,\n", + " ('przysłonił', 'chciał'): 1,\n", + " ('chciał', 'coś'): 2,\n", + " ('coś', 'mówić'): 2,\n", + " ('mówić', 'przepraszać'): 1,\n", + " ('przepraszać', 'tylko'): 1,\n", + " ('się', 'ukłonił'): 1,\n", + " ('ukłonił', 'i'): 1,\n", + " ('i', 'cofnął'): 1,\n", + " ('się', 'dziewica'): 1,\n", + " ('dziewica', 'krzyknęła'): 1,\n", + " ('krzyknęła', 'boleśnie'): 1,\n", + " ('boleśnie', 'niewyraźnie'): 1,\n", + " ('niewyraźnie', 'jak'): 1,\n", + " ('jak', 'dziecko'): 2,\n", + " ('dziecko', 'przestraszone'): 1,\n", + " ('przestraszone', 'we'): 1,\n", + " ('we', 'śnie'): 2,\n", + " ('śnie', 'podróżny'): 1,\n", + " ('podróżny', 'zląkł'): 1,\n", + " ('zląkł', 'się'): 3,\n", + " ('się', 'spojrzał'): 1,\n", + " ('spojrzał', 'lecz'): 1,\n", + " ('lecz', 'już'): 1,\n", + " ('już', 'jej'): 1,\n", + " ('jej', 'nie'): 4,\n", + " ('było', 'wyszedł'): 1,\n", + " ('wyszedł', 'zmieszany'): 1,\n", + " ('zmieszany', 'i'): 1,\n", + " ('i', 'czuł'): 3,\n", + " ('czuł', 'że'): 7,\n", + " ('że', 'mu'): 5,\n", + " ('mu', 'serce'): 1,\n", + " ('serce', 'biło'): 1,\n", + " ('biło', 'głośno'): 1,\n", + " ('głośno', 'i'): 1,\n", + " ('i', 'sam'): 5,\n", + " ('sam', 'nie'): 9,\n", + " ('nie', 'wiedział'): 8,\n", + " ('wiedział', 'czy'): 2,\n", + " ('czy', 'go'): 1,\n", + " ('go', 'miało'): 1,\n", + " ('miało', 'śmieszyć'): 1,\n", + " ('śmieszyć', 'to'): 1,\n", + " ('to', 'dziwaczne'): 1,\n", + " ('dziwaczne', 'spotkanie'): 1,\n", + " ('spotkanie', 'czy'): 1,\n", + " ('czy', 'wstydzić'): 1,\n", + " ('wstydzić', 'czy'): 1,\n", + " ('czy', 'cieszyć'): 1,\n", + " ('cieszyć', 'tymczasem'): 1,\n", + " ('tymczasem', 'na'): 2,\n", + " ('na', 'folwarku'): 1,\n", + " ('nie', 'uszło'): 1,\n", + " ('uszło', 'baczności'): 1,\n", + " ('baczności', 'że'): 1,\n", + " ('że', 'przed'): 1,\n", + " ('ganek', 'zajechał'): 1,\n", + " ('zajechał', 'któryś'): 1,\n", + " ('któryś', 'z'): 1,\n", + " ('z', 'nowych'): 1,\n", + " ('nowych', 'gości'): 1,\n", + " ('gości', 'już'): 1,\n", + " ('już', 'konie'): 1,\n", + " ('konie', 'w'): 1,\n", + " ('w', 'stajnią'): 1,\n", + " ('stajnią', 'wzięto'): 1,\n", + " ('wzięto', 'już'): 1,\n", + " ...})" + ] + }, + "execution_count": 14, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "cnt" + ] + }, + { + "cell_type": "code", + "execution_count": 15, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "150" + ] + }, + "execution_count": 15, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "sum({bigram:number for bigram,number in cnt.items() if bigram[0] == 'pan'}.values())" + ] + }, + { + "cell_type": "code", + "execution_count": 16, + "metadata": { + "scrolled": true + }, + "outputs": [], + "source": [ + "pan_cnt = Counter({bigram:number for bigram,number in cnt.items() if bigram[0] == 'pan'})" + ] + }, + { + "cell_type": "code", + "execution_count": 17, + "metadata": { + "scrolled": true + }, + "outputs": [ + { + "data": { + "text/plain": [ + "[(('pan', 'sędzia'), 15),\n", + " (('pan', 'hrabia'), 11),\n", + " (('pan', 'rejent'), 9),\n", + " (('pan', 'tadeusz'), 8),\n", + " (('pan', 'wojski'), 7),\n", + " (('pan', 'bóg'), 6),\n", + " (('pan', 'nie'), 6),\n", + " (('pan', 'podkomorzy'), 4),\n", + " (('pan', 'z'), 3),\n", + " (('pan', 'mój'), 3),\n", + " (('pan', 'stolnik'), 3),\n", + " (('pan', 'jacek'), 3),\n", + " (('pan', 'zawsze'), 2),\n", + " (('pan', 'i'), 2),\n", + " (('pan', 'mu'), 2),\n", + " (('pan', 'że'), 2),\n", + " (('pan', 'to'), 2),\n", + " (('pan', 'świata'), 1),\n", + " (('pan', 'podczaszyc'), 1),\n", + " (('pan', 'kapitan'), 1),\n", + " (('pan', 'kusość'), 1),\n", + " (('pan', 'taki'), 1),\n", + " (('pan', 'nigdy'), 1),\n", + " (('pan', 'może'), 1),\n", + " (('pan', 'grosza'), 1),\n", + " (('pan', 'żartuje'), 1),\n", + " (('pan', 'tylko'), 1),\n", + " (('pan', 'obaczy'), 1),\n", + " (('pan', 'sam'), 1),\n", + " (('pan', 'godził'), 1),\n", + " (('pan', 'tyle'), 1),\n", + " (('pan', 'historyi'), 1),\n", + " (('pan', 'w'), 1),\n", + " (('pan', 'popierał'), 1),\n", + " (('pan', 'słaniając'), 1),\n", + " (('pan', 'potężny'), 1),\n", + " (('pan', 'o'), 1),\n", + " (('pan', 'tak'), 1),\n", + " (('pan', 'się'), 1),\n", + " (('pan', 'patrzcie'), 1),\n", + " (('pan', 'słusznej'), 1),\n", + " (('pan', 'możny'), 1),\n", + " (('pan', 'przychodzi'), 1),\n", + " (('pan', 'dobrodziéj'), 1),\n", + " (('pan', 'wstaje'), 1),\n", + " (('pan', 'zaspał'), 1),\n", + " (('pan', 'najjaśniejszy'), 1),\n", + " (('pan', 'jenerał'), 1),\n", + " (('pan', 'chorąży'), 1),\n", + " (('pan', 'zabił'), 1),\n", + " (('pan', 'bredzi'), 1),\n", + " (('pan', 'zmienni'), 1),\n", + " (('pan', 'dobrze'), 1),\n", + " (('pan', 'rejtan'), 1),\n", + " (('pan', 'nasz'), 1),\n", + " (('pan', 'co'), 1),\n", + " (('pan', 'jadasz'), 1),\n", + " (('pan', 'chce'), 1),\n", + " (('pan', 'wie'), 1),\n", + " (('pan', 'niechaj'), 1),\n", + " (('pan', 'spać'), 1),\n", + " (('pan', 'ma'), 1),\n", + " (('pan', 'wyfuka'), 1),\n", + " (('pan', 'dumny'), 1),\n", + " (('pan', 'pociej'), 1),\n", + " (('pan', 'komisarz'), 1),\n", + " (('pan', 'klucznik'), 1),\n", + " (('pan', 'drze'), 1),\n", + " (('pan', 'maciek'), 1),\n", + " (('pan', 'wołk'), 1),\n", + " (('pan', 'tyzenhauz'), 1),\n", + " (('pan', 'sołtan'), 1),\n", + " (('pan', 'nikita'), 1),\n", + " (('pan', 'zan'), 1),\n", + " (('pan', 'chować'), 1),\n", + " (('pan', 'wyzwałeś'), 1),\n", + " (('pan', 'przerwał'), 1),\n", + " (('pan', 'odjeżdżasz'), 1),\n", + " (('pan', 'głowę'), 1)]" + ] + }, + "execution_count": 17, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "pan_cnt.most_common()" + ] + }, + { + "cell_type": "code", + "execution_count": 18, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "150" + ] + }, + "execution_count": 18, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "sum(pan_cnt.values())" + ] + }, + { + "cell_type": "code", + "execution_count": 19, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "8" + ] + }, + "execution_count": 19, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "pan_cnt[('pan', 'tadeusz')]" + ] + }, + { + "cell_type": "code", + "execution_count": 20, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "0.05333333333333334" + ] + }, + "execution_count": 20, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "pan_cnt[('pan', 'tadeusz')] / sum(pan_cnt.values())" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "## zadanie \n", + "\n", + "- (zad1) napisać funkcję unigram_most_probable(), która zwraca listę 10 najbardziej prawdopodobnych słów wraz z ich prawdopodobieństwami wg modelu unigramowego\n", + "\n", + "- (zad2) napisać funkcję bigram_most_probable(word1), która zwraca listę 10 najbardziej prawdopodobnych słów wraz z ich prawdopodobieństawami w zależności od word1 wg modelu bigramowego\n", + "\n", + "- (zad3) napisać funkcję trigram_most_probable(word1), która zwraca listę 10 najbardziej prawdopodobnych słów wraz z ich prawdopodobieństawami w zależności od word1, word2 wg modelu trigramowego\n", + "\n", + "- (zad4) sprawdzić ile razy wystąpił najliczniejszy unigram, bigram i trigram\n", + "\n", + "- (zad5) jakie jest prawdpodobieństwo p('lasu' | 'młodzież', 'poszła', 'do, ) wg modelu unigramowego, bigramowego, trigramowego?\n", + "\n", + "- (zad6) Jakie jest prawdopodobieństwo wystąpienia stokenizowanych sekwencji wg modelu bigramowego? \"I z łąk, i z pastwisk razem wracało do dworu.\"\n", + " \"Tadeusz lewą dłonią dotykając głowy, Pozdrowił swych dowódców przez ukłon wojskowy;\" \n", + " ( Pierwszy tekst pochodzi ze zbioru trenującego, a drugi ze zbioru testowego )\n", + "\n", + "- (zad7) Jakie jest perplexity dla powyższych zdań wg modelu bigramowego z wygładzaniem laplaca?" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "## Wzory\n", + "\n", + "### Unigram\n", + "$p(w_1, w_2, \\ldots, w_n) = p(w_1)*p(w_2)*\\ldots*p(w_n)$\n", + "\n", + "$p(w_n| w_{n-1}, \\ldots w_1) = p(w_n)$\n", + "\n", + "### Bigram \n", + "$p(w_1, w_2, \\ldots, w_n) = p(w_1)*p(w_2|w1)*\\ldots*p(w_n|w_{n-1})$\n", + "\n", + "$p(w_n| w_{n-1}, \\ldots w_1) = p(w_n|w_{n-1})$\n", + "\n", + "### Trigram\n", + "$p(w_1, w_2, \\ldots, w_n) = p(w_1)*p(w_2|w1)* p(w_3|w1,w2)*\\ldots*p(w_n|w_{n-1}, w_{n-2})$\n", + "\n", + "$p(w_n| w_{n-1}, \\ldots w_1) = p(w_n|w_{n-1}, w_{n-2})$\n", + "\n", + "\n", + "Komentarz: W tym przypadku $p(w_1)$ weź z modelu unigramowego, a $p(w_2|w1)$ z modelu bigramowego. Analogicznie zrób z modelem bigramowym. Gdybyśmy mieli wiele dokumentów, można by brać $p(w_1|)$\n", + "\n", + "### Wygładzanie laplaca\n", + "$P(w_i) = \\frac{c_i + 1}{N + V}$\n", + "\n", + "\n", + "### Perplexity\n", + "$PP(w_1,\\ldots, w_n) = p(w_1,\\ldots, w_n)^{-\\frac{1}{N}}$" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "### ODPOWIEDZI\n", + "\n" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "### zad1" + ] + }, + { + "cell_type": "code", + "execution_count": 21, + "metadata": {}, + "outputs": [], + "source": [ + "ngrams_1 = list(ngrams(corpora_train_tokenized, 1))\n", + "cnt_1_grams = Counter(ngrams_1)" + ] + }, + { + "cell_type": "code", + "execution_count": 22, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "[(('i',), 1768),\n", + " (('w',), 1426),\n", + " (('się',), 1275),\n", + " (('z',), 1176),\n", + " (('na',), 1083),\n", + " (('nie',), 801),\n", + " (('jak',), 500),\n", + " (('do',), 480),\n", + " (('a',), 470),\n", + " (('że',), 456)]" + ] + }, + "execution_count": 22, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "cnt_1_grams.most_common(10)" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "### zad2" + ] + }, + { + "cell_type": "code", + "execution_count": 23, + "metadata": {}, + "outputs": [], + "source": [ + "ngrams_2 = list(ngrams(corpora_train_tokenized, 2))\n", + "cnt_2_grams = Counter(ngrams_2)" + ] + }, + { + "cell_type": "code", + "execution_count": 24, + "metadata": { + "scrolled": true + }, + "outputs": [ + { + "data": { + "text/plain": [ + "Counter({('adam', 'mickiewicz'): 1,\n", + " ('mickiewicz', 'pan'): 1,\n", + " ('pan', 'tadeusz'): 8,\n", + " ('tadeusz', 'czyli'): 1,\n", + " ('czyli', 'ostatni'): 1,\n", + " ('ostatni', 'zajazd'): 1,\n", + " ('zajazd', 'na'): 1,\n", + " ('na', 'litwie'): 14,\n", + " ('litwie', 'księga'): 2,\n", + " ('księga', 'pierwsza'): 1,\n", + " ('pierwsza', 'gospodarstwo'): 1,\n", + " ('gospodarstwo', 'powrót'): 1,\n", + " ('powrót', 'panicza'): 1,\n", + " ('panicza', 'spotkanie'): 1,\n", + " ('spotkanie', 'się'): 3,\n", + " ('się', 'pierwsze'): 1,\n", + " ('pierwsze', 'w'): 1,\n", + " ('w', 'pokoiku'): 1,\n", + " ('pokoiku', 'drugie'): 1,\n", + " ('drugie', 'u'): 1,\n", + " ('u', 'stołu'): 5,\n", + " ('stołu', 'ważna'): 1,\n", + " ('ważna', 'sędziego'): 1,\n", + " ('sędziego', 'nauka'): 1,\n", + " ('nauka', 'o'): 1,\n", + " ('o', 'grzeczności'): 1,\n", + " ('grzeczności', 'podkomorzego'): 1,\n", + " ('podkomorzego', 'uwagi'): 1,\n", + " ('uwagi', 'polityczne'): 1,\n", + " ('polityczne', 'nad'): 1,\n", + " ('nad', 'modami'): 1,\n", + " ('modami', 'początek'): 1,\n", + " ('początek', 'sporu'): 1,\n", + " ('sporu', 'o'): 1,\n", + " ('o', 'kusego'): 4,\n", + " ('kusego', 'i'): 3,\n", + " ('i', 'sokoła'): 3,\n", + " ('sokoła', 'żale'): 1,\n", + " ('żale', 'wojskiego'): 1,\n", + " ('wojskiego', 'ostatni'): 1,\n", + " ('ostatni', 'woźny'): 1,\n", + " ('woźny', 'trybunału'): 2,\n", + " ('trybunału', 'rzut'): 1,\n", + " ('rzut', 'oka'): 2,\n", + " ('oka', 'na'): 1,\n", + " ('na', 'ówczesny'): 1,\n", + " ('ówczesny', 'stan'): 1,\n", + " ('stan', 'polityczny'): 1,\n", + " ('polityczny', 'litwy'): 1,\n", + " ('litwy', 'i'): 1,\n", + " ('i', 'europy'): 1,\n", + " ('europy', 'litwo'): 1,\n", + " ('litwo', 'ojczyzno'): 1,\n", + " ('ojczyzno', 'moja'): 1,\n", + " ('moja', 'ty'): 1,\n", + " ('ty', 'jesteś'): 3,\n", + " ('jesteś', 'jak'): 1,\n", + " ('jak', 'zdrowie'): 1,\n", + " ('zdrowie', 'ile'): 1,\n", + " ('ile', 'cię'): 1,\n", + " ('cię', 'trzeba'): 1,\n", + " ('trzeba', 'cenić'): 1,\n", + " ('cenić', 'ten'): 1,\n", + " ('ten', 'tylko'): 1,\n", + " ('tylko', 'się'): 5,\n", + " ('się', 'dowie'): 2,\n", + " ('dowie', 'kto'): 1,\n", + " ('kto', 'cię'): 1,\n", + " ('cię', 'stracił'): 1,\n", + " ('stracił', 'dziś'): 1,\n", + " ('dziś', 'piękność'): 1,\n", + " ('piękność', 'twą'): 1,\n", + " ('twą', 'w'): 1,\n", + " ('w', 'całej'): 4,\n", + " ('całej', 'ozdobie'): 1,\n", + " ('ozdobie', 'widzę'): 1,\n", + " ('widzę', 'i'): 1,\n", + " ('i', 'opisuję'): 1,\n", + " ('opisuję', 'bo'): 1,\n", + " ('bo', 'tęsknię'): 1,\n", + " ('tęsknię', 'po'): 1,\n", + " ('po', 'tobie'): 1,\n", + " ('tobie', 'panno'): 1,\n", + " ('panno', 'święta'): 1,\n", + " ('święta', 'co'): 1,\n", + " ('co', 'jasnej'): 1,\n", + " ('jasnej', 'bronisz'): 1,\n", + " ('bronisz', 'częstochowy'): 1,\n", + " ('częstochowy', 'i'): 1,\n", + " ('i', 'w'): 44,\n", + " ('w', 'ostrej'): 1,\n", + " ('ostrej', 'świecisz'): 1,\n", + " ('świecisz', 'bramie'): 1,\n", + " ('bramie', 'ty'): 1,\n", + " ('ty', 'co'): 1,\n", + " ('co', 'gród'): 1,\n", + " ('gród', 'zamkowy'): 1,\n", + " ('zamkowy', 'nowogródzki'): 1,\n", + " ('nowogródzki', 'ochraniasz'): 1,\n", + " ('ochraniasz', 'z'): 1,\n", + " ('z', 'jego'): 3,\n", + " ('jego', 'wiernym'): 1,\n", + " ('wiernym', 'ludem'): 1,\n", + " ('ludem', 'jak'): 1,\n", + " ('jak', 'mnie'): 3,\n", + " ('mnie', 'dziecko'): 1,\n", + " ('dziecko', 'do'): 1,\n", + " ('do', 'zdrowia'): 1,\n", + " ('zdrowia', 'powróciłaś'): 1,\n", + " ('powróciłaś', 'cudem'): 1,\n", + " ('cudem', 'gdy'): 1,\n", + " ('gdy', 'od'): 1,\n", + " ('od', 'płaczącej'): 1,\n", + " ('płaczącej', 'matki'): 1,\n", + " ('matki', 'pod'): 1,\n", + " ('pod', 'twoją'): 1,\n", + " ('twoją', 'opiekę'): 1,\n", + " ('opiekę', 'ofiarowany'): 1,\n", + " ('ofiarowany', 'martwą'): 1,\n", + " ('martwą', 'podniosłem'): 1,\n", + " ('podniosłem', 'powiekę'): 1,\n", + " ('powiekę', 'i'): 1,\n", + " ('i', 'zaraz'): 5,\n", + " ('zaraz', 'mogłem'): 1,\n", + " ('mogłem', 'pieszo'): 1,\n", + " ('pieszo', 'do'): 1,\n", + " ('do', 'twych'): 1,\n", + " ('twych', 'świątyń'): 1,\n", + " ('świątyń', 'progu'): 1,\n", + " ('progu', 'iść'): 1,\n", + " ('iść', 'za'): 1,\n", + " ('za', 'wrócone'): 1,\n", + " ('wrócone', 'życie'): 1,\n", + " ('życie', 'podziękować'): 1,\n", + " ('podziękować', 'bogu'): 1,\n", + " ('bogu', 'tak'): 1,\n", + " ('tak', 'nas'): 2,\n", + " ('nas', 'powrócisz'): 1,\n", + " ('powrócisz', 'cudem'): 1,\n", + " ('cudem', 'na'): 1,\n", + " ('na', 'ojczyzny'): 1,\n", + " ('ojczyzny', 'łono'): 1,\n", + " ('łono', 'tymczasem'): 1,\n", + " ('tymczasem', 'przenoś'): 1,\n", + " ('przenoś', 'moją'): 1,\n", + " ('moją', 'duszę'): 1,\n", + " ('duszę', 'utęsknioną'): 1,\n", + " ('utęsknioną', 'do'): 1,\n", + " ('do', 'tych'): 4,\n", + " ('tych', 'pagórków'): 1,\n", + " ('pagórków', 'leśnych'): 1,\n", + " ('leśnych', 'do'): 1,\n", + " ('tych', 'łąk'): 1,\n", + " ('łąk', 'zielonych'): 1,\n", + " ('zielonych', 'szeroko'): 1,\n", + " ('szeroko', 'nad'): 1,\n", + " ('nad', 'błękitnym'): 1,\n", + " ('błękitnym', 'niemnem'): 1,\n", + " ('niemnem', 'rozciągnionych'): 1,\n", + " ('rozciągnionych', 'do'): 1,\n", + " ('tych', 'pól'): 1,\n", + " ('pól', 'malowanych'): 1,\n", + " ('malowanych', 'zbożem'): 1,\n", + " ('zbożem', 'rozmaitem'): 1,\n", + " ('rozmaitem', 'wyzłacanych'): 1,\n", + " ('wyzłacanych', 'pszenicą'): 1,\n", + " ('pszenicą', 'posrebrzanych'): 1,\n", + " ('posrebrzanych', 'żytem'): 1,\n", + " ('żytem', 'gdzie'): 1,\n", + " ('gdzie', 'bursztynowy'): 1,\n", + " ('bursztynowy', 'świerzop'): 1,\n", + " ('świerzop', 'gryka'): 1,\n", + " ('gryka', 'jak'): 1,\n", + " ('jak', 'śnieg'): 2,\n", + " ('śnieg', 'biała'): 1,\n", + " ('biała', 'gdzie'): 1,\n", + " ('gdzie', 'panieńskim'): 1,\n", + " ('panieńskim', 'rumieńcem'): 1,\n", + " ('rumieńcem', 'dzięcielina'): 1,\n", + " ('dzięcielina', 'pała'): 1,\n", + " ('pała', 'a'): 1,\n", + " ('a', 'wszystko'): 4,\n", + " ('wszystko', 'przepasane'): 1,\n", + " ('przepasane', 'jakby'): 1,\n", + " ('jakby', 'wstęgą'): 1,\n", + " ('wstęgą', 'miedzą'): 1,\n", + " ('miedzą', 'zieloną'): 1,\n", + " ('zieloną', 'na'): 1,\n", + " ('na', 'niej'): 1,\n", + " ('niej', 'z'): 2,\n", + " ('z', 'rzadka'): 5,\n", + " ('rzadka', 'ciche'): 1,\n", + " ('ciche', 'grusze'): 1,\n", + " ('grusze', 'siedzą'): 1,\n", + " ('siedzą', 'śród'): 2,\n", + " ('śród', 'takich'): 1,\n", + " ('takich', 'pól'): 1,\n", + " ('pól', 'przed'): 1,\n", + " ('przed', 'laty'): 4,\n", + " ('laty', 'nad'): 1,\n", + " ('nad', 'brzegiem'): 2,\n", + " ('brzegiem', 'ruczaju'): 1,\n", + " ('ruczaju', 'na'): 1,\n", + " ('na', 'pagórku'): 1,\n", + " ('pagórku', 'niewielkim'): 1,\n", + " ('niewielkim', 'we'): 1,\n", + " ('we', 'brzozowym'): 1,\n", + " ('brzozowym', 'gaju'): 1,\n", + " ('gaju', 'stał'): 1,\n", + " ('stał', 'dwór'): 1,\n", + " ('dwór', 'szlachecki'): 1,\n", + " ('szlachecki', 'z'): 1,\n", + " ('z', 'drzewa'): 4,\n", + " ('drzewa', 'lecz'): 1,\n", + " ('lecz', 'podmurowany'): 1,\n", + " ('podmurowany', 'świeciły'): 1,\n", + " ('świeciły', 'się'): 3,\n", + " ('się', 'z'): 56,\n", + " ('z', 'daleka'): 8,\n", + " ('daleka', 'pobielane'): 1,\n", + " ('pobielane', 'ściany'): 1,\n", + " ('ściany', 'tym'): 1,\n", + " ('tym', 'bielsze'): 1,\n", + " ('bielsze', 'że'): 1,\n", + " ('że', 'odbite'): 1,\n", + " ('odbite', 'od'): 1,\n", + " ('od', 'ciemnej'): 1,\n", + " ('ciemnej', 'zieleni'): 1,\n", + " ('zieleni', 'topoli'): 1,\n", + " ('topoli', 'co'): 1,\n", + " ('co', 'go'): 2,\n", + " ('go', 'bronią'): 1,\n", + " ('bronią', 'od'): 1,\n", + " ('od', 'wiatrów'): 1,\n", + " ('wiatrów', 'jesieni'): 1,\n", + " ('jesieni', 'dom'): 1,\n", + " ('dom', 'mieszkalny'): 1,\n", + " ('mieszkalny', 'niewielki'): 1,\n", + " ('niewielki', 'lecz'): 1,\n", + " ('lecz', 'zewsząd'): 1,\n", + " ('zewsząd', 'chędogi'): 1,\n", + " ('chędogi', 'i'): 1,\n", + " ('i', 'stodołę'): 1,\n", + " ('stodołę', 'miał'): 1,\n", + " ('miał', 'wielką'): 1,\n", + " ('wielką', 'i'): 1,\n", + " ('i', 'przy'): 1,\n", + " ('przy', 'niej'): 1,\n", + " ('niej', 'trzy'): 1,\n", + " ('trzy', 'stogi'): 1,\n", + " ('stogi', 'użątku'): 1,\n", + " ('użątku', 'co'): 1,\n", + " ('co', 'pod'): 1,\n", + " ('pod', 'strzechą'): 2,\n", + " ('strzechą', 'zmieścić'): 1,\n", + " ('zmieścić', 'się'): 1,\n", + " ('się', 'nie'): 20,\n", + " ('nie', 'może'): 10,\n", + " ('może', 'widać'): 1,\n", + " ('widać', 'że'): 12,\n", + " ('że', 'okolica'): 1,\n", + " ('okolica', 'obfita'): 1,\n", + " ('obfita', 'we'): 1,\n", + " ('we', 'zboże'): 1,\n", + " ('zboże', 'i'): 2,\n", + " ('i', 'widać'): 3,\n", + " ('widać', 'z'): 7,\n", + " ('z', 'liczby'): 2,\n", + " ('liczby', 'kopic'): 1,\n", + " ('kopic', 'co'): 1,\n", + " ('co', 'wzdłuż'): 1,\n", + " ('wzdłuż', 'i'): 2,\n", + " ('i', 'wszerz'): 3,\n", + " ('wszerz', 'smugów'): 1,\n", + " ('smugów', 'świecą'): 1,\n", + " ('świecą', 'gęsto'): 1,\n", + " ('gęsto', 'jak'): 1,\n", + " ('jak', 'gwiazdy'): 1,\n", + " ('gwiazdy', 'widać'): 1,\n", + " ('liczby', 'pługów'): 1,\n", + " ('pługów', 'orzących'): 1,\n", + " ('orzących', 'wcześnie'): 1,\n", + " ('wcześnie', 'łany'): 1,\n", + " ('łany', 'ogromne'): 1,\n", + " ('ogromne', 'ugoru'): 1,\n", + " ('ugoru', 'czarnoziemne'): 1,\n", + " ('czarnoziemne', 'zapewne'): 1,\n", + " ('zapewne', 'należne'): 1,\n", + " ('należne', 'do'): 1,\n", + " ('do', 'dworu'): 9,\n", + " ('dworu', 'uprawne'): 1,\n", + " ('uprawne', 'dobrze'): 1,\n", + " ('dobrze', 'na'): 3,\n", + " ('na', 'kształt'): 20,\n", + " ('kształt', 'ogrodowych'): 1,\n", + " ('ogrodowych', 'grządek'): 1,\n", + " ('grządek', 'że'): 1,\n", + " ('że', 'w'): 19,\n", + " ('w', 'tym'): 20,\n", + " ('tym', 'domu'): 1,\n", + " ('domu', 'dostatek'): 1,\n", + " ('dostatek', 'mieszka'): 1,\n", + " ('mieszka', 'i'): 1,\n", + " ('i', 'porządek'): 1,\n", + " ('porządek', 'brama'): 1,\n", + " ('brama', 'na'): 1,\n", + " ('na', 'wciąż'): 1,\n", + " ('wciąż', 'otwarta'): 1,\n", + " ('otwarta', 'przechodniom'): 1,\n", + " ('przechodniom', 'ogłasza'): 1,\n", + " ('ogłasza', 'że'): 1,\n", + " ('że', 'gościnna'): 1,\n", + " ('gościnna', 'i'): 1,\n", + " ('i', 'wszystkich'): 2,\n", + " ('wszystkich', 'w'): 2,\n", + " ('w', 'gościnę'): 1,\n", + " ('gościnę', 'zaprasza'): 1,\n", + " ('zaprasza', 'właśnie'): 1,\n", + " ('właśnie', 'dwukonną'): 1,\n", + " ('dwukonną', 'bryką'): 1,\n", + " ('bryką', 'wjechał'): 1,\n", + " ('wjechał', 'młody'): 1,\n", + " ('młody', 'panek'): 1,\n", + " ('panek', 'i'): 1,\n", + " ('i', 'obiegłszy'): 1,\n", + " ('obiegłszy', 'dziedziniec'): 1,\n", + " ('dziedziniec', 'zawrócił'): 1,\n", + " ('zawrócił', 'przed'): 1,\n", + " ('przed', 'ganek'): 2,\n", + " ('ganek', 'wysiadł'): 1,\n", + " ('wysiadł', 'z'): 1,\n", + " ('z', 'powozu'): 1,\n", + " ('powozu', 'konie'): 1,\n", + " ('konie', 'porzucone'): 1,\n", + " ('porzucone', 'same'): 1,\n", + " ('same', 'szczypiąc'): 1,\n", + " ('szczypiąc', 'trawę'): 1,\n", + " ('trawę', 'ciągnęły'): 1,\n", + " ('ciągnęły', 'powoli'): 1,\n", + " ('powoli', 'pod'): 1,\n", + " ('pod', 'bramę'): 2,\n", + " ('bramę', 'we'): 1,\n", + " ('we', 'dworze'): 10,\n", + " ('dworze', 'pusto'): 1,\n", + " ('pusto', 'bo'): 1,\n", + " ('bo', 'drzwi'): 2,\n", + " ('drzwi', 'od'): 1,\n", + " ('od', 'ganku'): 1,\n", + " ('ganku', 'zamknięto'): 1,\n", + " ('zamknięto', 'zaszczepkami'): 1,\n", + " ('zaszczepkami', 'i'): 1,\n", + " ('i', 'kołkiem'): 1,\n", + " ('kołkiem', 'zaszczepki'): 1,\n", + " ('zaszczepki', 'przetknięto'): 1,\n", + " ('przetknięto', 'podróżny'): 1,\n", + " ('podróżny', 'do'): 1,\n", + " ('do', 'folwarku'): 3,\n", + " ('folwarku', 'nie'): 2,\n", + " ('nie', 'biegł'): 1,\n", + " ('biegł', 'sług'): 1,\n", + " ('sług', 'zapytać'): 1,\n", + " ('zapytać', 'odemknął'): 1,\n", + " ('odemknął', 'wbiegł'): 1,\n", + " ('wbiegł', 'do'): 1,\n", + " ('do', 'domu'): 12,\n", + " ('domu', 'pragnął'): 1,\n", + " ('pragnął', 'go'): 1,\n", + " ('go', 'powitać'): 1,\n", + " ('powitać', 'dawno'): 1,\n", + " ('dawno', 'domu'): 1,\n", + " ('domu', 'nie'): 1,\n", + " ('nie', 'widział'): 7,\n", + " ('widział', 'bo'): 2,\n", + " ('bo', 'w'): 8,\n", + " ('w', 'dalekim'): 1,\n", + " ('dalekim', 'mieście'): 1,\n", + " ('mieście', 'kończył'): 1,\n", + " ('kończył', 'nauki'): 1,\n", + " ('nauki', 'końca'): 1,\n", + " ('końca', 'doczekał'): 1,\n", + " ('doczekał', 'nareszcie'): 1,\n", + " ('nareszcie', 'wbiega'): 1,\n", + " ('wbiega', 'i'): 1,\n", + " ('i', 'okiem'): 2,\n", + " ('okiem', 'chciwie'): 1,\n", + " ('chciwie', 'ściany'): 1,\n", + " ('ściany', 'starodawne'): 1,\n", + " ('starodawne', 'ogląda'): 1,\n", + " ('ogląda', 'czule'): 1,\n", + " ('czule', 'jako'): 1,\n", + " ('jako', 'swe'): 1,\n", + " ('swe', 'znajome'): 1,\n", + " ('znajome', 'dawne'): 1,\n", + " ('dawne', 'też'): 1,\n", + " ('też', 'same'): 4,\n", + " ('same', 'widzi'): 1,\n", + " ('widzi', 'sprzęty'): 1,\n", + " ('sprzęty', 'też'): 1,\n", + " ('same', 'obicia'): 1,\n", + " ('obicia', 'z'): 1,\n", + " ('z', 'którymi'): 1,\n", + " ('którymi', 'się'): 1,\n", + " ('się', 'zabawiać'): 1,\n", + " ('zabawiać', 'lubił'): 1,\n", + " ('lubił', 'od'): 1,\n", + " ('od', 'powicia'): 1,\n", + " ('powicia', 'lecz'): 1,\n", + " ('lecz', 'mniej'): 1,\n", + " ('mniej', 'wielkie'): 1,\n", + " ('wielkie', 'mniej'): 1,\n", + " ('mniej', 'piękne'): 1,\n", + " ('piękne', 'niż'): 1,\n", + " ('niż', 'się'): 2,\n", + " ('się', 'dawniej'): 1,\n", + " ('dawniej', 'zdały'): 1,\n", + " ('zdały', 'i'): 1,\n", + " ('i', 'też'): 1,\n", + " ('same', 'portrety'): 1,\n", + " ('portrety', 'na'): 1,\n", + " ('na', 'ścianach'): 1,\n", + " ('ścianach', 'wisiały'): 1,\n", + " ('wisiały', 'tu'): 1,\n", + " ('tu', 'kościuszko'): 1,\n", + " ('kościuszko', 'w'): 1,\n", + " ('w', 'czamarce'): 1,\n", + " ('czamarce', 'krakowskiej'): 1,\n", + " ('krakowskiej', 'z'): 1,\n", + " ('z', 'oczyma'): 2,\n", + " ('oczyma', 'podniesionymi'): 1,\n", + " ('podniesionymi', 'w'): 1,\n", + " ('w', 'niebo'): 8,\n", + " ('niebo', 'miecz'): 1,\n", + " ('miecz', 'oburącz'): 1,\n", + " ('oburącz', 'trzyma'): 1,\n", + " ('trzyma', 'takim'): 1,\n", + " ('takim', 'był'): 1,\n", + " ('był', 'gdy'): 1,\n", + " ('gdy', 'przysięgał'): 1,\n", + " ('przysięgał', 'na'): 1,\n", + " ('na', 'stopniach'): 1,\n", + " ('stopniach', 'ołtarzów'): 1,\n", + " ('ołtarzów', 'że'): 1,\n", + " ('że', 'tym'): 1,\n", + " ('tym', 'mieczem'): 1,\n", + " ('mieczem', 'wypędzi'): 1,\n", + " ('wypędzi', 'z'): 1,\n", + " ('z', 'polski'): 2,\n", + " ('polski', 'trzech'): 1,\n", + " ('trzech', 'mocarzów'): 1,\n", + " ('mocarzów', 'albo'): 1,\n", + " ('albo', 'sam'): 1,\n", + " ('sam', 'na'): 3,\n", + " ('na', 'nim'): 10,\n", + " ('nim', 'padnie'): 1,\n", + " ('padnie', 'dalej'): 1,\n", + " ('dalej', 'w'): 3,\n", + " ('w', 'polskiej'): 1,\n", + " ('polskiej', 'szacie'): 1,\n", + " ('szacie', 'siedzi'): 1,\n", + " ('siedzi', 'rejtan'): 1,\n", + " ('rejtan', 'żałośny'): 1,\n", + " ('żałośny', 'po'): 1,\n", + " ('po', 'wolności'): 1,\n", + " ('wolności', 'stracie'): 1,\n", + " ('stracie', 'w'): 1,\n", + " ('w', 'ręku'): 15,\n", + " ('ręku', 'trzyma'): 1,\n", + " ('trzyma', 'nóż'): 1,\n", + " ('nóż', 'ostrzem'): 1,\n", + " ('ostrzem', 'zwrócony'): 1,\n", + " ('zwrócony', 'do'): 2,\n", + " ('do', 'łona'): 1,\n", + " ('łona', 'a'): 1,\n", + " ('a', 'przed'): 2,\n", + " ('przed', 'nim'): 5,\n", + " ('nim', 'leży'): 1,\n", + " ('leży', 'fedon'): 1,\n", + " ('fedon', 'i'): 1,\n", + " ('i', 'żywot'): 1,\n", + " ('żywot', 'katona'): 1,\n", + " ('katona', 'dalej'): 1,\n", + " ('dalej', 'jasiński'): 1,\n", + " ('jasiński', 'młodzian'): 1,\n", + " ('młodzian', 'piękny'): 1,\n", + " ('piękny', 'i'): 1,\n", + " ('i', 'posępny'): 2,\n", + " ('posępny', 'obok'): 1,\n", + " ('obok', 'korsak'): 1,\n", + " ('korsak', 'towarzysz'): 1,\n", + " ('towarzysz', 'jego'): 1,\n", + " ('jego', 'nieodstępny'): 1,\n", + " ('nieodstępny', 'stoją'): 1,\n", + " ('stoją', 'na'): 2,\n", + " ('na', 'szańcach'): 1,\n", + " ('szańcach', 'pragi'): 1,\n", + " ('pragi', 'na'): 1,\n", + " ('na', 'stosach'): 1,\n", + " ('stosach', 'moskali'): 1,\n", + " ('moskali', 'siekąc'): 1,\n", + " ('siekąc', 'wrogów'): 1,\n", + " ('wrogów', 'a'): 2,\n", + " ('a', 'praga'): 1,\n", + " ('praga', 'już'): 1,\n", + " ('już', 'się'): 5,\n", + " ('się', 'wkoło'): 5,\n", + " ('wkoło', 'pali'): 1,\n", + " ('pali', 'nawet'): 1,\n", + " ('nawet', 'stary'): 1,\n", + " ('stary', 'stojący'): 1,\n", + " ('stojący', 'zegar'): 1,\n", + " ('zegar', 'kurantowy'): 1,\n", + " ('kurantowy', 'w'): 1,\n", + " ('w', 'drewnianej'): 1,\n", + " ('drewnianej', 'szafie'): 1,\n", + " ('szafie', 'poznał'): 1,\n", + " ('poznał', 'u'): 1,\n", + " ('u', 'wniścia'): 1,\n", + " ('wniścia', 'alkowy'): 1,\n", + " ('alkowy', 'i'): 1,\n", + " ('i', 'z'): 54,\n", + " ('z', 'dziecinną'): 1,\n", + " ('dziecinną', 'radością'): 1,\n", + " ('radością', 'pociągnął'): 1,\n", + " ('pociągnął', 'za'): 1,\n", + " ('za', 'sznurek'): 1,\n", + " ('sznurek', 'by'): 1,\n", + " ('by', 'stary'): 1,\n", + " ('stary', 'dąbrowskiego'): 1,\n", + " ('dąbrowskiego', 'usłyszeć'): 1,\n", + " ('usłyszeć', 'mazurek'): 1,\n", + " ('mazurek', 'biegał'): 1,\n", + " ('biegał', 'po'): 2,\n", + " ('po', 'całym'): 2,\n", + " ('całym', 'domu'): 1,\n", + " ('domu', 'i'): 5,\n", + " ('i', 'szukał'): 2,\n", + " ('szukał', 'komnaty'): 1,\n", + " ('komnaty', 'gdzie'): 1,\n", + " ('gdzie', 'mieszkał'): 1,\n", + " ('mieszkał', 'dzieckiem'): 1,\n", + " ('dzieckiem', 'będąc'): 1,\n", + " ('będąc', 'przed'): 1,\n", + " ('przed', 'dziesięciu'): 1,\n", + " ('dziesięciu', 'laty'): 1,\n", + " ('laty', 'wchodzi'): 1,\n", + " ('wchodzi', 'cofnął'): 1,\n", + " ('cofnął', 'się'): 4,\n", + " ('się', 'toczył'): 2,\n", + " ('toczył', 'zdumione'): 1,\n", + " ('zdumione', 'źrenice'): 1,\n", + " ('źrenice', 'po'): 1,\n", + " ('po', 'ścianach'): 1,\n", + " ('ścianach', 'w'): 1,\n", + " ('w', 'tej'): 13,\n", + " ('tej', 'komnacie'): 1,\n", + " ('komnacie', 'mieszkanie'): 1,\n", + " ('mieszkanie', 'kobiéce'): 1,\n", + " ('kobiéce', 'któż'): 1,\n", + " ('któż', 'by'): 3,\n", + " ('by', 'tu'): 1,\n", + " ('tu', 'mieszkał'): 1,\n", + " ('mieszkał', 'stary'): 1,\n", + " ('stary', 'stryj'): 1,\n", + " ('stryj', 'nie'): 1,\n", + " ('nie', 'był'): 10,\n", + " ('był', 'żonaty'): 1,\n", + " ('żonaty', 'a'): 1,\n", + " ('a', 'ciotka'): 1,\n", + " ('ciotka', 'w'): 1,\n", + " ('w', 'petersburgu'): 1,\n", + " ('petersburgu', 'mieszkała'): 1,\n", + " ('mieszkała', 'przed'): 1,\n", + " ('laty', 'to'): 1,\n", + " ('to', 'nie'): 13,\n", + " ('był', 'ochmistrzyni'): 1,\n", + " ('ochmistrzyni', 'pokój'): 1,\n", + " ('pokój', 'fortepiano'): 1,\n", + " ('fortepiano', 'na'): 1,\n", + " ('nim', 'nuty'): 1,\n", + " ('nuty', 'i'): 1,\n", + " ('i', 'książki'): 1,\n", + " ('książki', 'wszystko'): 1,\n", + " ('wszystko', 'porzucano'): 1,\n", + " ('porzucano', 'niedbale'): 1,\n", + " ('niedbale', 'i'): 1,\n", + " ('i', 'bezładnie'): 1,\n", + " ('bezładnie', 'nieporządek'): 1,\n", + " ('nieporządek', 'miły'): 1,\n", + " ('miły', 'niestare'): 1,\n", + " ('niestare', 'były'): 1,\n", + " ('były', 'rączki'): 1,\n", + " ('rączki', 'co'): 1,\n", + " ('co', 'je'): 2,\n", + " ('je', 'tak'): 1,\n", + " ('tak', 'rzuciły'): 1,\n", + " ('rzuciły', 'tuż'): 1,\n", + " ('tuż', 'i'): 2,\n", + " ('i', 'sukienka'): 1,\n", + " ('sukienka', 'biała'): 1,\n", + " ('biała', 'świeżo'): 1,\n", + " ('świeżo', 'z'): 1,\n", + " ('z', 'kołka'): 2,\n", + " ('kołka', 'zdjęta'): 1,\n", + " ('zdjęta', 'do'): 1,\n", + " ('do', 'ubrania'): 2,\n", + " ('ubrania', 'na'): 1,\n", + " ('na', 'krzesła'): 1,\n", + " ('krzesła', 'poręczu'): 1,\n", + " ('poręczu', 'rozpięta'): 1,\n", + " ('rozpięta', 'a'): 1,\n", + " ('a', 'na'): 15,\n", + " ('na', 'oknach'): 1,\n", + " ('oknach', 'donice'): 1,\n", + " ('donice', 'z'): 1,\n", + " ('z', 'pachnącymi'): 1,\n", + " ('pachnącymi', 'ziołki'): 1,\n", + " ('ziołki', 'geranium'): 1,\n", + " ('geranium', 'lewkonija'): 1,\n", + " ('lewkonija', 'astry'): 1,\n", + " ('astry', 'i'): 1,\n", + " ('i', 'fijołki'): 1,\n", + " ('fijołki', 'podróżny'): 1,\n", + " ('podróżny', 'stanął'): 1,\n", + " ('stanął', 'w'): 3,\n", + " ('w', 'jednym'): 2,\n", + " ('jednym', 'z'): 1,\n", + " ('z', 'okien'): 1,\n", + " ('okien', 'nowe'): 1,\n", + " ('nowe', 'dziwo'): 1,\n", + " ('dziwo', 'w'): 1,\n", + " ('w', 'sadzie'): 2,\n", + " ('sadzie', 'na'): 1,\n", + " ('na', 'brzegu'): 1,\n", + " ('brzegu', 'niegdyś'): 1,\n", + " ('niegdyś', 'zarosłym'): 1,\n", + " ('zarosłym', 'pokrzywą'): 1,\n", + " ('pokrzywą', 'był'): 1,\n", + " ('był', 'maleńki'): 1,\n", + " ('maleńki', 'ogródek'): 1,\n", + " ('ogródek', 'ścieżkami'): 1,\n", + " ('ścieżkami', 'porznięty'): 1,\n", + " ('porznięty', 'pełen'): 1,\n", + " ('pełen', 'bukietów'): 1,\n", + " ('bukietów', 'trawy'): 1,\n", + " ('trawy', 'angielskiej'): 1,\n", + " ('angielskiej', 'i'): 1,\n", + " ('i', 'mięty'): 1,\n", + " ('mięty', 'drewniany'): 1,\n", + " ('drewniany', 'drobny'): 1,\n", + " ('drobny', 'w'): 1,\n", + " ('w', 'cyfrę'): 1,\n", + " ('cyfrę', 'powiązany'): 1,\n", + " ('powiązany', 'płotek'): 1,\n", + " ('płotek', 'połyskał'): 1,\n", + " ('połyskał', 'się'): 2,\n", + " ('się', 'wstążkami'): 1,\n", + " ('wstążkami', 'jaskrawych'): 1,\n", + " ('jaskrawych', 'stokrotek'): 1,\n", + " ('stokrotek', 'grządki'): 1,\n", + " ('grządki', 'widać'): 1,\n", + " ('że', 'były'): 1,\n", + " ('były', 'świeżo'): 1,\n", + " ('świeżo', 'polewane'): 1,\n", + " ('polewane', 'tuż'): 1,\n", + " ('tuż', 'stało'): 1,\n", + " ('stało', 'wody'): 1,\n", + " ('wody', 'pełne'): 1,\n", + " ('pełne', 'naczynie'): 1,\n", + " ('naczynie', 'blaszane'): 1,\n", + " ('blaszane', 'ale'): 1,\n", + " ('ale', 'nigdzie'): 1,\n", + " ('nigdzie', 'nie'): 1,\n", + " ('nie', 'widać'): 3,\n", + " ('widać', 'było'): 6,\n", + " ('było', 'ogrodniczki'): 1,\n", + " ('ogrodniczki', 'tylko'): 1,\n", + " ('tylko', 'co'): 2,\n", + " ('co', 'wyszła'): 1,\n", + " ('wyszła', 'jeszcze'): 1,\n", + " ('jeszcze', 'kołyszą'): 1,\n", + " ('kołyszą', 'się'): 1,\n", + " ('się', 'drzwiczki'): 1,\n", + " ('drzwiczki', 'świeżo'): 1,\n", + " ('świeżo', 'trącone'): 1,\n", + " ('trącone', 'blisko'): 1,\n", + " ('blisko', 'drzwi'): 1,\n", + " ('drzwi', 'ślad'): 1,\n", + " ('ślad', 'widać'): 1,\n", + " ('widać', 'nóżki'): 1,\n", + " ('nóżki', 'na'): 1,\n", + " ('na', 'piasku'): 2,\n", + " ('piasku', 'bez'): 1,\n", + " ('bez', 'trzewika'): 1,\n", + " ('trzewika', 'była'): 1,\n", + " ('była', 'i'): 2,\n", + " ('i', 'pończoszki'): 1,\n", + " ('pończoszki', 'na'): 1,\n", + " ('piasku', 'drobnym'): 1,\n", + " ('drobnym', 'suchym'): 1,\n", + " ('suchym', 'białym'): 1,\n", + " ('białym', 'na'): 1,\n", + " ('kształt', 'śniegu'): 1,\n", + " ('śniegu', 'ślad'): 1,\n", + " ('ślad', 'wyraźny'): 1,\n", + " ('wyraźny', 'lecz'): 1,\n", + " ('lecz', 'lekki'): 1,\n", + " ('lekki', 'odgadniesz'): 1,\n", + " ('odgadniesz', 'że'): 1,\n", + " ('w', 'biegu'): 6,\n", + " ('biegu', 'chybkim'): 1,\n", + " ('chybkim', 'był'): 1,\n", + " ('był', 'zostawiony'): 1,\n", + " ('zostawiony', 'nóżkami'): 1,\n", + " ('nóżkami', 'drobnemi'): 1,\n", + " ('drobnemi', 'od'): 1,\n", + " ('od', 'kogoś'): 1,\n", + " ('kogoś', 'co'): 1,\n", + " ('co', 'zaledwie'): 1,\n", + " ('zaledwie', 'dotykał'): 1,\n", + " ('dotykał', 'się'): 1,\n", + " ('się', 'ziemi'): 1,\n", + " ('ziemi', 'podróżny'): 1,\n", + " ('podróżny', 'długo'): 1,\n", + " ('długo', 'w'): 4,\n", + " ('w', 'oknie'): 1,\n", + " ('oknie', 'stał'): 1,\n", + " ('stał', 'patrząc'): 1,\n", + " ('patrząc', 'dumając'): 1,\n", + " ('dumając', 'wonnymi'): 1,\n", + " ('wonnymi', 'powiewami'): 1,\n", + " ('powiewami', 'kwiatów'): 1,\n", + " ('kwiatów', 'oddychając'): 1,\n", + " ('oddychając', 'oblicze'): 1,\n", + " ('oblicze', 'aż'): 1,\n", + " ('aż', 'na'): 4,\n", + " ('na', 'krzaki'): 1,\n", + " ('krzaki', 'fijołkowe'): 1,\n", + " ('fijołkowe', 'skłonił'): 1,\n", + " ('skłonił', 'oczyma'): 1,\n", + " ('oczyma', 'ciekawymi'): 1,\n", + " ('ciekawymi', 'po'): 1,\n", + " ('po', 'drożynach'): 1,\n", + " ('drożynach', 'gonił'): 1,\n", + " ('gonił', 'i'): 2,\n", + " ('i', 'znowu'): 10,\n", + " ('znowu', 'je'): 1,\n", + " ('je', 'na'): 2,\n", + " ('na', 'drobnych'): 1,\n", + " ('drobnych', 'śladach'): 1,\n", + " ('śladach', 'zatrzymywał'): 1,\n", + " ('zatrzymywał', 'myślał'): 1,\n", + " ('myślał', 'o'): 1,\n", + " ('o', 'nich'): 2,\n", + " ('nich', 'i'): 1,\n", + " ('i', 'czyje'): 1,\n", + " ('czyje', 'były'): 1,\n", + " ('były', 'odgadywał'): 1,\n", + " ('odgadywał', 'przypadkiem'): 1,\n", + " ('przypadkiem', 'oczy'): 1,\n", + " ('oczy', 'podniósł'): 2,\n", + " ('podniósł', 'i'): 2,\n", + " ('i', 'tuż'): 1,\n", + " ('tuż', 'na'): 1,\n", + " ('na', 'parkanie'): 3,\n", + " ('parkanie', 'stała'): 1,\n", + " ('stała', 'młoda'): 1,\n", + " ('młoda', 'dziewczyna'): 1,\n", + " ('dziewczyna', 'białe'): 1,\n", + " ('białe', 'jej'): 1,\n", + " ('jej', 'ubranie'): 1,\n", + " ('ubranie', 'wysmukłą'): 1,\n", + " ('wysmukłą', 'postać'): 1,\n", + " ('postać', 'tylko'): 1,\n", + " ('tylko', 'aż'): 1,\n", + " ('aż', 'do'): 10,\n", + " ('do', 'piersi'): 2,\n", + " ('piersi', 'kryje'): 1,\n", + " ('kryje', 'odsłaniając'): 1,\n", + " ('odsłaniając', 'ramiona'): 1,\n", + " ('ramiona', 'i'): 2,\n", + " ('i', 'łabędzią'): 1,\n", + " ('łabędzią', 'szyję'): 1,\n", + " ('szyję', 'w'): 1,\n", + " ('w', 'takim'): 4,\n", + " ('takim', 'litwinka'): 1,\n", + " ('litwinka', 'tylko'): 1,\n", + " ('tylko', 'chodzić'): 1,\n", + " ('chodzić', 'zwykła'): 1,\n", + " ('zwykła', 'z'): 1,\n", + " ('z', 'rana'): 7,\n", + " ('rana', 'w'): 1,\n", + " ('takim', 'nigdy'): 1,\n", + " ('nigdy', 'nie'): 13,\n", + " ('nie', 'bywa'): 1,\n", + " ('bywa', 'od'): 1,\n", + " ('od', 'mężczyzn'): 1,\n", + " ('mężczyzn', 'widziana'): 1,\n", + " ('widziana', 'więc'): 1,\n", + " ('więc', 'choć'): 1,\n", + " ('choć', 'świadka'): 1,\n", + " ('świadka', 'nie'): 1,\n", + " ('nie', 'miała'): 3,\n", + " ('miała', 'założyła'): 1,\n", + " ('założyła', 'ręce'): 1,\n", + " ('ręce', 'na'): 2,\n", + " ('na', 'piersiach'): 3,\n", + " ('piersiach', 'przydawając'): 1,\n", + " ('przydawając', 'zasłony'): 1,\n", + " ('zasłony', 'sukience'): 1,\n", + " ('sukience', 'włos'): 1,\n", + " ('włos', 'w'): 1,\n", + " ('w', 'pukle'): 2,\n", + " ('pukle', 'nierozwity'): 1,\n", + " ('nierozwity', 'lecz'): 1,\n", + " ('lecz', 'w'): 6,\n", + " ('w', 'węzełki'): 1,\n", + " ('węzełki', 'małe'): 1,\n", + " ('małe', 'pokręcony'): 1,\n", + " ('pokręcony', 'schowany'): 1,\n", + " ('schowany', 'w'): 1,\n", + " ('w', 'drobne'): 2,\n", + " ('drobne', 'strączki'): 1,\n", + " ('strączki', 'białe'): 1,\n", + " ('białe', 'dziwnie'): 1,\n", + " ('dziwnie', 'ozdabiał'): 1,\n", + " ('ozdabiał', 'głowę'): 1,\n", + " ('głowę', 'bo'): 1,\n", + " ('bo', 'od'): 3,\n", + " ('od', 'słońca'): 5,\n", + " ('słońca', 'blasku'): 2,\n", + " ('blasku', 'świecił'): 1,\n", + " ('świecił', 'się'): 2,\n", + " ('się', 'jak'): 17,\n", + " ('jak', 'korona'): 2,\n", + " ('korona', 'na'): 2,\n", + " ('na', 'świętych'): 2,\n", + " ('świętych', 'obrazku'): 2,\n", + " ('obrazku', 'twarzy'): 1,\n", + " ('twarzy', 'nie'): 3,\n", + " ('nie', 'było'): 13,\n", + " ('było', 'widać'): 2,\n", + " ('widać', 'zwrócona'): 1,\n", + " ('zwrócona', 'na'): 1,\n", + " ('na', 'pole'): 6,\n", + " ('pole', 'szukała'): 1,\n", + " ('szukała', 'kogoś'): 1,\n", + " ('kogoś', 'okiem'): 1,\n", + " ('okiem', 'daleko'): 1,\n", + " ('daleko', 'na'): 3,\n", + " ('na', 'dole'): 3,\n", + " ('dole', 'ujrzała'): 1,\n", + " ('ujrzała', 'zaśmiała'): 1,\n", + " ('zaśmiała', 'się'): 2,\n", + " ('się', 'i'): 46,\n", + " ('i', 'klasnęła'): 2,\n", + " ('klasnęła', 'w'): 2,\n", + " ('w', 'dłonie'): 2,\n", + " ('dłonie', 'jak'): 1,\n", + " ('jak', 'biały'): 1,\n", + " ('biały', 'ptak'): 1,\n", + " ('ptak', 'zleciała'): 1,\n", + " ('zleciała', 'z'): 1,\n", + " ('z', 'parkanu'): 1,\n", + " ('parkanu', 'na'): 1,\n", + " ('na', 'błonie'): 2,\n", + " ('błonie', 'i'): 1,\n", + " ('i', 'wionęła'): 1,\n", + " ('wionęła', 'ogrodem'): 1,\n", + " ('ogrodem', 'przez'): 1,\n", + " ('przez', 'płotki'): 1,\n", + " ('płotki', 'przez'): 1,\n", + " ('przez', 'kwiaty'): 1,\n", + " ('kwiaty', 'i'): 2,\n", + " ('i', 'po'): 16,\n", + " ('po', 'desce'): 1,\n", + " ('desce', 'opartej'): 1,\n", + " ('opartej', 'o'): 1,\n", + " ('o', 'ścianę'): 2,\n", + " ('ścianę', 'komnaty'): 1,\n", + " ('komnaty', 'nim'): 1,\n", + " ('nim', 'spostrzegł'): 1,\n", + " ('spostrzegł', 'się'): 1,\n", + " ('się', 'wleciała'): 1,\n", + " ('wleciała', 'przez'): 1,\n", + " ('przez', 'okno'): 5,\n", + " ('okno', 'świecąca'): 1,\n", + " ('świecąca', 'nagła'): 1,\n", + " ('nagła', 'cicha'): 1,\n", + " ('cicha', 'i'): 2,\n", + " ('i', 'lekka'): 1,\n", + " ('lekka', 'jak'): 1,\n", + " ('jak', 'światłość'): 1,\n", + " ('światłość', 'miesiąca'): 1,\n", + " ('miesiąca', 'nucąc'): 1,\n", + " ('nucąc', 'chwyciła'): 1,\n", + " ('chwyciła', 'suknie'): 1,\n", + " ('suknie', 'biegła'): 1,\n", + " ('biegła', 'do'): 1,\n", + " ('do', 'zwierciadła'): 1,\n", + " ('zwierciadła', 'wtem'): 1,\n", + " ('wtem', 'ujrzała'): 1,\n", + " ('ujrzała', 'młodzieńca'): 1,\n", + " ('młodzieńca', 'i'): 1,\n", + " ('z', 'rąk'): 8,\n", + " ('rąk', 'jej'): 1,\n", + " ('jej', 'wypadła'): 1,\n", + " ('wypadła', 'suknia'): 1,\n", + " ('suknia', 'a'): 1,\n", + " ('a', 'twarz'): 1,\n", + " ('twarz', 'od'): 1,\n", + " ('od', 'strachu'): 1,\n", + " ('strachu', 'i'): 1,\n", + " ('i', 'dziwu'): 1,\n", + " ('dziwu', 'pobladła'): 1,\n", + " ('pobladła', 'twarz'): 1,\n", + " ('twarz', 'podróżnego'): 1,\n", + " ('podróżnego', 'barwą'): 1,\n", + " ('barwą', 'spłonęła'): 1,\n", + " ('spłonęła', 'rumianą'): 1,\n", + " ('rumianą', 'jak'): 1,\n", + " ('jak', 'obłok'): 1,\n", + " ('obłok', 'gdy'): 1,\n", + " ('gdy', 'z'): 5,\n", + " ('z', 'jutrzenką'): 1,\n", + " ('jutrzenką', 'napotka'): 1,\n", + " ('napotka', 'się'): 1,\n", + " ('się', 'raną'): 1,\n", + " ('raną', 'skromny'): 1,\n", + " ('skromny', 'młodzieniec'): 1,\n", + " ('młodzieniec', 'oczy'): 1,\n", + " ('oczy', 'zmrużył'): 2,\n", + " ('zmrużył', 'i'): 1,\n", + " ('i', 'przysłonił'): 1,\n", + " ('przysłonił', 'chciał'): 1,\n", + " ('chciał', 'coś'): 2,\n", + " ('coś', 'mówić'): 2,\n", + " ('mówić', 'przepraszać'): 1,\n", + " ('przepraszać', 'tylko'): 1,\n", + " ('się', 'ukłonił'): 1,\n", + " ('ukłonił', 'i'): 1,\n", + " ('i', 'cofnął'): 1,\n", + " ('się', 'dziewica'): 1,\n", + " ('dziewica', 'krzyknęła'): 1,\n", + " ('krzyknęła', 'boleśnie'): 1,\n", + " ('boleśnie', 'niewyraźnie'): 1,\n", + " ('niewyraźnie', 'jak'): 1,\n", + " ('jak', 'dziecko'): 2,\n", + " ('dziecko', 'przestraszone'): 1,\n", + " ('przestraszone', 'we'): 1,\n", + " ('we', 'śnie'): 2,\n", + " ('śnie', 'podróżny'): 1,\n", + " ('podróżny', 'zląkł'): 1,\n", + " ('zląkł', 'się'): 3,\n", + " ('się', 'spojrzał'): 1,\n", + " ('spojrzał', 'lecz'): 1,\n", + " ('lecz', 'już'): 1,\n", + " ('już', 'jej'): 1,\n", + " ('jej', 'nie'): 4,\n", + " ('było', 'wyszedł'): 1,\n", + " ('wyszedł', 'zmieszany'): 1,\n", + " ('zmieszany', 'i'): 1,\n", + " ('i', 'czuł'): 3,\n", + " ('czuł', 'że'): 7,\n", + " ('że', 'mu'): 5,\n", + " ('mu', 'serce'): 1,\n", + " ('serce', 'biło'): 1,\n", + " ('biło', 'głośno'): 1,\n", + " ('głośno', 'i'): 1,\n", + " ('i', 'sam'): 5,\n", + " ('sam', 'nie'): 9,\n", + " ('nie', 'wiedział'): 8,\n", + " ('wiedział', 'czy'): 2,\n", + " ('czy', 'go'): 1,\n", + " ('go', 'miało'): 1,\n", + " ('miało', 'śmieszyć'): 1,\n", + " ('śmieszyć', 'to'): 1,\n", + " ('to', 'dziwaczne'): 1,\n", + " ('dziwaczne', 'spotkanie'): 1,\n", + " ('spotkanie', 'czy'): 1,\n", + " ('czy', 'wstydzić'): 1,\n", + " ('wstydzić', 'czy'): 1,\n", + " ('czy', 'cieszyć'): 1,\n", + " ('cieszyć', 'tymczasem'): 1,\n", + " ('tymczasem', 'na'): 2,\n", + " ('na', 'folwarku'): 1,\n", + " ('nie', 'uszło'): 1,\n", + " ('uszło', 'baczności'): 1,\n", + " ('baczności', 'że'): 1,\n", + " ('że', 'przed'): 1,\n", + " ('ganek', 'zajechał'): 1,\n", + " ('zajechał', 'któryś'): 1,\n", + " ('któryś', 'z'): 1,\n", + " ('z', 'nowych'): 1,\n", + " ('nowych', 'gości'): 1,\n", + " ('gości', 'już'): 1,\n", + " ('już', 'konie'): 1,\n", + " ('konie', 'w'): 1,\n", + " ('w', 'stajnią'): 1,\n", + " ('stajnią', 'wzięto'): 1,\n", + " ('wzięto', 'już'): 1,\n", + " ...})" + ] + }, + "execution_count": 24, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "cnt_2_grams" + ] + }, + { + "cell_type": "code", + "execution_count": 25, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "[(('się', 'w'), 67),\n", + " (('się', 'z'), 56),\n", + " (('i', 'z'), 54),\n", + " (('się', 'i'), 46),\n", + " (('i', 'w'), 44),\n", + " (('się', 'na'), 43),\n", + " (('i', 'na'), 31),\n", + " (('i', 'tak'), 30),\n", + " (('co', 'się'), 29),\n", + " (('za', 'nim'), 25)]" + ] + }, + "execution_count": 25, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "cnt_2_grams.most_common(10)" + ] + }, + { + "cell_type": "code", + "execution_count": 26, + "metadata": {}, + "outputs": [], + "source": [ + "def bigram_most_probable(word1):\n", + " word1_count = Counter({bigram:number for bigram,number in cnt_2_grams.items() if bigram[0] == word1})\n", + " total = sum(word1_count.values())\n", + " word1_most_common = dict(word1_count.most_common(10))\n", + " for k in word1_most_common.keys():\n", + " word1_most_common[k] /= total\n", + " return word1_most_common" + ] + }, + { + "cell_type": "code", + "execution_count": 27, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "{('pan', 'sędzia'): 0.1,\n", + " ('pan', 'hrabia'): 0.07333333333333333,\n", + " ('pan', 'rejent'): 0.06,\n", + " ('pan', 'tadeusz'): 0.05333333333333334,\n", + " ('pan', 'wojski'): 0.04666666666666667,\n", + " ('pan', 'bóg'): 0.04,\n", + " ('pan', 'nie'): 0.04,\n", + " ('pan', 'podkomorzy'): 0.02666666666666667,\n", + " ('pan', 'z'): 0.02,\n", + " ('pan', 'mój'): 0.02}" + ] + }, + "execution_count": 27, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "bigram_most_probable('pan')" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "### zad3" + ] + }, + { + "cell_type": "code", + "execution_count": 28, + "metadata": {}, + "outputs": [], + "source": [ + "ngrams_3 = list(ngrams(corpora_train_tokenized, 3))\n", + "cnt_3_grams = Counter(ngrams_3)" + ] + }, + { + "cell_type": "code", + "execution_count": 29, + "metadata": {}, + "outputs": [], + "source": [ + "word1 = 'pan'\n", + "word2 = 'sędzia'" + ] + }, + { + "cell_type": "code", + "execution_count": 30, + "metadata": {}, + "outputs": [], + "source": [ + "count = Counter({trigram:number for trigram,number in cnt.items() if trigram[0] == word1 and trigram[1] == word2})\n", + "total = sum(count.values())\n", + "most_common = dict(count.most_common(10))" + ] + }, + { + "cell_type": "code", + "execution_count": 31, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "[(('się', 'z', 'nim'), 7),\n", + " (('hejże', 'na', 'soplicę'), 6),\n", + " (('za', 'mych', 'czasów'), 5),\n", + " (('ostatniego', 'z', 'horeszków'), 5),\n", + " (('z', 'drugiej', 'strony'), 5),\n", + " (('raz', 'po', 'raz'), 5),\n", + " (('w', 'domu', 'sędziego'), 4),\n", + " (('z', 'wieku', 'mu'), 4),\n", + " (('wieku', 'mu', 'i'), 4),\n", + " (('mu', 'i', 'z'), 4)]" + ] + }, + "execution_count": 31, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "cnt_3_grams.most_common(10)" + ] + }, + { + "cell_type": "code", + "execution_count": 32, + "metadata": {}, + "outputs": [], + "source": [ + "def trigram_most_probable(word1, word2):\n", + " count = Counter({trigram:number for trigram,number in cnt_3_grams.items() if trigram[0] == word1 and trigram[1] == word2})\n", + " total = sum(count.values())\n", + " most_common = dict(count.most_common(10))\n", + " for k in most_common.keys():\n", + " most_common[k] /= total\n", + " return most_common" + ] + }, + { + "cell_type": "code", + "execution_count": 33, + "metadata": { + "scrolled": true + }, + "outputs": [ + { + "data": { + "text/plain": [ + "{('pan', 'sędzia', 'każe'): 0.06666666666666667,\n", + " ('pan', 'sędzia', 'a'): 0.06666666666666667,\n", + " ('pan', 'sędzia', 'nagłym'): 0.06666666666666667,\n", + " ('pan', 'sędzia', 'go'): 0.06666666666666667,\n", + " ('pan', 'sędzia', 'on'): 0.06666666666666667,\n", + " ('pan', 'sędzia', 'siedział'): 0.06666666666666667,\n", + " ('pan', 'sędzia', 'choć'): 0.06666666666666667,\n", + " ('pan', 'sędzia', 'kroczy'): 0.06666666666666667,\n", + " ('pan', 'sędzia', 'żeby'): 0.06666666666666667,\n", + " ('pan', 'sędzia', 'nawet'): 0.06666666666666667}" + ] + }, + "execution_count": 33, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "trigram_most_probable('pan', 'sędzia')" + ] + }, + { + "cell_type": "code", + "execution_count": 34, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "Counter({('pan', 'sędzia', 'każe'): 1,\n", + " ('pan', 'sędzia', 'a'): 1,\n", + " ('pan', 'sędzia', 'nagłym'): 1,\n", + " ('pan', 'sędzia', 'go'): 1,\n", + " ('pan', 'sędzia', 'on'): 1,\n", + " ('pan', 'sędzia', 'siedział'): 1,\n", + " ('pan', 'sędzia', 'choć'): 1,\n", + " ('pan', 'sędzia', 'kroczy'): 1,\n", + " ('pan', 'sędzia', 'żeby'): 1,\n", + " ('pan', 'sędzia', 'nawet'): 1,\n", + " ('pan', 'sędzia', 'ciemiężyciel'): 1,\n", + " ('pan', 'sędzia', 'to'): 1,\n", + " ('pan', 'sędzia', 'majorowi'): 1,\n", + " ('pan', 'sędzia', 'zapytał'): 1,\n", + " ('pan', 'sędzia', 'powinność'): 1})" + ] + }, + "execution_count": 34, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "Counter({trigram:number for trigram,number in cnt_3_grams.items() if trigram[0] == 'pan' and trigram[1] == 'sędzia'})\n" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "### zad5" + ] + }, + { + "cell_type": "code", + "execution_count": 35, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "[(('i',), 1768),\n", + " (('w',), 1426),\n", + " (('się',), 1275),\n", + " (('z',), 1176),\n", + " (('na',), 1083),\n", + " (('nie',), 801),\n", + " (('jak',), 500),\n", + " (('do',), 480),\n", + " (('a',), 470),\n", + " (('że',), 456)]" + ] + }, + "execution_count": 35, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "cnt_1_grams.most_common(10)" + ] + }, + { + "cell_type": "code", + "execution_count": 36, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "0.00029813577453920484" + ] + }, + "execution_count": 36, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "cnt_1_grams[('lasu',)] / sum(cnt_1_grams.values())" + ] + }, + { + "cell_type": "code", + "execution_count": 37, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "0.010416666666666666" + ] + }, + "execution_count": 37, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "(cnt_2_grams[('do','lasu',)] / \n", + " sum({bigram:number for bigram,number in cnt.items() if bigram[0] == 'do'}.values())\n", + ")" + ] + }, + { + "cell_type": "code", + "execution_count": 38, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "3.5076027289149233e-06" + ] + }, + "execution_count": 38, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "(cnt_3_grams[('poszła', 'do','lasu',)] / sum(cnt_3_grams.values())\n", + " /\n", + " sum({trigram:number for trigram,number in cnt.items() if trigram[0] == 'do' and trigram[1] == 'lasu'}.values())\n", + ")" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "### zad6" + ] + }, + { + "cell_type": "code", + "execution_count": 39, + "metadata": {}, + "outputs": [], + "source": [ + "tokenized1 = list(tokenize('I z łąk, i z pastwisk razem wracało do dworu',lowercase = True)) " + ] + }, + { + "cell_type": "code", + "execution_count": 40, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "['i', 'z', 'łąk', 'i', 'z', 'pastwisk', 'razem', 'wracało', 'do', 'dworu']" + ] + }, + "execution_count": 40, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "tokenized1" + ] + }, + { + "cell_type": "code", + "execution_count": 41, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "9" + ] + }, + "execution_count": 41, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "cnt_2_grams[('do','dworu')]" + ] + }, + { + "cell_type": "code", + "execution_count": 42, + "metadata": {}, + "outputs": [], + "source": [ + "def get_bigram_prob(tokenized_list):\n", + " prob = cnt_1_grams[(tokenized_list[0],)] / sum(cnt_1_grams.values())\n", + " for i in range(1,len(tokenized_list)):\n", + " word = tokenized_list[i]\n", + " prev_word = tokenized_list[i-1]\n", + " prob *= (cnt_2_grams[(prev_word,word)] / \n", + " sum({bigram:number for bigram,number in cnt.items() if bigram[0] == tokenized_list[i-1]}.values())\n", + " )\n", + " return prob" + ] + }, + { + "cell_type": "code", + "execution_count": 43, + "metadata": { + "scrolled": true + }, + "outputs": [ + { + "data": { + "text/plain": [ + "7.262117948789027e-16" + ] + }, + "execution_count": 43, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "get_bigram_prob(tokenized1)" + ] + }, + { + "cell_type": "code", + "execution_count": 44, + "metadata": {}, + "outputs": [], + "source": [ + "tokenized2 = list(tokenize(\"Tadeusz lewą dłonią dotykając głowy, Pozdrowił swych dowódców przez ukłon wojskowy;\",lowercase = True)) " + ] + }, + { + "cell_type": "code", + "execution_count": 45, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "['tadeusz',\n", + " 'lewą',\n", + " 'dłonią',\n", + " 'dotykając',\n", + " 'głowy',\n", + " 'pozdrowił',\n", + " 'swych',\n", + " 'dowódców',\n", + " 'przez',\n", + " 'ukłon',\n", + " 'wojskowy']" + ] + }, + "execution_count": 45, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "tokenized2" + ] + }, + { + "cell_type": "code", + "execution_count": 46, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "0.0" + ] + }, + "execution_count": 46, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "get_bigram_prob(tokenized2)" + ] + }, + { + "cell_type": "code", + "execution_count": 47, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "16598" + ] + }, + "execution_count": 47, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "len(cnt_1_grams.keys())" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "### zad7 " + ] + }, + { + "cell_type": "code", + "execution_count": 48, + "metadata": {}, + "outputs": [], + "source": [ + "def get_bigram_smoothed_prob(tokenized_list):\n", + " v_total = len(cnt_1_grams.keys())\n", + " prob = cnt_1_grams[(tokenized_list[0],)] / sum(cnt_1_grams.values())\n", + " for i in range(1,len(tokenized_list)):\n", + " word = tokenized_list[i]\n", + " prev_word = tokenized_list[i-1]\n", + " prob *= ( (cnt_2_grams[(prev_word,word)] +1) / \n", + " (v_total + sum({bigram:number for bigram,number in cnt.items() if bigram[0] == tokenized_list[i-1]}.values()))\n", + " )\n", + " return prob" + ] + }, + { + "cell_type": "code", + "execution_count": 49, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "4.332195692048526e-34" + ] + }, + "execution_count": 49, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "get_bigram_smoothed_prob(tokenized1)" + ] + }, + { + "cell_type": "code", + "execution_count": 50, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "1.0767733038442121e-45" + ] + }, + "execution_count": 50, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "get_bigram_smoothed_prob(tokenized2)" + ] + }, + { + "cell_type": "code", + "execution_count": 51, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "32.65078823244363" + ] + }, + "execution_count": 51, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "get_bigram_prob(tokenized1) ** (-1/len(tokenized1))" + ] + }, + { + "cell_type": "code", + "execution_count": 52, + "metadata": {}, + "outputs": [ + { + "ename": "ZeroDivisionError", + "evalue": "0.0 cannot be raised to a negative power", + "output_type": "error", + "traceback": [ + "\u001b[0;31m---------------------------------------------------------------------------\u001b[0m", + "\u001b[0;31mZeroDivisionError\u001b[0m Traceback (most recent call last)", + "\u001b[0;32m\u001b[0m in \u001b[0;36m\u001b[0;34m\u001b[0m\n\u001b[0;32m----> 1\u001b[0;31m \u001b[0mget_bigram_prob\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mtokenized2\u001b[0m\u001b[0;34m)\u001b[0m \u001b[0;34m**\u001b[0m \u001b[0;34m(\u001b[0m\u001b[0;34m-\u001b[0m\u001b[0;36m1\u001b[0m\u001b[0;34m/\u001b[0m\u001b[0mlen\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mtokenized2\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m", + "\u001b[0;31mZeroDivisionError\u001b[0m: 0.0 cannot be raised to a negative power" + ] + } + ], + "source": [ + "get_bigram_prob(tokenized2) ** (-1/len(tokenized2))" + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": {}, + "outputs": [], + "source": [ + "get_bigram_smoothed_prob(tokenized1) ** (-1/len(tokenized1))" + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": {}, + "outputs": [], + "source": [ + "get_bigram_smoothed_prob(tokenized2) ** (-1/len(tokenized2))" + ] + } + ], + "metadata": { + "kernelspec": { + "display_name": "Python 3", + "language": "python", + "name": "python3" + }, + "language_info": { + "codemirror_mode": { + "name": "ipython", + "version": 3 + }, + "file_extension": ".py", + "mimetype": "text/x-python", + "name": "python", + "nbconvert_exporter": "python", + "pygments_lexer": "ipython3", + "version": "3.8.5" + } + }, + "nbformat": 4, + "nbformat_minor": 4 +} diff --git a/Statystyczny model n gramowy.ipynb b/Statystyczny model n gramowy.ipynb new file mode 100644 index 0000000..9753041 --- /dev/null +++ b/Statystyczny model n gramowy.ipynb @@ -0,0 +1,6253 @@ +{ + "cells": [ + { + "cell_type": "code", + "execution_count": 1, + "metadata": { + "scrolled": true + }, + "outputs": [ + { + "name": "stderr", + "output_type": "stream", + "text": [ + "/media/kuba/ssdsam/anaconda3/lib/python3.8/site-packages/gensim/similarities/__init__.py:15: UserWarning: The gensim.similarities.levenshtein submodule is disabled, because the optional Levenshtein package is unavailable. Install Levenhstein (e.g. `pip install python-Levenshtein`) to suppress this warning.\n", + " warnings.warn(msg)\n" + ] + } + ], + "source": [ + "from gensim.utils import tokenize\n", + "from sklearn.datasets import fetch_20newsgroups\n", + "from collections import Counter\n", + "from nltk.util import ngrams \n", + "import numpy as np" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "https://web.stanford.edu/~jurafsky/slp3/3.pdf\n", + "\n", + "https://wolnelektury.pl/media/book/txt/pan-tadeusz.txt\n", + "\n", + "\n", + "Pierwsze 9000 linijek do train, reszta do test" + ] + }, + { + "cell_type": "code", + "execution_count": 2, + "metadata": {}, + "outputs": [], + "source": [ + "corpora_train = open('pan-tadeusz-train.txt').read()" + ] + }, + { + "cell_type": "code", + "execution_count": 3, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "'Adam Mickiewicz\\n\\nPan Tadeusz czyli ostatni zajazd na Litwie\\n\\n\\n\\n\\n\\n\\nKsięga pierwsza\\n\\n\\n\\nGospodarstwo\\n\\nP'" + ] + }, + "execution_count": 3, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "corpora_train[:100]" + ] + }, + { + "cell_type": "code", + "execution_count": 4, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "372474" + ] + }, + "execution_count": 4, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "len(corpora_train)" + ] + }, + { + "cell_type": "code", + "execution_count": 5, + "metadata": {}, + "outputs": [], + "source": [ + "corpora_train_tokenized = list(tokenize(corpora_train,lowercase = True))" + ] + }, + { + "cell_type": "code", + "execution_count": 6, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "57021" + ] + }, + "execution_count": 6, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "len(corpora_train_tokenized)" + ] + }, + { + "cell_type": "code", + "execution_count": 7, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "['adam',\n", + " 'mickiewicz',\n", + " 'pan',\n", + " 'tadeusz',\n", + " 'czyli',\n", + " 'ostatni',\n", + " 'zajazd',\n", + " 'na',\n", + " 'litwie',\n", + " 'księga']" + ] + }, + "execution_count": 7, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "corpora_train_tokenized[:10]" + ] + }, + { + "cell_type": "code", + "execution_count": 8, + "metadata": { + "scrolled": true + }, + "outputs": [], + "source": [ + "train_ngrams = list(ngrams(corpora_train_tokenized, 2))" + ] + }, + { + "cell_type": "code", + "execution_count": 9, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "[('adam', 'mickiewicz'),\n", + " ('mickiewicz', 'pan'),\n", + " ('pan', 'tadeusz'),\n", + " ('tadeusz', 'czyli'),\n", + " ('czyli', 'ostatni'),\n", + " ('ostatni', 'zajazd'),\n", + " ('zajazd', 'na'),\n", + " ('na', 'litwie'),\n", + " ('litwie', 'księga'),\n", + " ('księga', 'pierwsza'),\n", + " ('pierwsza', 'gospodarstwo'),\n", + " ('gospodarstwo', 'powrót'),\n", + " ('powrót', 'panicza'),\n", + " ('panicza', 'spotkanie'),\n", + " ('spotkanie', 'się'),\n", + " ('się', 'pierwsze'),\n", + " ('pierwsze', 'w'),\n", + " ('w', 'pokoiku'),\n", + " ('pokoiku', 'drugie'),\n", + " ('drugie', 'u'),\n", + " ('u', 'stołu'),\n", + " ('stołu', 'ważna'),\n", + " ('ważna', 'sędziego'),\n", + " ('sędziego', 'nauka'),\n", + " ('nauka', 'o'),\n", + " ('o', 'grzeczności'),\n", + " ('grzeczności', 'podkomorzego'),\n", + " ('podkomorzego', 'uwagi'),\n", + " ('uwagi', 'polityczne'),\n", + " ('polityczne', 'nad'),\n", + " ('nad', 'modami'),\n", + " ('modami', 'początek'),\n", + " ('początek', 'sporu'),\n", + " ('sporu', 'o'),\n", + " ('o', 'kusego'),\n", + " ('kusego', 'i'),\n", + " ('i', 'sokoła'),\n", + " ('sokoła', 'żale'),\n", + " ('żale', 'wojskiego'),\n", + " ('wojskiego', 'ostatni'),\n", + " ('ostatni', 'woźny'),\n", + " ('woźny', 'trybunału'),\n", + " ('trybunału', 'rzut'),\n", + " ('rzut', 'oka'),\n", + " ('oka', 'na'),\n", + " ('na', 'ówczesny'),\n", + " ('ówczesny', 'stan'),\n", + " ('stan', 'polityczny'),\n", + " ('polityczny', 'litwy'),\n", + " ('litwy', 'i'),\n", + " ('i', 'europy'),\n", + " ('europy', 'litwo'),\n", + " ('litwo', 'ojczyzno'),\n", + " ('ojczyzno', 'moja'),\n", + " ('moja', 'ty'),\n", + " ('ty', 'jesteś'),\n", + " ('jesteś', 'jak'),\n", + " ('jak', 'zdrowie'),\n", + " ('zdrowie', 'ile'),\n", + " ('ile', 'cię'),\n", + " ('cię', 'trzeba'),\n", + " ('trzeba', 'cenić'),\n", + " ('cenić', 'ten'),\n", + " ('ten', 'tylko'),\n", + " ('tylko', 'się'),\n", + " ('się', 'dowie'),\n", + " ('dowie', 'kto'),\n", + " ('kto', 'cię'),\n", + " ('cię', 'stracił'),\n", + " ('stracił', 'dziś'),\n", + " ('dziś', 'piękność'),\n", + " ('piękność', 'twą'),\n", + " ('twą', 'w'),\n", + " ('w', 'całej'),\n", + " ('całej', 'ozdobie'),\n", + " ('ozdobie', 'widzę'),\n", + " ('widzę', 'i'),\n", + " ('i', 'opisuję'),\n", + " ('opisuję', 'bo'),\n", + " ('bo', 'tęsknię'),\n", + " ('tęsknię', 'po'),\n", + " ('po', 'tobie'),\n", + " ('tobie', 'panno'),\n", + " ('panno', 'święta'),\n", + " ('święta', 'co'),\n", + " ('co', 'jasnej'),\n", + " ('jasnej', 'bronisz'),\n", + " ('bronisz', 'częstochowy'),\n", + " ('częstochowy', 'i'),\n", + " ('i', 'w'),\n", + " ('w', 'ostrej'),\n", + " ('ostrej', 'świecisz'),\n", + " ('świecisz', 'bramie'),\n", + " ('bramie', 'ty'),\n", + " ('ty', 'co'),\n", + " ('co', 'gród'),\n", + " ('gród', 'zamkowy'),\n", + " ('zamkowy', 'nowogródzki'),\n", + " ('nowogródzki', 'ochraniasz'),\n", + " ('ochraniasz', 'z'),\n", + " ('z', 'jego'),\n", + " ('jego', 'wiernym'),\n", + " ('wiernym', 'ludem'),\n", + " ('ludem', 'jak'),\n", + " ('jak', 'mnie'),\n", + " ('mnie', 'dziecko'),\n", + " ('dziecko', 'do'),\n", + " ('do', 'zdrowia'),\n", + " ('zdrowia', 'powróciłaś'),\n", + " ('powróciłaś', 'cudem'),\n", + " ('cudem', 'gdy'),\n", + " ('gdy', 'od'),\n", + " ('od', 'płaczącej'),\n", + " ('płaczącej', 'matki'),\n", + " ('matki', 'pod'),\n", + " ('pod', 'twoją'),\n", + " ('twoją', 'opiekę'),\n", + " ('opiekę', 'ofiarowany'),\n", + " ('ofiarowany', 'martwą'),\n", + " ('martwą', 'podniosłem'),\n", + " ('podniosłem', 'powiekę'),\n", + " ('powiekę', 'i'),\n", + " ('i', 'zaraz'),\n", + " ('zaraz', 'mogłem'),\n", + " ('mogłem', 'pieszo'),\n", + " ('pieszo', 'do'),\n", + " ('do', 'twych'),\n", + " ('twych', 'świątyń'),\n", + " ('świątyń', 'progu'),\n", + " ('progu', 'iść'),\n", + " ('iść', 'za'),\n", + " ('za', 'wrócone'),\n", + " ('wrócone', 'życie'),\n", + " ('życie', 'podziękować'),\n", + " ('podziękować', 'bogu'),\n", + " ('bogu', 'tak'),\n", + " ('tak', 'nas'),\n", + " ('nas', 'powrócisz'),\n", + " ('powrócisz', 'cudem'),\n", + " ('cudem', 'na'),\n", + " ('na', 'ojczyzny'),\n", + " ('ojczyzny', 'łono'),\n", + " ('łono', 'tymczasem'),\n", + " ('tymczasem', 'przenoś'),\n", + " ('przenoś', 'moją'),\n", + " ('moją', 'duszę'),\n", + " ('duszę', 'utęsknioną'),\n", + " ('utęsknioną', 'do'),\n", + " ('do', 'tych'),\n", + " ('tych', 'pagórków'),\n", + " ('pagórków', 'leśnych'),\n", + " ('leśnych', 'do'),\n", + " ('do', 'tych'),\n", + " ('tych', 'łąk'),\n", + " ('łąk', 'zielonych'),\n", + " ('zielonych', 'szeroko'),\n", + " ('szeroko', 'nad'),\n", + " ('nad', 'błękitnym'),\n", + " ('błękitnym', 'niemnem'),\n", + " ('niemnem', 'rozciągnionych'),\n", + " ('rozciągnionych', 'do'),\n", + " ('do', 'tych'),\n", + " ('tych', 'pól'),\n", + " ('pól', 'malowanych'),\n", + " ('malowanych', 'zbożem'),\n", + " ('zbożem', 'rozmaitem'),\n", + " ('rozmaitem', 'wyzłacanych'),\n", + " ('wyzłacanych', 'pszenicą'),\n", + " ('pszenicą', 'posrebrzanych'),\n", + " ('posrebrzanych', 'żytem'),\n", + " ('żytem', 'gdzie'),\n", + " ('gdzie', 'bursztynowy'),\n", + " ('bursztynowy', 'świerzop'),\n", + " ('świerzop', 'gryka'),\n", + " ('gryka', 'jak'),\n", + " ('jak', 'śnieg'),\n", + " ('śnieg', 'biała'),\n", + " ('biała', 'gdzie'),\n", + " ('gdzie', 'panieńskim'),\n", + " ('panieńskim', 'rumieńcem'),\n", + " ('rumieńcem', 'dzięcielina'),\n", + " ('dzięcielina', 'pała'),\n", + " ('pała', 'a'),\n", + " ('a', 'wszystko'),\n", + " ('wszystko', 'przepasane'),\n", + " ('przepasane', 'jakby'),\n", + " ('jakby', 'wstęgą'),\n", + " ('wstęgą', 'miedzą'),\n", + " ('miedzą', 'zieloną'),\n", + " ('zieloną', 'na'),\n", + " ('na', 'niej'),\n", + " ('niej', 'z'),\n", + " ('z', 'rzadka'),\n", + " ('rzadka', 'ciche'),\n", + " ('ciche', 'grusze'),\n", + " ('grusze', 'siedzą'),\n", + " ('siedzą', 'śród'),\n", + " ('śród', 'takich'),\n", + " ('takich', 'pól'),\n", + " ('pól', 'przed'),\n", + " ('przed', 'laty'),\n", + " ('laty', 'nad'),\n", + " ('nad', 'brzegiem'),\n", + " ('brzegiem', 'ruczaju'),\n", + " ('ruczaju', 'na'),\n", + " ('na', 'pagórku'),\n", + " ('pagórku', 'niewielkim'),\n", + " ('niewielkim', 'we'),\n", + " ('we', 'brzozowym'),\n", + " ('brzozowym', 'gaju'),\n", + " ('gaju', 'stał'),\n", + " ('stał', 'dwór'),\n", + " ('dwór', 'szlachecki'),\n", + " ('szlachecki', 'z'),\n", + " ('z', 'drzewa'),\n", + " ('drzewa', 'lecz'),\n", + " ('lecz', 'podmurowany'),\n", + " ('podmurowany', 'świeciły'),\n", + " ('świeciły', 'się'),\n", + " ('się', 'z'),\n", + " ('z', 'daleka'),\n", + " ('daleka', 'pobielane'),\n", + " ('pobielane', 'ściany'),\n", + " ('ściany', 'tym'),\n", + " ('tym', 'bielsze'),\n", + " ('bielsze', 'że'),\n", + " ('że', 'odbite'),\n", + " ('odbite', 'od'),\n", + " ('od', 'ciemnej'),\n", + " ('ciemnej', 'zieleni'),\n", + " ('zieleni', 'topoli'),\n", + " ('topoli', 'co'),\n", + " ('co', 'go'),\n", + " ('go', 'bronią'),\n", + " ('bronią', 'od'),\n", + " ('od', 'wiatrów'),\n", + " ('wiatrów', 'jesieni'),\n", + " ('jesieni', 'dom'),\n", + " ('dom', 'mieszkalny'),\n", + " ('mieszkalny', 'niewielki'),\n", + " ('niewielki', 'lecz'),\n", + " ('lecz', 'zewsząd'),\n", + " ('zewsząd', 'chędogi'),\n", + " ('chędogi', 'i'),\n", + " ('i', 'stodołę'),\n", + " ('stodołę', 'miał'),\n", + " ('miał', 'wielką'),\n", + " ('wielką', 'i'),\n", + " ('i', 'przy'),\n", + " ('przy', 'niej'),\n", + " ('niej', 'trzy'),\n", + " ('trzy', 'stogi'),\n", + " ('stogi', 'użątku'),\n", + " ('użątku', 'co'),\n", + " ('co', 'pod'),\n", + " ('pod', 'strzechą'),\n", + " ('strzechą', 'zmieścić'),\n", + " ('zmieścić', 'się'),\n", + " ('się', 'nie'),\n", + " ('nie', 'może'),\n", + " ('może', 'widać'),\n", + " ('widać', 'że'),\n", + " ('że', 'okolica'),\n", + " ('okolica', 'obfita'),\n", + " ('obfita', 'we'),\n", + " ('we', 'zboże'),\n", + " ('zboże', 'i'),\n", + " ('i', 'widać'),\n", + " ('widać', 'z'),\n", + " ('z', 'liczby'),\n", + " ('liczby', 'kopic'),\n", + " ('kopic', 'co'),\n", + " ('co', 'wzdłuż'),\n", + " ('wzdłuż', 'i'),\n", + " ('i', 'wszerz'),\n", + " ('wszerz', 'smugów'),\n", + " ('smugów', 'świecą'),\n", + " ('świecą', 'gęsto'),\n", + " ('gęsto', 'jak'),\n", + " ('jak', 'gwiazdy'),\n", + " ('gwiazdy', 'widać'),\n", + " ('widać', 'z'),\n", + " ('z', 'liczby'),\n", + " ('liczby', 'pługów'),\n", + " ('pługów', 'orzących'),\n", + " ('orzących', 'wcześnie'),\n", + " ('wcześnie', 'łany'),\n", + " ('łany', 'ogromne'),\n", + " ('ogromne', 'ugoru'),\n", + " ('ugoru', 'czarnoziemne'),\n", + " ('czarnoziemne', 'zapewne'),\n", + " ('zapewne', 'należne'),\n", + " ('należne', 'do'),\n", + " ('do', 'dworu'),\n", + " ('dworu', 'uprawne'),\n", + " ('uprawne', 'dobrze'),\n", + " ('dobrze', 'na'),\n", + " ('na', 'kształt'),\n", + " ('kształt', 'ogrodowych'),\n", + " ('ogrodowych', 'grządek'),\n", + " ('grządek', 'że'),\n", + " ('że', 'w'),\n", + " ('w', 'tym'),\n", + " ('tym', 'domu'),\n", + " ('domu', 'dostatek'),\n", + " ('dostatek', 'mieszka'),\n", + " ('mieszka', 'i'),\n", + " ('i', 'porządek'),\n", + " ('porządek', 'brama'),\n", + " ('brama', 'na'),\n", + " ('na', 'wciąż'),\n", + " ('wciąż', 'otwarta'),\n", + " ('otwarta', 'przechodniom'),\n", + " ('przechodniom', 'ogłasza'),\n", + " ('ogłasza', 'że'),\n", + " ('że', 'gościnna'),\n", + " ('gościnna', 'i'),\n", + " ('i', 'wszystkich'),\n", + " ('wszystkich', 'w'),\n", + " ('w', 'gościnę'),\n", + " ('gościnę', 'zaprasza'),\n", + " ('zaprasza', 'właśnie'),\n", + " ('właśnie', 'dwukonną'),\n", + " ('dwukonną', 'bryką'),\n", + " ('bryką', 'wjechał'),\n", + " ('wjechał', 'młody'),\n", + " ('młody', 'panek'),\n", + " ('panek', 'i'),\n", + " ('i', 'obiegłszy'),\n", + " ('obiegłszy', 'dziedziniec'),\n", + " ('dziedziniec', 'zawrócił'),\n", + " ('zawrócił', 'przed'),\n", + " ('przed', 'ganek'),\n", + " ('ganek', 'wysiadł'),\n", + " ('wysiadł', 'z'),\n", + " ('z', 'powozu'),\n", + " ('powozu', 'konie'),\n", + " ('konie', 'porzucone'),\n", + " ('porzucone', 'same'),\n", + " ('same', 'szczypiąc'),\n", + " ('szczypiąc', 'trawę'),\n", + " ('trawę', 'ciągnęły'),\n", + " ('ciągnęły', 'powoli'),\n", + " ('powoli', 'pod'),\n", + " ('pod', 'bramę'),\n", + " ('bramę', 'we'),\n", + " ('we', 'dworze'),\n", + " ('dworze', 'pusto'),\n", + " ('pusto', 'bo'),\n", + " ('bo', 'drzwi'),\n", + " ('drzwi', 'od'),\n", + " ('od', 'ganku'),\n", + " ('ganku', 'zamknięto'),\n", + " ('zamknięto', 'zaszczepkami'),\n", + " ('zaszczepkami', 'i'),\n", + " ('i', 'kołkiem'),\n", + " ('kołkiem', 'zaszczepki'),\n", + " ('zaszczepki', 'przetknięto'),\n", + " ('przetknięto', 'podróżny'),\n", + " ('podróżny', 'do'),\n", + " ('do', 'folwarku'),\n", + " ('folwarku', 'nie'),\n", + " ('nie', 'biegł'),\n", + " ('biegł', 'sług'),\n", + " ('sług', 'zapytać'),\n", + " ('zapytać', 'odemknął'),\n", + " ('odemknął', 'wbiegł'),\n", + " ('wbiegł', 'do'),\n", + " ('do', 'domu'),\n", + " ('domu', 'pragnął'),\n", + " ('pragnął', 'go'),\n", + " ('go', 'powitać'),\n", + " ('powitać', 'dawno'),\n", + " ('dawno', 'domu'),\n", + " ('domu', 'nie'),\n", + " ('nie', 'widział'),\n", + " ('widział', 'bo'),\n", + " ('bo', 'w'),\n", + " ('w', 'dalekim'),\n", + " ('dalekim', 'mieście'),\n", + " ('mieście', 'kończył'),\n", + " ('kończył', 'nauki'),\n", + " ('nauki', 'końca'),\n", + " ('końca', 'doczekał'),\n", + " ('doczekał', 'nareszcie'),\n", + " ('nareszcie', 'wbiega'),\n", + " ('wbiega', 'i'),\n", + " ('i', 'okiem'),\n", + " ('okiem', 'chciwie'),\n", + " ('chciwie', 'ściany'),\n", + " ('ściany', 'starodawne'),\n", + " ('starodawne', 'ogląda'),\n", + " ('ogląda', 'czule'),\n", + " ('czule', 'jako'),\n", + " ('jako', 'swe'),\n", + " ('swe', 'znajome'),\n", + " ('znajome', 'dawne'),\n", + " ('dawne', 'też'),\n", + " ('też', 'same'),\n", + " ('same', 'widzi'),\n", + " ('widzi', 'sprzęty'),\n", + " ('sprzęty', 'też'),\n", + " ('też', 'same'),\n", + " ('same', 'obicia'),\n", + " ('obicia', 'z'),\n", + " ('z', 'którymi'),\n", + " ('którymi', 'się'),\n", + " ('się', 'zabawiać'),\n", + " ('zabawiać', 'lubił'),\n", + " ('lubił', 'od'),\n", + " ('od', 'powicia'),\n", + " ('powicia', 'lecz'),\n", + " ('lecz', 'mniej'),\n", + " ('mniej', 'wielkie'),\n", + " ('wielkie', 'mniej'),\n", + " ('mniej', 'piękne'),\n", + " ('piękne', 'niż'),\n", + " ('niż', 'się'),\n", + " ('się', 'dawniej'),\n", + " ('dawniej', 'zdały'),\n", + " ('zdały', 'i'),\n", + " ('i', 'też'),\n", + " ('też', 'same'),\n", + " ('same', 'portrety'),\n", + " ('portrety', 'na'),\n", + " ('na', 'ścianach'),\n", + " ('ścianach', 'wisiały'),\n", + " ('wisiały', 'tu'),\n", + " ('tu', 'kościuszko'),\n", + " ('kościuszko', 'w'),\n", + " ('w', 'czamarce'),\n", + " ('czamarce', 'krakowskiej'),\n", + " ('krakowskiej', 'z'),\n", + " ('z', 'oczyma'),\n", + " ('oczyma', 'podniesionymi'),\n", + " ('podniesionymi', 'w'),\n", + " ('w', 'niebo'),\n", + " ('niebo', 'miecz'),\n", + " ('miecz', 'oburącz'),\n", + " ('oburącz', 'trzyma'),\n", + " ('trzyma', 'takim'),\n", + " ('takim', 'był'),\n", + " ('był', 'gdy'),\n", + " ('gdy', 'przysięgał'),\n", + " ('przysięgał', 'na'),\n", + " ('na', 'stopniach'),\n", + " ('stopniach', 'ołtarzów'),\n", + " ('ołtarzów', 'że'),\n", + " ('że', 'tym'),\n", + " ('tym', 'mieczem'),\n", + " ('mieczem', 'wypędzi'),\n", + " ('wypędzi', 'z'),\n", + " ('z', 'polski'),\n", + " ('polski', 'trzech'),\n", + " ('trzech', 'mocarzów'),\n", + " ('mocarzów', 'albo'),\n", + " ('albo', 'sam'),\n", + " ('sam', 'na'),\n", + " ('na', 'nim'),\n", + " ('nim', 'padnie'),\n", + " ('padnie', 'dalej'),\n", + " ('dalej', 'w'),\n", + " ('w', 'polskiej'),\n", + " ('polskiej', 'szacie'),\n", + " ('szacie', 'siedzi'),\n", + " ('siedzi', 'rejtan'),\n", + " ('rejtan', 'żałośny'),\n", + " ('żałośny', 'po'),\n", + " ('po', 'wolności'),\n", + " ('wolności', 'stracie'),\n", + " ('stracie', 'w'),\n", + " ('w', 'ręku'),\n", + " ('ręku', 'trzyma'),\n", + " ('trzyma', 'nóż'),\n", + " ('nóż', 'ostrzem'),\n", + " ('ostrzem', 'zwrócony'),\n", + " ('zwrócony', 'do'),\n", + " ('do', 'łona'),\n", + " ('łona', 'a'),\n", + " ('a', 'przed'),\n", + " ('przed', 'nim'),\n", + " ('nim', 'leży'),\n", + " ('leży', 'fedon'),\n", + " ('fedon', 'i'),\n", + " ('i', 'żywot'),\n", + " ('żywot', 'katona'),\n", + " ('katona', 'dalej'),\n", + " ('dalej', 'jasiński'),\n", + " ('jasiński', 'młodzian'),\n", + " ('młodzian', 'piękny'),\n", + " ('piękny', 'i'),\n", + " ('i', 'posępny'),\n", + " ('posępny', 'obok'),\n", + " ('obok', 'korsak'),\n", + " ('korsak', 'towarzysz'),\n", + " ('towarzysz', 'jego'),\n", + " ('jego', 'nieodstępny'),\n", + " ('nieodstępny', 'stoją'),\n", + " ('stoją', 'na'),\n", + " ('na', 'szańcach'),\n", + " ('szańcach', 'pragi'),\n", + " ('pragi', 'na'),\n", + " ('na', 'stosach'),\n", + " ('stosach', 'moskali'),\n", + " ('moskali', 'siekąc'),\n", + " ('siekąc', 'wrogów'),\n", + " ('wrogów', 'a'),\n", + " ('a', 'praga'),\n", + " ('praga', 'już'),\n", + " ('już', 'się'),\n", + " ('się', 'wkoło'),\n", + " ('wkoło', 'pali'),\n", + " ('pali', 'nawet'),\n", + " ('nawet', 'stary'),\n", + " ('stary', 'stojący'),\n", + " ('stojący', 'zegar'),\n", + " ('zegar', 'kurantowy'),\n", + " ('kurantowy', 'w'),\n", + " ('w', 'drewnianej'),\n", + " ('drewnianej', 'szafie'),\n", + " ('szafie', 'poznał'),\n", + " ('poznał', 'u'),\n", + " ('u', 'wniścia'),\n", + " ('wniścia', 'alkowy'),\n", + " ('alkowy', 'i'),\n", + " ('i', 'z'),\n", + " ('z', 'dziecinną'),\n", + " ('dziecinną', 'radością'),\n", + " ('radością', 'pociągnął'),\n", + " ('pociągnął', 'za'),\n", + " ('za', 'sznurek'),\n", + " ('sznurek', 'by'),\n", + " ('by', 'stary'),\n", + " ('stary', 'dąbrowskiego'),\n", + " ('dąbrowskiego', 'usłyszeć'),\n", + " ('usłyszeć', 'mazurek'),\n", + " ('mazurek', 'biegał'),\n", + " ('biegał', 'po'),\n", + " ('po', 'całym'),\n", + " ('całym', 'domu'),\n", + " ('domu', 'i'),\n", + " ('i', 'szukał'),\n", + " ('szukał', 'komnaty'),\n", + " ('komnaty', 'gdzie'),\n", + " ('gdzie', 'mieszkał'),\n", + " ('mieszkał', 'dzieckiem'),\n", + " ('dzieckiem', 'będąc'),\n", + " ('będąc', 'przed'),\n", + " ('przed', 'dziesięciu'),\n", + " ('dziesięciu', 'laty'),\n", + " ('laty', 'wchodzi'),\n", + " ('wchodzi', 'cofnął'),\n", + " ('cofnął', 'się'),\n", + " ('się', 'toczył'),\n", + " ('toczył', 'zdumione'),\n", + " ('zdumione', 'źrenice'),\n", + " ('źrenice', 'po'),\n", + " ('po', 'ścianach'),\n", + " ('ścianach', 'w'),\n", + " ('w', 'tej'),\n", + " ('tej', 'komnacie'),\n", + " ('komnacie', 'mieszkanie'),\n", + " ('mieszkanie', 'kobiéce'),\n", + " ('kobiéce', 'któż'),\n", + " ('któż', 'by'),\n", + " ('by', 'tu'),\n", + " ('tu', 'mieszkał'),\n", + " ('mieszkał', 'stary'),\n", + " ('stary', 'stryj'),\n", + " ('stryj', 'nie'),\n", + " ('nie', 'był'),\n", + " ('był', 'żonaty'),\n", + " ('żonaty', 'a'),\n", + " ('a', 'ciotka'),\n", + " ('ciotka', 'w'),\n", + " ('w', 'petersburgu'),\n", + " ('petersburgu', 'mieszkała'),\n", + " ('mieszkała', 'przed'),\n", + " ('przed', 'laty'),\n", + " ('laty', 'to'),\n", + " ('to', 'nie'),\n", + " ('nie', 'był'),\n", + " ('był', 'ochmistrzyni'),\n", + " ('ochmistrzyni', 'pokój'),\n", + " ('pokój', 'fortepiano'),\n", + " ('fortepiano', 'na'),\n", + " ('na', 'nim'),\n", + " ('nim', 'nuty'),\n", + " ('nuty', 'i'),\n", + " ('i', 'książki'),\n", + " ('książki', 'wszystko'),\n", + " ('wszystko', 'porzucano'),\n", + " ('porzucano', 'niedbale'),\n", + " ('niedbale', 'i'),\n", + " ('i', 'bezładnie'),\n", + " ('bezładnie', 'nieporządek'),\n", + " ('nieporządek', 'miły'),\n", + " ('miły', 'niestare'),\n", + " ('niestare', 'były'),\n", + " ('były', 'rączki'),\n", + " ('rączki', 'co'),\n", + " ('co', 'je'),\n", + " ('je', 'tak'),\n", + " ('tak', 'rzuciły'),\n", + " ('rzuciły', 'tuż'),\n", + " ('tuż', 'i'),\n", + " ('i', 'sukienka'),\n", + " ('sukienka', 'biała'),\n", + " ('biała', 'świeżo'),\n", + " ('świeżo', 'z'),\n", + " ('z', 'kołka'),\n", + " ('kołka', 'zdjęta'),\n", + " ('zdjęta', 'do'),\n", + " ('do', 'ubrania'),\n", + " ('ubrania', 'na'),\n", + " ('na', 'krzesła'),\n", + " ('krzesła', 'poręczu'),\n", + " ('poręczu', 'rozpięta'),\n", + " ('rozpięta', 'a'),\n", + " ('a', 'na'),\n", + " ('na', 'oknach'),\n", + " ('oknach', 'donice'),\n", + " ('donice', 'z'),\n", + " ('z', 'pachnącymi'),\n", + " ('pachnącymi', 'ziołki'),\n", + " ('ziołki', 'geranium'),\n", + " ('geranium', 'lewkonija'),\n", + " ('lewkonija', 'astry'),\n", + " ('astry', 'i'),\n", + " ('i', 'fijołki'),\n", + " ('fijołki', 'podróżny'),\n", + " ('podróżny', 'stanął'),\n", + " ('stanął', 'w'),\n", + " ('w', 'jednym'),\n", + " ('jednym', 'z'),\n", + " ('z', 'okien'),\n", + " ('okien', 'nowe'),\n", + " ('nowe', 'dziwo'),\n", + " ('dziwo', 'w'),\n", + " ('w', 'sadzie'),\n", + " ('sadzie', 'na'),\n", + " ('na', 'brzegu'),\n", + " ('brzegu', 'niegdyś'),\n", + " ('niegdyś', 'zarosłym'),\n", + " ('zarosłym', 'pokrzywą'),\n", + " ('pokrzywą', 'był'),\n", + " ('był', 'maleńki'),\n", + " ('maleńki', 'ogródek'),\n", + " ('ogródek', 'ścieżkami'),\n", + " ('ścieżkami', 'porznięty'),\n", + " ('porznięty', 'pełen'),\n", + " ('pełen', 'bukietów'),\n", + " ('bukietów', 'trawy'),\n", + " ('trawy', 'angielskiej'),\n", + " ('angielskiej', 'i'),\n", + " ('i', 'mięty'),\n", + " ('mięty', 'drewniany'),\n", + " ('drewniany', 'drobny'),\n", + " ('drobny', 'w'),\n", + " ('w', 'cyfrę'),\n", + " ('cyfrę', 'powiązany'),\n", + " ('powiązany', 'płotek'),\n", + " ('płotek', 'połyskał'),\n", + " ('połyskał', 'się'),\n", + " ('się', 'wstążkami'),\n", + " ('wstążkami', 'jaskrawych'),\n", + " ('jaskrawych', 'stokrotek'),\n", + " ('stokrotek', 'grządki'),\n", + " ('grządki', 'widać'),\n", + " ('widać', 'że'),\n", + " ('że', 'były'),\n", + " ('były', 'świeżo'),\n", + " ('świeżo', 'polewane'),\n", + " ('polewane', 'tuż'),\n", + " ('tuż', 'stało'),\n", + " ('stało', 'wody'),\n", + " ('wody', 'pełne'),\n", + " ('pełne', 'naczynie'),\n", + " ('naczynie', 'blaszane'),\n", + " ('blaszane', 'ale'),\n", + " ('ale', 'nigdzie'),\n", + " ('nigdzie', 'nie'),\n", + " ('nie', 'widać'),\n", + " ('widać', 'było'),\n", + " ('było', 'ogrodniczki'),\n", + " ('ogrodniczki', 'tylko'),\n", + " ('tylko', 'co'),\n", + " ('co', 'wyszła'),\n", + " ('wyszła', 'jeszcze'),\n", + " ('jeszcze', 'kołyszą'),\n", + " ('kołyszą', 'się'),\n", + " ('się', 'drzwiczki'),\n", + " ('drzwiczki', 'świeżo'),\n", + " ('świeżo', 'trącone'),\n", + " ('trącone', 'blisko'),\n", + " ('blisko', 'drzwi'),\n", + " ('drzwi', 'ślad'),\n", + " ('ślad', 'widać'),\n", + " ('widać', 'nóżki'),\n", + " ('nóżki', 'na'),\n", + " ('na', 'piasku'),\n", + " ('piasku', 'bez'),\n", + " ('bez', 'trzewika'),\n", + " ('trzewika', 'była'),\n", + " ('była', 'i'),\n", + " ('i', 'pończoszki'),\n", + " ('pończoszki', 'na'),\n", + " ('na', 'piasku'),\n", + " ('piasku', 'drobnym'),\n", + " ('drobnym', 'suchym'),\n", + " ('suchym', 'białym'),\n", + " ('białym', 'na'),\n", + " ('na', 'kształt'),\n", + " ('kształt', 'śniegu'),\n", + " ('śniegu', 'ślad'),\n", + " ('ślad', 'wyraźny'),\n", + " ('wyraźny', 'lecz'),\n", + " ('lecz', 'lekki'),\n", + " ('lekki', 'odgadniesz'),\n", + " ('odgadniesz', 'że'),\n", + " ('że', 'w'),\n", + " ('w', 'biegu'),\n", + " ('biegu', 'chybkim'),\n", + " ('chybkim', 'był'),\n", + " ('był', 'zostawiony'),\n", + " ('zostawiony', 'nóżkami'),\n", + " ('nóżkami', 'drobnemi'),\n", + " ('drobnemi', 'od'),\n", + " ('od', 'kogoś'),\n", + " ('kogoś', 'co'),\n", + " ('co', 'zaledwie'),\n", + " ('zaledwie', 'dotykał'),\n", + " ('dotykał', 'się'),\n", + " ('się', 'ziemi'),\n", + " ('ziemi', 'podróżny'),\n", + " ('podróżny', 'długo'),\n", + " ('długo', 'w'),\n", + " ('w', 'oknie'),\n", + " ('oknie', 'stał'),\n", + " ('stał', 'patrząc'),\n", + " ('patrząc', 'dumając'),\n", + " ('dumając', 'wonnymi'),\n", + " ('wonnymi', 'powiewami'),\n", + " ('powiewami', 'kwiatów'),\n", + " ('kwiatów', 'oddychając'),\n", + " ('oddychając', 'oblicze'),\n", + " ('oblicze', 'aż'),\n", + " ('aż', 'na'),\n", + " ('na', 'krzaki'),\n", + " ('krzaki', 'fijołkowe'),\n", + " ('fijołkowe', 'skłonił'),\n", + " ('skłonił', 'oczyma'),\n", + " ('oczyma', 'ciekawymi'),\n", + " ('ciekawymi', 'po'),\n", + " ('po', 'drożynach'),\n", + " ('drożynach', 'gonił'),\n", + " ('gonił', 'i'),\n", + " ('i', 'znowu'),\n", + " ('znowu', 'je'),\n", + " ('je', 'na'),\n", + " ('na', 'drobnych'),\n", + " ('drobnych', 'śladach'),\n", + " ('śladach', 'zatrzymywał'),\n", + " ('zatrzymywał', 'myślał'),\n", + " ('myślał', 'o'),\n", + " ('o', 'nich'),\n", + " ('nich', 'i'),\n", + " ('i', 'czyje'),\n", + " ('czyje', 'były'),\n", + " ('były', 'odgadywał'),\n", + " ('odgadywał', 'przypadkiem'),\n", + " ('przypadkiem', 'oczy'),\n", + " ('oczy', 'podniósł'),\n", + " ('podniósł', 'i'),\n", + " ('i', 'tuż'),\n", + " ('tuż', 'na'),\n", + " ('na', 'parkanie'),\n", + " ('parkanie', 'stała'),\n", + " ('stała', 'młoda'),\n", + " ('młoda', 'dziewczyna'),\n", + " ('dziewczyna', 'białe'),\n", + " ('białe', 'jej'),\n", + " ('jej', 'ubranie'),\n", + " ('ubranie', 'wysmukłą'),\n", + " ('wysmukłą', 'postać'),\n", + " ('postać', 'tylko'),\n", + " ('tylko', 'aż'),\n", + " ('aż', 'do'),\n", + " ('do', 'piersi'),\n", + " ('piersi', 'kryje'),\n", + " ('kryje', 'odsłaniając'),\n", + " ('odsłaniając', 'ramiona'),\n", + " ('ramiona', 'i'),\n", + " ('i', 'łabędzią'),\n", + " ('łabędzią', 'szyję'),\n", + " ('szyję', 'w'),\n", + " ('w', 'takim'),\n", + " ('takim', 'litwinka'),\n", + " ('litwinka', 'tylko'),\n", + " ('tylko', 'chodzić'),\n", + " ('chodzić', 'zwykła'),\n", + " ('zwykła', 'z'),\n", + " ('z', 'rana'),\n", + " ('rana', 'w'),\n", + " ('w', 'takim'),\n", + " ('takim', 'nigdy'),\n", + " ('nigdy', 'nie'),\n", + " ('nie', 'bywa'),\n", + " ('bywa', 'od'),\n", + " ('od', 'mężczyzn'),\n", + " ('mężczyzn', 'widziana'),\n", + " ('widziana', 'więc'),\n", + " ('więc', 'choć'),\n", + " ('choć', 'świadka'),\n", + " ('świadka', 'nie'),\n", + " ('nie', 'miała'),\n", + " ('miała', 'założyła'),\n", + " ('założyła', 'ręce'),\n", + " ('ręce', 'na'),\n", + " ('na', 'piersiach'),\n", + " ('piersiach', 'przydawając'),\n", + " ('przydawając', 'zasłony'),\n", + " ('zasłony', 'sukience'),\n", + " ('sukience', 'włos'),\n", + " ('włos', 'w'),\n", + " ('w', 'pukle'),\n", + " ('pukle', 'nierozwity'),\n", + " ('nierozwity', 'lecz'),\n", + " ('lecz', 'w'),\n", + " ('w', 'węzełki'),\n", + " ('węzełki', 'małe'),\n", + " ('małe', 'pokręcony'),\n", + " ('pokręcony', 'schowany'),\n", + " ('schowany', 'w'),\n", + " ('w', 'drobne'),\n", + " ('drobne', 'strączki'),\n", + " ('strączki', 'białe'),\n", + " ('białe', 'dziwnie'),\n", + " ('dziwnie', 'ozdabiał'),\n", + " ('ozdabiał', 'głowę'),\n", + " ('głowę', 'bo'),\n", + " ('bo', 'od'),\n", + " ('od', 'słońca'),\n", + " ('słońca', 'blasku'),\n", + " ('blasku', 'świecił'),\n", + " ('świecił', 'się'),\n", + " ('się', 'jak'),\n", + " ('jak', 'korona'),\n", + " ('korona', 'na'),\n", + " ('na', 'świętych'),\n", + " ('świętych', 'obrazku'),\n", + " ('obrazku', 'twarzy'),\n", + " ('twarzy', 'nie'),\n", + " ('nie', 'było'),\n", + " ('było', 'widać'),\n", + " ('widać', 'zwrócona'),\n", + " ('zwrócona', 'na'),\n", + " ('na', 'pole'),\n", + " ('pole', 'szukała'),\n", + " ('szukała', 'kogoś'),\n", + " ('kogoś', 'okiem'),\n", + " ('okiem', 'daleko'),\n", + " ('daleko', 'na'),\n", + " ('na', 'dole'),\n", + " ('dole', 'ujrzała'),\n", + " ('ujrzała', 'zaśmiała'),\n", + " ('zaśmiała', 'się'),\n", + " ('się', 'i'),\n", + " ('i', 'klasnęła'),\n", + " ('klasnęła', 'w'),\n", + " ('w', 'dłonie'),\n", + " ('dłonie', 'jak'),\n", + " ('jak', 'biały'),\n", + " ('biały', 'ptak'),\n", + " ('ptak', 'zleciała'),\n", + " ('zleciała', 'z'),\n", + " ('z', 'parkanu'),\n", + " ('parkanu', 'na'),\n", + " ('na', 'błonie'),\n", + " ('błonie', 'i'),\n", + " ('i', 'wionęła'),\n", + " ('wionęła', 'ogrodem'),\n", + " ('ogrodem', 'przez'),\n", + " ('przez', 'płotki'),\n", + " ('płotki', 'przez'),\n", + " ('przez', 'kwiaty'),\n", + " ('kwiaty', 'i'),\n", + " ('i', 'po'),\n", + " ('po', 'desce'),\n", + " ('desce', 'opartej'),\n", + " ('opartej', 'o'),\n", + " ('o', 'ścianę'),\n", + " ('ścianę', 'komnaty'),\n", + " ('komnaty', 'nim'),\n", + " ('nim', 'spostrzegł'),\n", + " ('spostrzegł', 'się'),\n", + " ('się', 'wleciała'),\n", + " ('wleciała', 'przez'),\n", + " ('przez', 'okno'),\n", + " ('okno', 'świecąca'),\n", + " ('świecąca', 'nagła'),\n", + " ('nagła', 'cicha'),\n", + " ('cicha', 'i'),\n", + " ('i', 'lekka'),\n", + " ('lekka', 'jak'),\n", + " ('jak', 'światłość'),\n", + " ('światłość', 'miesiąca'),\n", + " ('miesiąca', 'nucąc'),\n", + " ('nucąc', 'chwyciła'),\n", + " ('chwyciła', 'suknie'),\n", + " ('suknie', 'biegła'),\n", + " ('biegła', 'do'),\n", + " ('do', 'zwierciadła'),\n", + " ('zwierciadła', 'wtem'),\n", + " ('wtem', 'ujrzała'),\n", + " ('ujrzała', 'młodzieńca'),\n", + " ('młodzieńca', 'i'),\n", + " ('i', 'z'),\n", + " ('z', 'rąk'),\n", + " ('rąk', 'jej'),\n", + " ('jej', 'wypadła'),\n", + " ('wypadła', 'suknia'),\n", + " ('suknia', 'a'),\n", + " ('a', 'twarz'),\n", + " ('twarz', 'od'),\n", + " ('od', 'strachu'),\n", + " ('strachu', 'i'),\n", + " ('i', 'dziwu'),\n", + " ('dziwu', 'pobladła'),\n", + " ('pobladła', 'twarz'),\n", + " ('twarz', 'podróżnego'),\n", + " ('podróżnego', 'barwą'),\n", + " ('barwą', 'spłonęła'),\n", + " ('spłonęła', 'rumianą'),\n", + " ('rumianą', 'jak'),\n", + " ('jak', 'obłok'),\n", + " ('obłok', 'gdy'),\n", + " ('gdy', 'z'),\n", + " ('z', 'jutrzenką'),\n", + " ('jutrzenką', 'napotka'),\n", + " ('napotka', 'się'),\n", + " ('się', 'raną'),\n", + " ('raną', 'skromny'),\n", + " ('skromny', 'młodzieniec'),\n", + " ('młodzieniec', 'oczy'),\n", + " ('oczy', 'zmrużył'),\n", + " ('zmrużył', 'i'),\n", + " ('i', 'przysłonił'),\n", + " ('przysłonił', 'chciał'),\n", + " ('chciał', 'coś'),\n", + " ('coś', 'mówić'),\n", + " ('mówić', 'przepraszać'),\n", + " ('przepraszać', 'tylko'),\n", + " ('tylko', 'się'),\n", + " ('się', 'ukłonił'),\n", + " ('ukłonił', 'i'),\n", + " ('i', 'cofnął'),\n", + " ('cofnął', 'się'),\n", + " ('się', 'dziewica'),\n", + " ('dziewica', 'krzyknęła'),\n", + " ('krzyknęła', 'boleśnie'),\n", + " ('boleśnie', 'niewyraźnie'),\n", + " ('niewyraźnie', 'jak'),\n", + " ('jak', 'dziecko'),\n", + " ('dziecko', 'przestraszone'),\n", + " ('przestraszone', 'we'),\n", + " ('we', 'śnie'),\n", + " ('śnie', 'podróżny'),\n", + " ('podróżny', 'zląkł'),\n", + " ('zląkł', 'się'),\n", + " ('się', 'spojrzał'),\n", + " ('spojrzał', 'lecz'),\n", + " ('lecz', 'już'),\n", + " ('już', 'jej'),\n", + " ('jej', 'nie'),\n", + " ('nie', 'było'),\n", + " ('było', 'wyszedł'),\n", + " ('wyszedł', 'zmieszany'),\n", + " ('zmieszany', 'i'),\n", + " ('i', 'czuł'),\n", + " ('czuł', 'że'),\n", + " ('że', 'mu'),\n", + " ('mu', 'serce'),\n", + " ('serce', 'biło'),\n", + " ('biło', 'głośno'),\n", + " ('głośno', 'i'),\n", + " ('i', 'sam'),\n", + " ('sam', 'nie'),\n", + " ('nie', 'wiedział'),\n", + " ('wiedział', 'czy'),\n", + " ('czy', 'go'),\n", + " ('go', 'miało'),\n", + " ('miało', 'śmieszyć'),\n", + " ('śmieszyć', 'to'),\n", + " ('to', 'dziwaczne'),\n", + " ('dziwaczne', 'spotkanie'),\n", + " ('spotkanie', 'czy'),\n", + " ('czy', 'wstydzić'),\n", + " ('wstydzić', 'czy'),\n", + " ('czy', 'cieszyć'),\n", + " ...]" + ] + }, + "execution_count": 9, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "train_ngrams" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "### pytanie- ile jest ngramów?" + ] + }, + { + "cell_type": "code", + "execution_count": 10, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "57020" + ] + }, + "execution_count": 10, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "len(train_ngrams)" + ] + }, + { + "cell_type": "code", + "execution_count": 11, + "metadata": {}, + "outputs": [], + "source": [ + "cnt = Counter(train_ngrams)" + ] + }, + { + "cell_type": "code", + "execution_count": 12, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "Counter({('adam', 'mickiewicz'): 1,\n", + " ('mickiewicz', 'pan'): 1,\n", + " ('pan', 'tadeusz'): 8,\n", + " ('tadeusz', 'czyli'): 1,\n", + " ('czyli', 'ostatni'): 1,\n", + " ('ostatni', 'zajazd'): 1,\n", + " ('zajazd', 'na'): 1,\n", + " ('na', 'litwie'): 14,\n", + " ('litwie', 'księga'): 2,\n", + " ('księga', 'pierwsza'): 1,\n", + " ('pierwsza', 'gospodarstwo'): 1,\n", + " ('gospodarstwo', 'powrót'): 1,\n", + " ('powrót', 'panicza'): 1,\n", + " ('panicza', 'spotkanie'): 1,\n", + " ('spotkanie', 'się'): 3,\n", + " ('się', 'pierwsze'): 1,\n", + " ('pierwsze', 'w'): 1,\n", + " ('w', 'pokoiku'): 1,\n", + " ('pokoiku', 'drugie'): 1,\n", + " ('drugie', 'u'): 1,\n", + " ('u', 'stołu'): 5,\n", + " ('stołu', 'ważna'): 1,\n", + " ('ważna', 'sędziego'): 1,\n", + " ('sędziego', 'nauka'): 1,\n", + " ('nauka', 'o'): 1,\n", + " ('o', 'grzeczności'): 1,\n", + " ('grzeczności', 'podkomorzego'): 1,\n", + " ('podkomorzego', 'uwagi'): 1,\n", + " ('uwagi', 'polityczne'): 1,\n", + " ('polityczne', 'nad'): 1,\n", + " ('nad', 'modami'): 1,\n", + " ('modami', 'początek'): 1,\n", + " ('początek', 'sporu'): 1,\n", + " ('sporu', 'o'): 1,\n", + " ('o', 'kusego'): 4,\n", + " ('kusego', 'i'): 3,\n", + " ('i', 'sokoła'): 3,\n", + " ('sokoła', 'żale'): 1,\n", + " ('żale', 'wojskiego'): 1,\n", + " ('wojskiego', 'ostatni'): 1,\n", + " ('ostatni', 'woźny'): 1,\n", + " ('woźny', 'trybunału'): 2,\n", + " ('trybunału', 'rzut'): 1,\n", + " ('rzut', 'oka'): 2,\n", + " ('oka', 'na'): 1,\n", + " ('na', 'ówczesny'): 1,\n", + " ('ówczesny', 'stan'): 1,\n", + " ('stan', 'polityczny'): 1,\n", + " ('polityczny', 'litwy'): 1,\n", + " ('litwy', 'i'): 1,\n", + " ('i', 'europy'): 1,\n", + " ('europy', 'litwo'): 1,\n", + " ('litwo', 'ojczyzno'): 1,\n", + " ('ojczyzno', 'moja'): 1,\n", + " ('moja', 'ty'): 1,\n", + " ('ty', 'jesteś'): 3,\n", + " ('jesteś', 'jak'): 1,\n", + " ('jak', 'zdrowie'): 1,\n", + " ('zdrowie', 'ile'): 1,\n", + " ('ile', 'cię'): 1,\n", + " ('cię', 'trzeba'): 1,\n", + " ('trzeba', 'cenić'): 1,\n", + " ('cenić', 'ten'): 1,\n", + " ('ten', 'tylko'): 1,\n", + " ('tylko', 'się'): 5,\n", + " ('się', 'dowie'): 2,\n", + " ('dowie', 'kto'): 1,\n", + " ('kto', 'cię'): 1,\n", + " ('cię', 'stracił'): 1,\n", + " ('stracił', 'dziś'): 1,\n", + " ('dziś', 'piękność'): 1,\n", + " ('piękność', 'twą'): 1,\n", + " ('twą', 'w'): 1,\n", + " ('w', 'całej'): 4,\n", + " ('całej', 'ozdobie'): 1,\n", + " ('ozdobie', 'widzę'): 1,\n", + " ('widzę', 'i'): 1,\n", + " ('i', 'opisuję'): 1,\n", + " ('opisuję', 'bo'): 1,\n", + " ('bo', 'tęsknię'): 1,\n", + " ('tęsknię', 'po'): 1,\n", + " ('po', 'tobie'): 1,\n", + " ('tobie', 'panno'): 1,\n", + " ('panno', 'święta'): 1,\n", + " ('święta', 'co'): 1,\n", + " ('co', 'jasnej'): 1,\n", + " ('jasnej', 'bronisz'): 1,\n", + " ('bronisz', 'częstochowy'): 1,\n", + " ('częstochowy', 'i'): 1,\n", + " ('i', 'w'): 44,\n", + " ('w', 'ostrej'): 1,\n", + " ('ostrej', 'świecisz'): 1,\n", + " ('świecisz', 'bramie'): 1,\n", + " ('bramie', 'ty'): 1,\n", + " ('ty', 'co'): 1,\n", + " ('co', 'gród'): 1,\n", + " ('gród', 'zamkowy'): 1,\n", + " ('zamkowy', 'nowogródzki'): 1,\n", + " ('nowogródzki', 'ochraniasz'): 1,\n", + " ('ochraniasz', 'z'): 1,\n", + " ('z', 'jego'): 3,\n", + " ('jego', 'wiernym'): 1,\n", + " ('wiernym', 'ludem'): 1,\n", + " ('ludem', 'jak'): 1,\n", + " ('jak', 'mnie'): 3,\n", + " ('mnie', 'dziecko'): 1,\n", + " ('dziecko', 'do'): 1,\n", + " ('do', 'zdrowia'): 1,\n", + " ('zdrowia', 'powróciłaś'): 1,\n", + " ('powróciłaś', 'cudem'): 1,\n", + " ('cudem', 'gdy'): 1,\n", + " ('gdy', 'od'): 1,\n", + " ('od', 'płaczącej'): 1,\n", + " ('płaczącej', 'matki'): 1,\n", + " ('matki', 'pod'): 1,\n", + " ('pod', 'twoją'): 1,\n", + " ('twoją', 'opiekę'): 1,\n", + " ('opiekę', 'ofiarowany'): 1,\n", + " ('ofiarowany', 'martwą'): 1,\n", + " ('martwą', 'podniosłem'): 1,\n", + " ('podniosłem', 'powiekę'): 1,\n", + " ('powiekę', 'i'): 1,\n", + " ('i', 'zaraz'): 5,\n", + " ('zaraz', 'mogłem'): 1,\n", + " ('mogłem', 'pieszo'): 1,\n", + " ('pieszo', 'do'): 1,\n", + " ('do', 'twych'): 1,\n", + " ('twych', 'świątyń'): 1,\n", + " ('świątyń', 'progu'): 1,\n", + " ('progu', 'iść'): 1,\n", + " ('iść', 'za'): 1,\n", + " ('za', 'wrócone'): 1,\n", + " ('wrócone', 'życie'): 1,\n", + " ('życie', 'podziękować'): 1,\n", + " ('podziękować', 'bogu'): 1,\n", + " ('bogu', 'tak'): 1,\n", + " ('tak', 'nas'): 2,\n", + " ('nas', 'powrócisz'): 1,\n", + " ('powrócisz', 'cudem'): 1,\n", + " ('cudem', 'na'): 1,\n", + " ('na', 'ojczyzny'): 1,\n", + " ('ojczyzny', 'łono'): 1,\n", + " ('łono', 'tymczasem'): 1,\n", + " ('tymczasem', 'przenoś'): 1,\n", + " ('przenoś', 'moją'): 1,\n", + " ('moją', 'duszę'): 1,\n", + " ('duszę', 'utęsknioną'): 1,\n", + " ('utęsknioną', 'do'): 1,\n", + " ('do', 'tych'): 4,\n", + " ('tych', 'pagórków'): 1,\n", + " ('pagórków', 'leśnych'): 1,\n", + " ('leśnych', 'do'): 1,\n", + " ('tych', 'łąk'): 1,\n", + " ('łąk', 'zielonych'): 1,\n", + " ('zielonych', 'szeroko'): 1,\n", + " ('szeroko', 'nad'): 1,\n", + " ('nad', 'błękitnym'): 1,\n", + " ('błękitnym', 'niemnem'): 1,\n", + " ('niemnem', 'rozciągnionych'): 1,\n", + " ('rozciągnionych', 'do'): 1,\n", + " ('tych', 'pól'): 1,\n", + " ('pól', 'malowanych'): 1,\n", + " ('malowanych', 'zbożem'): 1,\n", + " ('zbożem', 'rozmaitem'): 1,\n", + " ('rozmaitem', 'wyzłacanych'): 1,\n", + " ('wyzłacanych', 'pszenicą'): 1,\n", + " ('pszenicą', 'posrebrzanych'): 1,\n", + " ('posrebrzanych', 'żytem'): 1,\n", + " ('żytem', 'gdzie'): 1,\n", + " ('gdzie', 'bursztynowy'): 1,\n", + " ('bursztynowy', 'świerzop'): 1,\n", + " ('świerzop', 'gryka'): 1,\n", + " ('gryka', 'jak'): 1,\n", + " ('jak', 'śnieg'): 2,\n", + " ('śnieg', 'biała'): 1,\n", + " ('biała', 'gdzie'): 1,\n", + " ('gdzie', 'panieńskim'): 1,\n", + " ('panieńskim', 'rumieńcem'): 1,\n", + " ('rumieńcem', 'dzięcielina'): 1,\n", + " ('dzięcielina', 'pała'): 1,\n", + " ('pała', 'a'): 1,\n", + " ('a', 'wszystko'): 4,\n", + " ('wszystko', 'przepasane'): 1,\n", + " ('przepasane', 'jakby'): 1,\n", + " ('jakby', 'wstęgą'): 1,\n", + " ('wstęgą', 'miedzą'): 1,\n", + " ('miedzą', 'zieloną'): 1,\n", + " ('zieloną', 'na'): 1,\n", + " ('na', 'niej'): 1,\n", + " ('niej', 'z'): 2,\n", + " ('z', 'rzadka'): 5,\n", + " ('rzadka', 'ciche'): 1,\n", + " ('ciche', 'grusze'): 1,\n", + " ('grusze', 'siedzą'): 1,\n", + " ('siedzą', 'śród'): 2,\n", + " ('śród', 'takich'): 1,\n", + " ('takich', 'pól'): 1,\n", + " ('pól', 'przed'): 1,\n", + " ('przed', 'laty'): 4,\n", + " ('laty', 'nad'): 1,\n", + " ('nad', 'brzegiem'): 2,\n", + " ('brzegiem', 'ruczaju'): 1,\n", + " ('ruczaju', 'na'): 1,\n", + " ('na', 'pagórku'): 1,\n", + " ('pagórku', 'niewielkim'): 1,\n", + " ('niewielkim', 'we'): 1,\n", + " ('we', 'brzozowym'): 1,\n", + " ('brzozowym', 'gaju'): 1,\n", + " ('gaju', 'stał'): 1,\n", + " ('stał', 'dwór'): 1,\n", + " ('dwór', 'szlachecki'): 1,\n", + " ('szlachecki', 'z'): 1,\n", + " ('z', 'drzewa'): 4,\n", + " ('drzewa', 'lecz'): 1,\n", + " ('lecz', 'podmurowany'): 1,\n", + " ('podmurowany', 'świeciły'): 1,\n", + " ('świeciły', 'się'): 3,\n", + " ('się', 'z'): 56,\n", + " ('z', 'daleka'): 8,\n", + " ('daleka', 'pobielane'): 1,\n", + " ('pobielane', 'ściany'): 1,\n", + " ('ściany', 'tym'): 1,\n", + " ('tym', 'bielsze'): 1,\n", + " ('bielsze', 'że'): 1,\n", + " ('że', 'odbite'): 1,\n", + " ('odbite', 'od'): 1,\n", + " ('od', 'ciemnej'): 1,\n", + " ('ciemnej', 'zieleni'): 1,\n", + " ('zieleni', 'topoli'): 1,\n", + " ('topoli', 'co'): 1,\n", + " ('co', 'go'): 2,\n", + " ('go', 'bronią'): 1,\n", + " ('bronią', 'od'): 1,\n", + " ('od', 'wiatrów'): 1,\n", + " ('wiatrów', 'jesieni'): 1,\n", + " ('jesieni', 'dom'): 1,\n", + " ('dom', 'mieszkalny'): 1,\n", + " ('mieszkalny', 'niewielki'): 1,\n", + " ('niewielki', 'lecz'): 1,\n", + " ('lecz', 'zewsząd'): 1,\n", + " ('zewsząd', 'chędogi'): 1,\n", + " ('chędogi', 'i'): 1,\n", + " ('i', 'stodołę'): 1,\n", + " ('stodołę', 'miał'): 1,\n", + " ('miał', 'wielką'): 1,\n", + " ('wielką', 'i'): 1,\n", + " ('i', 'przy'): 1,\n", + " ('przy', 'niej'): 1,\n", + " ('niej', 'trzy'): 1,\n", + " ('trzy', 'stogi'): 1,\n", + " ('stogi', 'użątku'): 1,\n", + " ('użątku', 'co'): 1,\n", + " ('co', 'pod'): 1,\n", + " ('pod', 'strzechą'): 2,\n", + " ('strzechą', 'zmieścić'): 1,\n", + " ('zmieścić', 'się'): 1,\n", + " ('się', 'nie'): 20,\n", + " ('nie', 'może'): 10,\n", + " ('może', 'widać'): 1,\n", + " ('widać', 'że'): 12,\n", + " ('że', 'okolica'): 1,\n", + " ('okolica', 'obfita'): 1,\n", + " ('obfita', 'we'): 1,\n", + " ('we', 'zboże'): 1,\n", + " ('zboże', 'i'): 2,\n", + " ('i', 'widać'): 3,\n", + " ('widać', 'z'): 7,\n", + " ('z', 'liczby'): 2,\n", + " ('liczby', 'kopic'): 1,\n", + " ('kopic', 'co'): 1,\n", + " ('co', 'wzdłuż'): 1,\n", + " ('wzdłuż', 'i'): 2,\n", + " ('i', 'wszerz'): 3,\n", + " ('wszerz', 'smugów'): 1,\n", + " ('smugów', 'świecą'): 1,\n", + " ('świecą', 'gęsto'): 1,\n", + " ('gęsto', 'jak'): 1,\n", + " ('jak', 'gwiazdy'): 1,\n", + " ('gwiazdy', 'widać'): 1,\n", + " ('liczby', 'pługów'): 1,\n", + " ('pługów', 'orzących'): 1,\n", + " ('orzących', 'wcześnie'): 1,\n", + " ('wcześnie', 'łany'): 1,\n", + " ('łany', 'ogromne'): 1,\n", + " ('ogromne', 'ugoru'): 1,\n", + " ('ugoru', 'czarnoziemne'): 1,\n", + " ('czarnoziemne', 'zapewne'): 1,\n", + " ('zapewne', 'należne'): 1,\n", + " ('należne', 'do'): 1,\n", + " ('do', 'dworu'): 9,\n", + " ('dworu', 'uprawne'): 1,\n", + " ('uprawne', 'dobrze'): 1,\n", + " ('dobrze', 'na'): 3,\n", + " ('na', 'kształt'): 20,\n", + " ('kształt', 'ogrodowych'): 1,\n", + " ('ogrodowych', 'grządek'): 1,\n", + " ('grządek', 'że'): 1,\n", + " ('że', 'w'): 19,\n", + " ('w', 'tym'): 20,\n", + " ('tym', 'domu'): 1,\n", + " ('domu', 'dostatek'): 1,\n", + " ('dostatek', 'mieszka'): 1,\n", + " ('mieszka', 'i'): 1,\n", + " ('i', 'porządek'): 1,\n", + " ('porządek', 'brama'): 1,\n", + " ('brama', 'na'): 1,\n", + " ('na', 'wciąż'): 1,\n", + " ('wciąż', 'otwarta'): 1,\n", + " ('otwarta', 'przechodniom'): 1,\n", + " ('przechodniom', 'ogłasza'): 1,\n", + " ('ogłasza', 'że'): 1,\n", + " ('że', 'gościnna'): 1,\n", + " ('gościnna', 'i'): 1,\n", + " ('i', 'wszystkich'): 2,\n", + " ('wszystkich', 'w'): 2,\n", + " ('w', 'gościnę'): 1,\n", + " ('gościnę', 'zaprasza'): 1,\n", + " ('zaprasza', 'właśnie'): 1,\n", + " ('właśnie', 'dwukonną'): 1,\n", + " ('dwukonną', 'bryką'): 1,\n", + " ('bryką', 'wjechał'): 1,\n", + " ('wjechał', 'młody'): 1,\n", + " ('młody', 'panek'): 1,\n", + " ('panek', 'i'): 1,\n", + " ('i', 'obiegłszy'): 1,\n", + " ('obiegłszy', 'dziedziniec'): 1,\n", + " ('dziedziniec', 'zawrócił'): 1,\n", + " ('zawrócił', 'przed'): 1,\n", + " ('przed', 'ganek'): 2,\n", + " ('ganek', 'wysiadł'): 1,\n", + " ('wysiadł', 'z'): 1,\n", + " ('z', 'powozu'): 1,\n", + " ('powozu', 'konie'): 1,\n", + " ('konie', 'porzucone'): 1,\n", + " ('porzucone', 'same'): 1,\n", + " ('same', 'szczypiąc'): 1,\n", + " ('szczypiąc', 'trawę'): 1,\n", + " ('trawę', 'ciągnęły'): 1,\n", + " ('ciągnęły', 'powoli'): 1,\n", + " ('powoli', 'pod'): 1,\n", + " ('pod', 'bramę'): 2,\n", + " ('bramę', 'we'): 1,\n", + " ('we', 'dworze'): 10,\n", + " ('dworze', 'pusto'): 1,\n", + " ('pusto', 'bo'): 1,\n", + " ('bo', 'drzwi'): 2,\n", + " ('drzwi', 'od'): 1,\n", + " ('od', 'ganku'): 1,\n", + " ('ganku', 'zamknięto'): 1,\n", + " ('zamknięto', 'zaszczepkami'): 1,\n", + " ('zaszczepkami', 'i'): 1,\n", + " ('i', 'kołkiem'): 1,\n", + " ('kołkiem', 'zaszczepki'): 1,\n", + " ('zaszczepki', 'przetknięto'): 1,\n", + " ('przetknięto', 'podróżny'): 1,\n", + " ('podróżny', 'do'): 1,\n", + " ('do', 'folwarku'): 3,\n", + " ('folwarku', 'nie'): 2,\n", + " ('nie', 'biegł'): 1,\n", + " ('biegł', 'sług'): 1,\n", + " ('sług', 'zapytać'): 1,\n", + " ('zapytać', 'odemknął'): 1,\n", + " ('odemknął', 'wbiegł'): 1,\n", + " ('wbiegł', 'do'): 1,\n", + " ('do', 'domu'): 12,\n", + " ('domu', 'pragnął'): 1,\n", + " ('pragnął', 'go'): 1,\n", + " ('go', 'powitać'): 1,\n", + " ('powitać', 'dawno'): 1,\n", + " ('dawno', 'domu'): 1,\n", + " ('domu', 'nie'): 1,\n", + " ('nie', 'widział'): 7,\n", + " ('widział', 'bo'): 2,\n", + " ('bo', 'w'): 8,\n", + " ('w', 'dalekim'): 1,\n", + " ('dalekim', 'mieście'): 1,\n", + " ('mieście', 'kończył'): 1,\n", + " ('kończył', 'nauki'): 1,\n", + " ('nauki', 'końca'): 1,\n", + " ('końca', 'doczekał'): 1,\n", + " ('doczekał', 'nareszcie'): 1,\n", + " ('nareszcie', 'wbiega'): 1,\n", + " ('wbiega', 'i'): 1,\n", + " ('i', 'okiem'): 2,\n", + " ('okiem', 'chciwie'): 1,\n", + " ('chciwie', 'ściany'): 1,\n", + " ('ściany', 'starodawne'): 1,\n", + " ('starodawne', 'ogląda'): 1,\n", + " ('ogląda', 'czule'): 1,\n", + " ('czule', 'jako'): 1,\n", + " ('jako', 'swe'): 1,\n", + " ('swe', 'znajome'): 1,\n", + " ('znajome', 'dawne'): 1,\n", + " ('dawne', 'też'): 1,\n", + " ('też', 'same'): 4,\n", + " ('same', 'widzi'): 1,\n", + " ('widzi', 'sprzęty'): 1,\n", + " ('sprzęty', 'też'): 1,\n", + " ('same', 'obicia'): 1,\n", + " ('obicia', 'z'): 1,\n", + " ('z', 'którymi'): 1,\n", + " ('którymi', 'się'): 1,\n", + " ('się', 'zabawiać'): 1,\n", + " ('zabawiać', 'lubił'): 1,\n", + " ('lubił', 'od'): 1,\n", + " ('od', 'powicia'): 1,\n", + " ('powicia', 'lecz'): 1,\n", + " ('lecz', 'mniej'): 1,\n", + " ('mniej', 'wielkie'): 1,\n", + " ('wielkie', 'mniej'): 1,\n", + " ('mniej', 'piękne'): 1,\n", + " ('piękne', 'niż'): 1,\n", + " ('niż', 'się'): 2,\n", + " ('się', 'dawniej'): 1,\n", + " ('dawniej', 'zdały'): 1,\n", + " ('zdały', 'i'): 1,\n", + " ('i', 'też'): 1,\n", + " ('same', 'portrety'): 1,\n", + " ('portrety', 'na'): 1,\n", + " ('na', 'ścianach'): 1,\n", + " ('ścianach', 'wisiały'): 1,\n", + " ('wisiały', 'tu'): 1,\n", + " ('tu', 'kościuszko'): 1,\n", + " ('kościuszko', 'w'): 1,\n", + " ('w', 'czamarce'): 1,\n", + " ('czamarce', 'krakowskiej'): 1,\n", + " ('krakowskiej', 'z'): 1,\n", + " ('z', 'oczyma'): 2,\n", + " ('oczyma', 'podniesionymi'): 1,\n", + " ('podniesionymi', 'w'): 1,\n", + " ('w', 'niebo'): 8,\n", + " ('niebo', 'miecz'): 1,\n", + " ('miecz', 'oburącz'): 1,\n", + " ('oburącz', 'trzyma'): 1,\n", + " ('trzyma', 'takim'): 1,\n", + " ('takim', 'był'): 1,\n", + " ('był', 'gdy'): 1,\n", + " ('gdy', 'przysięgał'): 1,\n", + " ('przysięgał', 'na'): 1,\n", + " ('na', 'stopniach'): 1,\n", + " ('stopniach', 'ołtarzów'): 1,\n", + " ('ołtarzów', 'że'): 1,\n", + " ('że', 'tym'): 1,\n", + " ('tym', 'mieczem'): 1,\n", + " ('mieczem', 'wypędzi'): 1,\n", + " ('wypędzi', 'z'): 1,\n", + " ('z', 'polski'): 2,\n", + " ('polski', 'trzech'): 1,\n", + " ('trzech', 'mocarzów'): 1,\n", + " ('mocarzów', 'albo'): 1,\n", + " ('albo', 'sam'): 1,\n", + " ('sam', 'na'): 3,\n", + " ('na', 'nim'): 10,\n", + " ('nim', 'padnie'): 1,\n", + " ('padnie', 'dalej'): 1,\n", + " ('dalej', 'w'): 3,\n", + " ('w', 'polskiej'): 1,\n", + " ('polskiej', 'szacie'): 1,\n", + " ('szacie', 'siedzi'): 1,\n", + " ('siedzi', 'rejtan'): 1,\n", + " ('rejtan', 'żałośny'): 1,\n", + " ('żałośny', 'po'): 1,\n", + " ('po', 'wolności'): 1,\n", + " ('wolności', 'stracie'): 1,\n", + " ('stracie', 'w'): 1,\n", + " ('w', 'ręku'): 15,\n", + " ('ręku', 'trzyma'): 1,\n", + " ('trzyma', 'nóż'): 1,\n", + " ('nóż', 'ostrzem'): 1,\n", + " ('ostrzem', 'zwrócony'): 1,\n", + " ('zwrócony', 'do'): 2,\n", + " ('do', 'łona'): 1,\n", + " ('łona', 'a'): 1,\n", + " ('a', 'przed'): 2,\n", + " ('przed', 'nim'): 5,\n", + " ('nim', 'leży'): 1,\n", + " ('leży', 'fedon'): 1,\n", + " ('fedon', 'i'): 1,\n", + " ('i', 'żywot'): 1,\n", + " ('żywot', 'katona'): 1,\n", + " ('katona', 'dalej'): 1,\n", + " ('dalej', 'jasiński'): 1,\n", + " ('jasiński', 'młodzian'): 1,\n", + " ('młodzian', 'piękny'): 1,\n", + " ('piękny', 'i'): 1,\n", + " ('i', 'posępny'): 2,\n", + " ('posępny', 'obok'): 1,\n", + " ('obok', 'korsak'): 1,\n", + " ('korsak', 'towarzysz'): 1,\n", + " ('towarzysz', 'jego'): 1,\n", + " ('jego', 'nieodstępny'): 1,\n", + " ('nieodstępny', 'stoją'): 1,\n", + " ('stoją', 'na'): 2,\n", + " ('na', 'szańcach'): 1,\n", + " ('szańcach', 'pragi'): 1,\n", + " ('pragi', 'na'): 1,\n", + " ('na', 'stosach'): 1,\n", + " ('stosach', 'moskali'): 1,\n", + " ('moskali', 'siekąc'): 1,\n", + " ('siekąc', 'wrogów'): 1,\n", + " ('wrogów', 'a'): 2,\n", + " ('a', 'praga'): 1,\n", + " ('praga', 'już'): 1,\n", + " ('już', 'się'): 5,\n", + " ('się', 'wkoło'): 5,\n", + " ('wkoło', 'pali'): 1,\n", + " ('pali', 'nawet'): 1,\n", + " ('nawet', 'stary'): 1,\n", + " ('stary', 'stojący'): 1,\n", + " ('stojący', 'zegar'): 1,\n", + " ('zegar', 'kurantowy'): 1,\n", + " ('kurantowy', 'w'): 1,\n", + " ('w', 'drewnianej'): 1,\n", + " ('drewnianej', 'szafie'): 1,\n", + " ('szafie', 'poznał'): 1,\n", + " ('poznał', 'u'): 1,\n", + " ('u', 'wniścia'): 1,\n", + " ('wniścia', 'alkowy'): 1,\n", + " ('alkowy', 'i'): 1,\n", + " ('i', 'z'): 54,\n", + " ('z', 'dziecinną'): 1,\n", + " ('dziecinną', 'radością'): 1,\n", + " ('radością', 'pociągnął'): 1,\n", + " ('pociągnął', 'za'): 1,\n", + " ('za', 'sznurek'): 1,\n", + " ('sznurek', 'by'): 1,\n", + " ('by', 'stary'): 1,\n", + " ('stary', 'dąbrowskiego'): 1,\n", + " ('dąbrowskiego', 'usłyszeć'): 1,\n", + " ('usłyszeć', 'mazurek'): 1,\n", + " ('mazurek', 'biegał'): 1,\n", + " ('biegał', 'po'): 2,\n", + " ('po', 'całym'): 2,\n", + " ('całym', 'domu'): 1,\n", + " ('domu', 'i'): 5,\n", + " ('i', 'szukał'): 2,\n", + " ('szukał', 'komnaty'): 1,\n", + " ('komnaty', 'gdzie'): 1,\n", + " ('gdzie', 'mieszkał'): 1,\n", + " ('mieszkał', 'dzieckiem'): 1,\n", + " ('dzieckiem', 'będąc'): 1,\n", + " ('będąc', 'przed'): 1,\n", + " ('przed', 'dziesięciu'): 1,\n", + " ('dziesięciu', 'laty'): 1,\n", + " ('laty', 'wchodzi'): 1,\n", + " ('wchodzi', 'cofnął'): 1,\n", + " ('cofnął', 'się'): 4,\n", + " ('się', 'toczył'): 2,\n", + " ('toczył', 'zdumione'): 1,\n", + " ('zdumione', 'źrenice'): 1,\n", + " ('źrenice', 'po'): 1,\n", + " ('po', 'ścianach'): 1,\n", + " ('ścianach', 'w'): 1,\n", + " ('w', 'tej'): 13,\n", + " ('tej', 'komnacie'): 1,\n", + " ('komnacie', 'mieszkanie'): 1,\n", + " ('mieszkanie', 'kobiéce'): 1,\n", + " ('kobiéce', 'któż'): 1,\n", + " ('któż', 'by'): 3,\n", + " ('by', 'tu'): 1,\n", + " ('tu', 'mieszkał'): 1,\n", + " ('mieszkał', 'stary'): 1,\n", + " ('stary', 'stryj'): 1,\n", + " ('stryj', 'nie'): 1,\n", + " ('nie', 'był'): 10,\n", + " ('był', 'żonaty'): 1,\n", + " ('żonaty', 'a'): 1,\n", + " ('a', 'ciotka'): 1,\n", + " ('ciotka', 'w'): 1,\n", + " ('w', 'petersburgu'): 1,\n", + " ('petersburgu', 'mieszkała'): 1,\n", + " ('mieszkała', 'przed'): 1,\n", + " ('laty', 'to'): 1,\n", + " ('to', 'nie'): 13,\n", + " ('był', 'ochmistrzyni'): 1,\n", + " ('ochmistrzyni', 'pokój'): 1,\n", + " ('pokój', 'fortepiano'): 1,\n", + " ('fortepiano', 'na'): 1,\n", + " ('nim', 'nuty'): 1,\n", + " ('nuty', 'i'): 1,\n", + " ('i', 'książki'): 1,\n", + " ('książki', 'wszystko'): 1,\n", + " ('wszystko', 'porzucano'): 1,\n", + " ('porzucano', 'niedbale'): 1,\n", + " ('niedbale', 'i'): 1,\n", + " ('i', 'bezładnie'): 1,\n", + " ('bezładnie', 'nieporządek'): 1,\n", + " ('nieporządek', 'miły'): 1,\n", + " ('miły', 'niestare'): 1,\n", + " ('niestare', 'były'): 1,\n", + " ('były', 'rączki'): 1,\n", + " ('rączki', 'co'): 1,\n", + " ('co', 'je'): 2,\n", + " ('je', 'tak'): 1,\n", + " ('tak', 'rzuciły'): 1,\n", + " ('rzuciły', 'tuż'): 1,\n", + " ('tuż', 'i'): 2,\n", + " ('i', 'sukienka'): 1,\n", + " ('sukienka', 'biała'): 1,\n", + " ('biała', 'świeżo'): 1,\n", + " ('świeżo', 'z'): 1,\n", + " ('z', 'kołka'): 2,\n", + " ('kołka', 'zdjęta'): 1,\n", + " ('zdjęta', 'do'): 1,\n", + " ('do', 'ubrania'): 2,\n", + " ('ubrania', 'na'): 1,\n", + " ('na', 'krzesła'): 1,\n", + " ('krzesła', 'poręczu'): 1,\n", + " ('poręczu', 'rozpięta'): 1,\n", + " ('rozpięta', 'a'): 1,\n", + " ('a', 'na'): 15,\n", + " ('na', 'oknach'): 1,\n", + " ('oknach', 'donice'): 1,\n", + " ('donice', 'z'): 1,\n", + " ('z', 'pachnącymi'): 1,\n", + " ('pachnącymi', 'ziołki'): 1,\n", + " ('ziołki', 'geranium'): 1,\n", + " ('geranium', 'lewkonija'): 1,\n", + " ('lewkonija', 'astry'): 1,\n", + " ('astry', 'i'): 1,\n", + " ('i', 'fijołki'): 1,\n", + " ('fijołki', 'podróżny'): 1,\n", + " ('podróżny', 'stanął'): 1,\n", + " ('stanął', 'w'): 3,\n", + " ('w', 'jednym'): 2,\n", + " ('jednym', 'z'): 1,\n", + " ('z', 'okien'): 1,\n", + " ('okien', 'nowe'): 1,\n", + " ('nowe', 'dziwo'): 1,\n", + " ('dziwo', 'w'): 1,\n", + " ('w', 'sadzie'): 2,\n", + " ('sadzie', 'na'): 1,\n", + " ('na', 'brzegu'): 1,\n", + " ('brzegu', 'niegdyś'): 1,\n", + " ('niegdyś', 'zarosłym'): 1,\n", + " ('zarosłym', 'pokrzywą'): 1,\n", + " ('pokrzywą', 'był'): 1,\n", + " ('był', 'maleńki'): 1,\n", + " ('maleńki', 'ogródek'): 1,\n", + " ('ogródek', 'ścieżkami'): 1,\n", + " ('ścieżkami', 'porznięty'): 1,\n", + " ('porznięty', 'pełen'): 1,\n", + " ('pełen', 'bukietów'): 1,\n", + " ('bukietów', 'trawy'): 1,\n", + " ('trawy', 'angielskiej'): 1,\n", + " ('angielskiej', 'i'): 1,\n", + " ('i', 'mięty'): 1,\n", + " ('mięty', 'drewniany'): 1,\n", + " ('drewniany', 'drobny'): 1,\n", + " ('drobny', 'w'): 1,\n", + " ('w', 'cyfrę'): 1,\n", + " ('cyfrę', 'powiązany'): 1,\n", + " ('powiązany', 'płotek'): 1,\n", + " ('płotek', 'połyskał'): 1,\n", + " ('połyskał', 'się'): 2,\n", + " ('się', 'wstążkami'): 1,\n", + " ('wstążkami', 'jaskrawych'): 1,\n", + " ('jaskrawych', 'stokrotek'): 1,\n", + " ('stokrotek', 'grządki'): 1,\n", + " ('grządki', 'widać'): 1,\n", + " ('że', 'były'): 1,\n", + " ('były', 'świeżo'): 1,\n", + " ('świeżo', 'polewane'): 1,\n", + " ('polewane', 'tuż'): 1,\n", + " ('tuż', 'stało'): 1,\n", + " ('stało', 'wody'): 1,\n", + " ('wody', 'pełne'): 1,\n", + " ('pełne', 'naczynie'): 1,\n", + " ('naczynie', 'blaszane'): 1,\n", + " ('blaszane', 'ale'): 1,\n", + " ('ale', 'nigdzie'): 1,\n", + " ('nigdzie', 'nie'): 1,\n", + " ('nie', 'widać'): 3,\n", + " ('widać', 'było'): 6,\n", + " ('było', 'ogrodniczki'): 1,\n", + " ('ogrodniczki', 'tylko'): 1,\n", + " ('tylko', 'co'): 2,\n", + " ('co', 'wyszła'): 1,\n", + " ('wyszła', 'jeszcze'): 1,\n", + " ('jeszcze', 'kołyszą'): 1,\n", + " ('kołyszą', 'się'): 1,\n", + " ('się', 'drzwiczki'): 1,\n", + " ('drzwiczki', 'świeżo'): 1,\n", + " ('świeżo', 'trącone'): 1,\n", + " ('trącone', 'blisko'): 1,\n", + " ('blisko', 'drzwi'): 1,\n", + " ('drzwi', 'ślad'): 1,\n", + " ('ślad', 'widać'): 1,\n", + " ('widać', 'nóżki'): 1,\n", + " ('nóżki', 'na'): 1,\n", + " ('na', 'piasku'): 2,\n", + " ('piasku', 'bez'): 1,\n", + " ('bez', 'trzewika'): 1,\n", + " ('trzewika', 'była'): 1,\n", + " ('była', 'i'): 2,\n", + " ('i', 'pończoszki'): 1,\n", + " ('pończoszki', 'na'): 1,\n", + " ('piasku', 'drobnym'): 1,\n", + " ('drobnym', 'suchym'): 1,\n", + " ('suchym', 'białym'): 1,\n", + " ('białym', 'na'): 1,\n", + " ('kształt', 'śniegu'): 1,\n", + " ('śniegu', 'ślad'): 1,\n", + " ('ślad', 'wyraźny'): 1,\n", + " ('wyraźny', 'lecz'): 1,\n", + " ('lecz', 'lekki'): 1,\n", + " ('lekki', 'odgadniesz'): 1,\n", + " ('odgadniesz', 'że'): 1,\n", + " ('w', 'biegu'): 6,\n", + " ('biegu', 'chybkim'): 1,\n", + " ('chybkim', 'był'): 1,\n", + " ('był', 'zostawiony'): 1,\n", + " ('zostawiony', 'nóżkami'): 1,\n", + " ('nóżkami', 'drobnemi'): 1,\n", + " ('drobnemi', 'od'): 1,\n", + " ('od', 'kogoś'): 1,\n", + " ('kogoś', 'co'): 1,\n", + " ('co', 'zaledwie'): 1,\n", + " ('zaledwie', 'dotykał'): 1,\n", + " ('dotykał', 'się'): 1,\n", + " ('się', 'ziemi'): 1,\n", + " ('ziemi', 'podróżny'): 1,\n", + " ('podróżny', 'długo'): 1,\n", + " ('długo', 'w'): 4,\n", + " ('w', 'oknie'): 1,\n", + " ('oknie', 'stał'): 1,\n", + " ('stał', 'patrząc'): 1,\n", + " ('patrząc', 'dumając'): 1,\n", + " ('dumając', 'wonnymi'): 1,\n", + " ('wonnymi', 'powiewami'): 1,\n", + " ('powiewami', 'kwiatów'): 1,\n", + " ('kwiatów', 'oddychając'): 1,\n", + " ('oddychając', 'oblicze'): 1,\n", + " ('oblicze', 'aż'): 1,\n", + " ('aż', 'na'): 4,\n", + " ('na', 'krzaki'): 1,\n", + " ('krzaki', 'fijołkowe'): 1,\n", + " ('fijołkowe', 'skłonił'): 1,\n", + " ('skłonił', 'oczyma'): 1,\n", + " ('oczyma', 'ciekawymi'): 1,\n", + " ('ciekawymi', 'po'): 1,\n", + " ('po', 'drożynach'): 1,\n", + " ('drożynach', 'gonił'): 1,\n", + " ('gonił', 'i'): 2,\n", + " ('i', 'znowu'): 10,\n", + " ('znowu', 'je'): 1,\n", + " ('je', 'na'): 2,\n", + " ('na', 'drobnych'): 1,\n", + " ('drobnych', 'śladach'): 1,\n", + " ('śladach', 'zatrzymywał'): 1,\n", + " ('zatrzymywał', 'myślał'): 1,\n", + " ('myślał', 'o'): 1,\n", + " ('o', 'nich'): 2,\n", + " ('nich', 'i'): 1,\n", + " ('i', 'czyje'): 1,\n", + " ('czyje', 'były'): 1,\n", + " ('były', 'odgadywał'): 1,\n", + " ('odgadywał', 'przypadkiem'): 1,\n", + " ('przypadkiem', 'oczy'): 1,\n", + " ('oczy', 'podniósł'): 2,\n", + " ('podniósł', 'i'): 2,\n", + " ('i', 'tuż'): 1,\n", + " ('tuż', 'na'): 1,\n", + " ('na', 'parkanie'): 3,\n", + " ('parkanie', 'stała'): 1,\n", + " ('stała', 'młoda'): 1,\n", + " ('młoda', 'dziewczyna'): 1,\n", + " ('dziewczyna', 'białe'): 1,\n", + " ('białe', 'jej'): 1,\n", + " ('jej', 'ubranie'): 1,\n", + " ('ubranie', 'wysmukłą'): 1,\n", + " ('wysmukłą', 'postać'): 1,\n", + " ('postać', 'tylko'): 1,\n", + " ('tylko', 'aż'): 1,\n", + " ('aż', 'do'): 10,\n", + " ('do', 'piersi'): 2,\n", + " ('piersi', 'kryje'): 1,\n", + " ('kryje', 'odsłaniając'): 1,\n", + " ('odsłaniając', 'ramiona'): 1,\n", + " ('ramiona', 'i'): 2,\n", + " ('i', 'łabędzią'): 1,\n", + " ('łabędzią', 'szyję'): 1,\n", + " ('szyję', 'w'): 1,\n", + " ('w', 'takim'): 4,\n", + " ('takim', 'litwinka'): 1,\n", + " ('litwinka', 'tylko'): 1,\n", + " ('tylko', 'chodzić'): 1,\n", + " ('chodzić', 'zwykła'): 1,\n", + " ('zwykła', 'z'): 1,\n", + " ('z', 'rana'): 7,\n", + " ('rana', 'w'): 1,\n", + " ('takim', 'nigdy'): 1,\n", + " ('nigdy', 'nie'): 13,\n", + " ('nie', 'bywa'): 1,\n", + " ('bywa', 'od'): 1,\n", + " ('od', 'mężczyzn'): 1,\n", + " ('mężczyzn', 'widziana'): 1,\n", + " ('widziana', 'więc'): 1,\n", + " ('więc', 'choć'): 1,\n", + " ('choć', 'świadka'): 1,\n", + " ('świadka', 'nie'): 1,\n", + " ('nie', 'miała'): 3,\n", + " ('miała', 'założyła'): 1,\n", + " ('założyła', 'ręce'): 1,\n", + " ('ręce', 'na'): 2,\n", + " ('na', 'piersiach'): 3,\n", + " ('piersiach', 'przydawając'): 1,\n", + " ('przydawając', 'zasłony'): 1,\n", + " ('zasłony', 'sukience'): 1,\n", + " ('sukience', 'włos'): 1,\n", + " ('włos', 'w'): 1,\n", + " ('w', 'pukle'): 2,\n", + " ('pukle', 'nierozwity'): 1,\n", + " ('nierozwity', 'lecz'): 1,\n", + " ('lecz', 'w'): 6,\n", + " ('w', 'węzełki'): 1,\n", + " ('węzełki', 'małe'): 1,\n", + " ('małe', 'pokręcony'): 1,\n", + " ('pokręcony', 'schowany'): 1,\n", + " ('schowany', 'w'): 1,\n", + " ('w', 'drobne'): 2,\n", + " ('drobne', 'strączki'): 1,\n", + " ('strączki', 'białe'): 1,\n", + " ('białe', 'dziwnie'): 1,\n", + " ('dziwnie', 'ozdabiał'): 1,\n", + " ('ozdabiał', 'głowę'): 1,\n", + " ('głowę', 'bo'): 1,\n", + " ('bo', 'od'): 3,\n", + " ('od', 'słońca'): 5,\n", + " ('słońca', 'blasku'): 2,\n", + " ('blasku', 'świecił'): 1,\n", + " ('świecił', 'się'): 2,\n", + " ('się', 'jak'): 17,\n", + " ('jak', 'korona'): 2,\n", + " ('korona', 'na'): 2,\n", + " ('na', 'świętych'): 2,\n", + " ('świętych', 'obrazku'): 2,\n", + " ('obrazku', 'twarzy'): 1,\n", + " ('twarzy', 'nie'): 3,\n", + " ('nie', 'było'): 13,\n", + " ('było', 'widać'): 2,\n", + " ('widać', 'zwrócona'): 1,\n", + " ('zwrócona', 'na'): 1,\n", + " ('na', 'pole'): 6,\n", + " ('pole', 'szukała'): 1,\n", + " ('szukała', 'kogoś'): 1,\n", + " ('kogoś', 'okiem'): 1,\n", + " ('okiem', 'daleko'): 1,\n", + " ('daleko', 'na'): 3,\n", + " ('na', 'dole'): 3,\n", + " ('dole', 'ujrzała'): 1,\n", + " ('ujrzała', 'zaśmiała'): 1,\n", + " ('zaśmiała', 'się'): 2,\n", + " ('się', 'i'): 46,\n", + " ('i', 'klasnęła'): 2,\n", + " ('klasnęła', 'w'): 2,\n", + " ('w', 'dłonie'): 2,\n", + " ('dłonie', 'jak'): 1,\n", + " ('jak', 'biały'): 1,\n", + " ('biały', 'ptak'): 1,\n", + " ('ptak', 'zleciała'): 1,\n", + " ('zleciała', 'z'): 1,\n", + " ('z', 'parkanu'): 1,\n", + " ('parkanu', 'na'): 1,\n", + " ('na', 'błonie'): 2,\n", + " ('błonie', 'i'): 1,\n", + " ('i', 'wionęła'): 1,\n", + " ('wionęła', 'ogrodem'): 1,\n", + " ('ogrodem', 'przez'): 1,\n", + " ('przez', 'płotki'): 1,\n", + " ('płotki', 'przez'): 1,\n", + " ('przez', 'kwiaty'): 1,\n", + " ('kwiaty', 'i'): 2,\n", + " ('i', 'po'): 16,\n", + " ('po', 'desce'): 1,\n", + " ('desce', 'opartej'): 1,\n", + " ('opartej', 'o'): 1,\n", + " ('o', 'ścianę'): 2,\n", + " ('ścianę', 'komnaty'): 1,\n", + " ('komnaty', 'nim'): 1,\n", + " ('nim', 'spostrzegł'): 1,\n", + " ('spostrzegł', 'się'): 1,\n", + " ('się', 'wleciała'): 1,\n", + " ('wleciała', 'przez'): 1,\n", + " ('przez', 'okno'): 5,\n", + " ('okno', 'świecąca'): 1,\n", + " ('świecąca', 'nagła'): 1,\n", + " ('nagła', 'cicha'): 1,\n", + " ('cicha', 'i'): 2,\n", + " ('i', 'lekka'): 1,\n", + " ('lekka', 'jak'): 1,\n", + " ('jak', 'światłość'): 1,\n", + " ('światłość', 'miesiąca'): 1,\n", + " ('miesiąca', 'nucąc'): 1,\n", + " ('nucąc', 'chwyciła'): 1,\n", + " ('chwyciła', 'suknie'): 1,\n", + " ('suknie', 'biegła'): 1,\n", + " ('biegła', 'do'): 1,\n", + " ('do', 'zwierciadła'): 1,\n", + " ('zwierciadła', 'wtem'): 1,\n", + " ('wtem', 'ujrzała'): 1,\n", + " ('ujrzała', 'młodzieńca'): 1,\n", + " ('młodzieńca', 'i'): 1,\n", + " ('z', 'rąk'): 8,\n", + " ('rąk', 'jej'): 1,\n", + " ('jej', 'wypadła'): 1,\n", + " ('wypadła', 'suknia'): 1,\n", + " ('suknia', 'a'): 1,\n", + " ('a', 'twarz'): 1,\n", + " ('twarz', 'od'): 1,\n", + " ('od', 'strachu'): 1,\n", + " ('strachu', 'i'): 1,\n", + " ('i', 'dziwu'): 1,\n", + " ('dziwu', 'pobladła'): 1,\n", + " ('pobladła', 'twarz'): 1,\n", + " ('twarz', 'podróżnego'): 1,\n", + " ('podróżnego', 'barwą'): 1,\n", + " ('barwą', 'spłonęła'): 1,\n", + " ('spłonęła', 'rumianą'): 1,\n", + " ('rumianą', 'jak'): 1,\n", + " ('jak', 'obłok'): 1,\n", + " ('obłok', 'gdy'): 1,\n", + " ('gdy', 'z'): 5,\n", + " ('z', 'jutrzenką'): 1,\n", + " ('jutrzenką', 'napotka'): 1,\n", + " ('napotka', 'się'): 1,\n", + " ('się', 'raną'): 1,\n", + " ('raną', 'skromny'): 1,\n", + " ('skromny', 'młodzieniec'): 1,\n", + " ('młodzieniec', 'oczy'): 1,\n", + " ('oczy', 'zmrużył'): 2,\n", + " ('zmrużył', 'i'): 1,\n", + " ('i', 'przysłonił'): 1,\n", + " ('przysłonił', 'chciał'): 1,\n", + " ('chciał', 'coś'): 2,\n", + " ('coś', 'mówić'): 2,\n", + " ('mówić', 'przepraszać'): 1,\n", + " ('przepraszać', 'tylko'): 1,\n", + " ('się', 'ukłonił'): 1,\n", + " ('ukłonił', 'i'): 1,\n", + " ('i', 'cofnął'): 1,\n", + " ('się', 'dziewica'): 1,\n", + " ('dziewica', 'krzyknęła'): 1,\n", + " ('krzyknęła', 'boleśnie'): 1,\n", + " ('boleśnie', 'niewyraźnie'): 1,\n", + " ('niewyraźnie', 'jak'): 1,\n", + " ('jak', 'dziecko'): 2,\n", + " ('dziecko', 'przestraszone'): 1,\n", + " ('przestraszone', 'we'): 1,\n", + " ('we', 'śnie'): 2,\n", + " ('śnie', 'podróżny'): 1,\n", + " ('podróżny', 'zląkł'): 1,\n", + " ('zląkł', 'się'): 3,\n", + " ('się', 'spojrzał'): 1,\n", + " ('spojrzał', 'lecz'): 1,\n", + " ('lecz', 'już'): 1,\n", + " ('już', 'jej'): 1,\n", + " ('jej', 'nie'): 4,\n", + " ('było', 'wyszedł'): 1,\n", + " ('wyszedł', 'zmieszany'): 1,\n", + " ('zmieszany', 'i'): 1,\n", + " ('i', 'czuł'): 3,\n", + " ('czuł', 'że'): 7,\n", + " ('że', 'mu'): 5,\n", + " ('mu', 'serce'): 1,\n", + " ('serce', 'biło'): 1,\n", + " ('biło', 'głośno'): 1,\n", + " ('głośno', 'i'): 1,\n", + " ('i', 'sam'): 5,\n", + " ('sam', 'nie'): 9,\n", + " ('nie', 'wiedział'): 8,\n", + " ('wiedział', 'czy'): 2,\n", + " ('czy', 'go'): 1,\n", + " ('go', 'miało'): 1,\n", + " ('miało', 'śmieszyć'): 1,\n", + " ('śmieszyć', 'to'): 1,\n", + " ('to', 'dziwaczne'): 1,\n", + " ('dziwaczne', 'spotkanie'): 1,\n", + " ('spotkanie', 'czy'): 1,\n", + " ('czy', 'wstydzić'): 1,\n", + " ('wstydzić', 'czy'): 1,\n", + " ('czy', 'cieszyć'): 1,\n", + " ('cieszyć', 'tymczasem'): 1,\n", + " ('tymczasem', 'na'): 2,\n", + " ('na', 'folwarku'): 1,\n", + " ('nie', 'uszło'): 1,\n", + " ('uszło', 'baczności'): 1,\n", + " ('baczności', 'że'): 1,\n", + " ('że', 'przed'): 1,\n", + " ('ganek', 'zajechał'): 1,\n", + " ('zajechał', 'któryś'): 1,\n", + " ('któryś', 'z'): 1,\n", + " ('z', 'nowych'): 1,\n", + " ('nowych', 'gości'): 1,\n", + " ('gości', 'już'): 1,\n", + " ('już', 'konie'): 1,\n", + " ('konie', 'w'): 1,\n", + " ('w', 'stajnią'): 1,\n", + " ('stajnią', 'wzięto'): 1,\n", + " ('wzięto', 'już'): 1,\n", + " ...})" + ] + }, + "execution_count": 12, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "cnt" + ] + }, + { + "cell_type": "code", + "execution_count": 13, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "[(('się', 'w'), 67),\n", + " (('się', 'z'), 56),\n", + " (('i', 'z'), 54),\n", + " (('się', 'i'), 46),\n", + " (('i', 'w'), 44),\n", + " (('się', 'na'), 43),\n", + " (('i', 'na'), 31),\n", + " (('i', 'tak'), 30),\n", + " (('co', 'się'), 29),\n", + " (('za', 'nim'), 25),\n", + " (('w', 'domu'), 24),\n", + " (('z', 'nim'), 24),\n", + " (('o', 'tym'), 24),\n", + " (('że', 'się'), 23),\n", + " (('jak', 'gdyby'), 22),\n", + " (('jak', 'w'), 22),\n", + " (('się', 'do'), 21),\n", + " (('z', 'wolna'), 21),\n", + " (('nic', 'nie'), 21),\n", + " (('się', 'nie'), 20),\n", + " (('na', 'kształt'), 20),\n", + " (('w', 'tym'), 20),\n", + " (('na', 'koniec'), 20),\n", + " (('że', 'w'), 19),\n", + " (('na', 'to'), 19),\n", + " (('i', 'nie'), 19),\n", + " (('z', 'tyłu'), 19),\n", + " (('nie', 'jest'), 18),\n", + " (('się', 'jak'), 17),\n", + " (('u', 'nas'), 17),\n", + " (('i', 'po'), 16),\n", + " (('nie', 'mógł'), 16),\n", + " (('nie', 'ma'), 16),\n", + " (('w', 'ręku'), 15),\n", + " (('a', 'na'), 15),\n", + " (('pan', 'sędzia'), 15),\n", + " (('jak', 'na'), 15),\n", + " (('na', 'świecie'), 15),\n", + " (('w', 'końcu'), 15),\n", + " (('w', 'środku'), 15),\n", + " (('co', 'to'), 15),\n", + " (('do', 'góry'), 15),\n", + " (('na', 'litwie'), 14),\n", + " (('już', 'nie'), 14),\n", + " (('w', 'litwie'), 14),\n", + " (('z', 'góry'), 14),\n", + " (('z', 'sobą'), 14),\n", + " (('się', 'że'), 14),\n", + " (('w', 'tej'), 13),\n", + " (('to', 'nie'), 13),\n", + " (('nigdy', 'nie'), 13),\n", + " (('nie', 'było'), 13),\n", + " (('i', 'już'), 13),\n", + " (('a', 'w'), 13),\n", + " (('tak', 'się'), 13),\n", + " (('a', 'potem'), 13),\n", + " (('że', 'go'), 13),\n", + " (('w', 'tył'), 13),\n", + " (('w', 'pole'), 13),\n", + " (('hrabia', 'z'), 13),\n", + " (('widać', 'że'), 12),\n", + " (('do', 'domu'), 12),\n", + " (('był', 'w'), 12),\n", + " (('i', 'rzekł'), 12),\n", + " (('był', 'to'), 12),\n", + " (('po', 'co'), 12),\n", + " (('że', 'z'), 12),\n", + " (('czy', 'to'), 12),\n", + " (('w', 'górę'), 12),\n", + " (('a', 'z'), 12),\n", + " (('bić', 'się'), 12),\n", + " (('pan', 'hrabia'), 11),\n", + " (('i', 'że'), 11),\n", + " (('a', 'co'), 11),\n", + " (('nie', 'miał'), 11),\n", + " (('widząc', 'że'), 11),\n", + " (('a', 'za'), 11),\n", + " (('że', 'to'), 11),\n", + " (('do', 'siebie'), 11),\n", + " (('rzekł', 'sędzia'), 11),\n", + " (('za', 'czym'), 11),\n", + " (('na', 'czele'), 11),\n", + " (('nie', 'może'), 10),\n", + " (('we', 'dworze'), 10),\n", + " (('na', 'nim'), 10),\n", + " (('nie', 'był'), 10),\n", + " (('i', 'znowu'), 10),\n", + " (('aż', 'do'), 10),\n", + " (('z', 'nich'), 10),\n", + " (('się', 'po'), 10),\n", + " (('w', 'las'), 10),\n", + " (('się', 'o'), 10),\n", + " (('w', 'oczy'), 10),\n", + " (('to', 'był'), 10),\n", + " (('to', 'jest'), 10),\n", + " (('się', 'za'), 10),\n", + " (('na', 'ziemi'), 10),\n", + " (('się', 'ku'), 10),\n", + " (('w', 'niej'), 10),\n", + " (('jak', 'się'), 10),\n", + " (('i', 'do'), 10),\n", + " (('i', 'ja'), 10),\n", + " (('hejże', 'na'), 10),\n", + " (('do', 'dworu'), 9),\n", + " (('sam', 'nie'), 9),\n", + " (('z', 'dala'), 9),\n", + " (('gdy', 'się'), 9),\n", + " (('i', 'tam'), 9),\n", + " (('w', 'zamku'), 9),\n", + " (('to', 'mówiąc'), 9),\n", + " (('do', 'nas'), 9),\n", + " (('pan', 'rejent'), 9),\n", + " (('się', 'od'), 9),\n", + " (('lecz', 'nie'), 9),\n", + " (('z', 'tych'), 9),\n", + " (('a', 'pan'), 9),\n", + " (('do', 'zamku'), 9),\n", + " (('się', 'pod'), 9),\n", + " (('z', 'drugiej'), 9),\n", + " (('na', 'koń'), 9),\n", + " (('czy', 'nie'), 9),\n", + " (('kto', 'wie'), 9),\n", + " (('do', 'ziemi'), 9),\n", + " (('z', 'oczu'), 9),\n", + " (('z', 'przodu'), 9),\n", + " (('pan', 'tadeusz'), 8),\n", + " (('z', 'daleka'), 8),\n", + " (('bo', 'w'), 8),\n", + " (('w', 'niebo'), 8),\n", + " (('z', 'rąk'), 8),\n", + " (('nie', 'wiedział'), 8),\n", + " (('w', 'czasie'), 8),\n", + " (('z', 'panem'), 8),\n", + " (('mi', 'się'), 8),\n", + " (('o', 'nim'), 8),\n", + " (('nie', 'wiem'), 8),\n", + " (('pierwszy', 'raz'), 8),\n", + " (('to', 'rzecz'), 8),\n", + " (('po', 'cichu'), 8),\n", + " (('nie', 'mogę'), 8),\n", + " (('tadeusz', 'z'), 8),\n", + " (('aż', 'się'), 8),\n", + " (('mu', 'się'), 8),\n", + " (('do', 'mnie'), 8),\n", + " (('na', 'nich'), 8),\n", + " (('nie', 'będzie'), 8),\n", + " (('wpadł', 'w'), 8),\n", + " (('jak', 'to'), 8),\n", + " (('w', 'lasach'), 8),\n", + " (('w', 'nim'), 8),\n", + " (('jest', 'to'), 8),\n", + " (('a', 'nie'), 8),\n", + " (('w', 'dobrzynie'), 8),\n", + " (('widać', 'z'), 7),\n", + " (('nie', 'widział'), 7),\n", + " (('z', 'rana'), 7),\n", + " (('czuł', 'że'), 7),\n", + " (('ale', 'nie'), 7),\n", + " (('się', 'pan'), 7),\n", + " (('pan', 'wojski'), 7),\n", + " (('więc', 'do'), 7),\n", + " (('się', 'już'), 7),\n", + " (('że', 'nie'), 7),\n", + " (('na', 'tym'), 7),\n", + " (('była', 'to'), 7),\n", + " (('w', 'milczeniu'), 7),\n", + " (('ich', 'nie'), 7),\n", + " (('już', 'w'), 7),\n", + " (('na', 'wsi'), 7),\n", + " (('i', 'jak'), 7),\n", + " (('miał', 'w'), 7),\n", + " (('w', 'powiecie'), 7),\n", + " (('ozwał', 'się'), 7),\n", + " (('jak', 'z'), 7),\n", + " (('ksiądz', 'robak'), 7),\n", + " (('hrabia', 'na'), 7),\n", + " (('rzekł', 'hrabia'), 7),\n", + " (('z', 'tego'), 7),\n", + " (('to', 'w'), 7),\n", + " (('nikt', 'z'), 7),\n", + " (('zdaje', 'się'), 7),\n", + " (('w', 'sercu'), 7),\n", + " (('i', 'cóż'), 7),\n", + " (('a', 'to'), 7),\n", + " (('to', 'mi'), 7),\n", + " (('tu', 'nie'), 7),\n", + " (('nie', 'z'), 7),\n", + " (('w', 'oczach'), 7),\n", + " (('ku', 'niemu'), 7),\n", + " (('po', 'raz'), 7),\n", + " (('mu', 'na'), 7),\n", + " (('bo', 'to'), 7),\n", + " (('ja', 'z'), 7),\n", + " (('i', 'to'), 7),\n", + " (('widać', 'było'), 6),\n", + " (('w', 'biegu'), 6),\n", + " (('lecz', 'w'), 6),\n", + " (('na', 'pole'), 6),\n", + " (('nie', 'chciał'), 6),\n", + " (('i', 'pan'), 6),\n", + " (('i', 'jeszcze'), 6),\n", + " (('pana', 'tadeusza'), 6),\n", + " (('weszli', 'w'), 6),\n", + " (('za', 'stołem'), 6),\n", + " (('tuż', 'przy'), 6),\n", + " (('ja', 'sam'), 6),\n", + " (('go', 'nie'), 6),\n", + " (('z', 'kim'), 6),\n", + " (('i', 'stąd'), 6),\n", + " (('było', 'że'), 6),\n", + " (('pan', 'bóg'), 6),\n", + " (('że', 'po'), 6),\n", + " (('ja', 'nie'), 6),\n", + " (('a', 'on'), 6),\n", + " (('z', 'rejentem'), 6),\n", + " (('w', 'którym'), 6),\n", + " (('w', 'pół'), 6),\n", + " (('na', 'prawo'), 6),\n", + " (('w', 'prawo'), 6),\n", + " (('na', 'lewo'), 6),\n", + " (('drugiej', 'strony'), 6),\n", + " (('tuż', 'nad'), 6),\n", + " (('że', 'tak'), 6),\n", + " (('gdy', 'w'), 6),\n", + " (('ja', 'w'), 6),\n", + " (('na', 'końcu'), 6),\n", + " (('i', 'za'), 6),\n", + " (('gdzie', 'się'), 6),\n", + " (('i', 'o'), 6),\n", + " (('nie', 'tylko'), 6),\n", + " (('ostatniego', 'z'), 6),\n", + " (('kto', 'z'), 6),\n", + " (('się', 'nad'), 6),\n", + " (('wszystko', 'to'), 6),\n", + " (('w', 'polu'), 6),\n", + " (('pan', 'nie'), 6),\n", + " (('z', 'głową'), 6),\n", + " (('zwał', 'się'), 6),\n", + " (('i', 'ten'), 6),\n", + " (('wie', 'co'), 6),\n", + " (('a', 'już'), 6),\n", + " (('jakby', 'w'), 6),\n", + " (('to', 'za'), 6),\n", + " (('w', 'nocy'), 6),\n", + " (('a', 'ja'), 6),\n", + " (('już', 'był'), 6),\n", + " (('ode', 'mnie'), 6),\n", + " (('w', 'nich'), 6),\n", + " (('by', 'się'), 6),\n", + " (('ku', 'nim'), 6),\n", + " (('w', 'ogrodzie'), 6),\n", + " (('z', 'telimeną'), 6),\n", + " (('o', 'to'), 6),\n", + " (('prawda', 'że'), 6),\n", + " (('nikt', 'nie'), 6),\n", + " (('zaraz', 'w'), 6),\n", + " (('na', 'świat'), 6),\n", + " (('wszak', 'to'), 6),\n", + " (('gdy', 'mu'), 6),\n", + " (('a', 'tymczasem'), 6),\n", + " (('za', 'sobą'), 6),\n", + " (('o', 'co'), 6),\n", + " (('na', 'soplicę'), 6),\n", + " (('się', 'a'), 6),\n", + " (('i', 'teraz'), 6),\n", + " (('u', 'stołu'), 5),\n", + " (('tylko', 'się'), 5),\n", + " (('i', 'zaraz'), 5),\n", + " (('z', 'rzadka'), 5),\n", + " (('przed', 'nim'), 5),\n", + " (('już', 'się'), 5),\n", + " (('się', 'wkoło'), 5),\n", + " (('domu', 'i'), 5),\n", + " (('od', 'słońca'), 5),\n", + " (('przez', 'okno'), 5),\n", + " (('gdy', 'z'), 5),\n", + " (('że', 'mu'), 5),\n", + " (('i', 'sam'), 5),\n", + " (('za', 'domem'), 5),\n", + " (('on', 'w'), 5),\n", + " (('po', 'kryjomu'), 5),\n", + " (('wiedział', 'że'), 5),\n", + " (('do', 'lasu'), 5),\n", + " (('wojski', 'z'), 5),\n", + " (('nie', 'mogą'), 5),\n", + " (('nad', 'nim'), 5),\n", + " (('w', 'jakim'), 5),\n", + " (('po', 'cóż'), 5),\n", + " (('po', 'kądzieli'), 5),\n", + " (('o', 'tem'), 5),\n", + " (('potem', 'w'), 5),\n", + " (('powiadał', 'że'), 5),\n", + " (('kłaniał', 'się'), 5),\n", + " (('przy', 'nim'), 5),\n", + " (('i', 'tadeusz'), 5),\n", + " (('na', 'miejscu'), 5),\n", + " (('z', 'których'), 5),\n", + " (('stary', 'i'), 5),\n", + " (('nie', 'na'), 5),\n", + " (('w', 'każdej'), 5),\n", + " (('między', 'szlachtą'), 5),\n", + " (('kiedy', 'się'), 5),\n", + " (('podkomorzy', 'i'), 5),\n", + " (('po', 'francusku'), 5),\n", + " (('a', 'więc'), 5),\n", + " (('kapitan', 'ryków'), 5),\n", + " (('stał', 'w'), 5),\n", + " (('lecz', 'na'), 5),\n", + " (('się', 'jako'), 5),\n", + " (('które', 'na'), 5),\n", + " (('zdała', 'się'), 5),\n", + " (('wszystko', 'się'), 5),\n", + " (('czuł', 'się'), 5),\n", + " (('na', 'koniu'), 5),\n", + " (('w', 'twarz'), 5),\n", + " (('się', 'lecz'), 5),\n", + " (('w', 'lewo'), 5),\n", + " (('i', 'ręce'), 5),\n", + " (('już', 'to'), 5),\n", + " (('mu', 'z'), 5),\n", + " (('i', 'hrabia'), 5),\n", + " (('też', 'nie'), 5),\n", + " (('ją', 'w'), 5),\n", + " (('cóż', 'by'), 5),\n", + " (('to', 'o'), 5),\n", + " (('na', 'swym'), 5),\n", + " (('tak', 'było'), 5),\n", + " (('jednej', 'strony'), 5),\n", + " (('w', 'zamek'), 5),\n", + " (('za', 'mych'), 5),\n", + " (('mych', 'czasów'), 5),\n", + " (('z', 'wami'), 5),\n", + " (('z', 'horeszków'), 5),\n", + " (('na', 'siebie'), 5),\n", + " (('więc', 'na'), 5),\n", + " (('na', 'wiatr'), 5),\n", + " (('że', 'ma'), 5),\n", + " (('w', 'istocie'), 5),\n", + " (('choć', 'nie'), 5),\n", + " (('w', 'jednej'), 5),\n", + " (('jeszcze', 'raz'), 5),\n", + " (('że', 'pan'), 5),\n", + " (('gerwazy', 'z'), 5),\n", + " (('niech', 'no'), 5),\n", + " (('nie', 'wie'), 5),\n", + " (('niech', 'się'), 5),\n", + " (('który', 'był'), 5),\n", + " (('było', 'to'), 5),\n", + " (('choć', 'w'), 5),\n", + " (('za', 'mną'), 5),\n", + " (('z', 'żalu'), 5),\n", + " (('z', 'tej'), 5),\n", + " (('na', 'nią'), 5),\n", + " (('kręci', 'się'), 5),\n", + " (('w', 'drugiej'), 5),\n", + " (('w', 'miejscu'), 5),\n", + " (('po', 'chwili'), 5),\n", + " (('w', 'polszcze'), 5),\n", + " (('ale', 'w'), 5),\n", + " (('w', 'izbie'), 5),\n", + " (('co', 'za'), 5),\n", + " (('jest', 'w'), 5),\n", + " (('się', 'być'), 5),\n", + " (('wierz', 'mi'), 5),\n", + " (('że', 'jej'), 5),\n", + " (('a', 'wtem'), 5),\n", + " (('od', 'razu'), 5),\n", + " (('na', 'dziedziniec'), 5),\n", + " (('w', 'ustach'), 5),\n", + " (('za', 'to'), 5),\n", + " (('nie', 'tak'), 5),\n", + " (('to', 'na'), 5),\n", + " (('z', 'łaski'), 5),\n", + " (('nawet', 'nie'), 5),\n", + " (('jest', 'na'), 5),\n", + " (('cóż', 'to'), 5),\n", + " (('się', 'to'), 5),\n", + " (('do', 'zosi'), 5),\n", + " (('a', 'jeśli'), 5),\n", + " (('w', 'soplicowie'), 5),\n", + " (('z', 'kolei'), 5),\n", + " (('więc', 'z'), 5),\n", + " (('w', 'kolej'), 5),\n", + " (('z', 'ust'), 5),\n", + " (('też', 'i'), 5),\n", + " (('u', 'mnie'), 5),\n", + " (('się', 'tak'), 5),\n", + " (('raz', 'po'), 5),\n", + " (('zwrócił', 'się'), 5),\n", + " (('za', 'nimi'), 5),\n", + " (('niech', 'żyje'), 5),\n", + " (('z', 'radości'), 5),\n", + " (('że', 'kto'), 5),\n", + " (('się', 'bo'), 5),\n", + " (('to', 'znaczy'), 5),\n", + " (('zawołał', 'klucznik'), 5),\n", + " (('na', 'bok'), 5),\n", + " (('cofa', 'się'), 5),\n", + " (('z', 'hrabią'), 5),\n", + " (('na', 'niebie'), 5),\n", + " (('wiem', 'że'), 5),\n", + " (('na', 'znak'), 5),\n", + " (('kropić', 'kropić'), 5),\n", + " (('już', 'jest'), 5),\n", + " (('na', 'przemiany'), 5),\n", + " (('ze', 'mną'), 5),\n", + " (('na', 'wpół'), 5),\n", + " (('nie', 'mogłem'), 5),\n", + " (('cha', 'cha'), 5),\n", + " (('o', 'kusego'), 4),\n", + " (('w', 'całej'), 4),\n", + " (('do', 'tych'), 4),\n", + " (('a', 'wszystko'), 4),\n", + " (('przed', 'laty'), 4),\n", + " (('z', 'drzewa'), 4),\n", + " (('też', 'same'), 4),\n", + " (('cofnął', 'się'), 4),\n", + " (('długo', 'w'), 4),\n", + " (('aż', 'na'), 4),\n", + " (('w', 'takim'), 4),\n", + " (('jej', 'nie'), 4),\n", + " (('jako', 'w'), 4),\n", + " (('domu', 'sędziego'), 4),\n", + " (('nim', 'się'), 4),\n", + " (('i', 'on'), 4),\n", + " (('bo', 'nie'), 4),\n", + " (('od', 'rana'), 4),\n", + " (('u', 'wieczerzy'), 4),\n", + " (('w', 'której'), 4),\n", + " (('właśnie', 'kiedy'), 4),\n", + " (('jest', 'z'), 4),\n", + " (('bawić', 'się'), 4),\n", + " (('i', 'wnet'), 4),\n", + " (('z', 'nieba'), 4),\n", + " (('właśnie', 'z'), 4),\n", + " (('z', 'lasu'), 4),\n", + " (('w', 'porządku'), 4),\n", + " (('szedł', 'z'), 4),\n", + " (('pan', 'podkomorzy'), 4),\n", + " (('tuż', 'za'), 4),\n", + " (('z', 'boru'), 4),\n", + " (('gości', 'nie'), 4),\n", + " (('z', 'domu'), 4),\n", + " (('już', 'późno'), 4),\n", + " (('po', 'drodze'), 4),\n", + " (('nic', 'to'), 4),\n", + " (('wyszedł', 'z'), 4),\n", + " (('sędzia', 'z'), 4),\n", + " (('nie', 'zaś'), 4),\n", + " (('że', 'hrabia'), 4),\n", + " (('znowu', 'w'), 4),\n", + " (('brał', 'miejsce'), 4),\n", + " (('z', 'wieku'), 4),\n", + " (('wieku', 'mu'), 4),\n", + " (('mu', 'i'), 4),\n", + " (('z', 'urzędu'), 4),\n", + " (('urzędu', 'ten'), 4),\n", + " (('ten', 'zaszczyt'), 4),\n", + " (('zaszczyt', 'należy'), 4),\n", + " (('należy', 'idąc'), 4),\n", + " (('idąc', 'kłaniał'), 4),\n", + " (('i', 'młodzieży'), 4),\n", + " (('po', 'łacinie'), 4),\n", + " (('nim', 'na'), 4),\n", + " (('bo', 'on'), 4),\n", + " (('z', 'boku'), 4),\n", + " (('na', 'tadeusza'), 4),\n", + " (('z', 'uśmiechem'), 4),\n", + " (('pod', 'strażą'), 4),\n", + " (('nie', 'w'), 4),\n", + " (('już', 'do'), 4),\n", + " (('bo', 'już'), 4),\n", + " (('która', 'się'), 4),\n", + " (('o', 'jej'), 4),\n", + " (('wiadomo', 'że'), 4),\n", + " (('tam', 'w'), 4),\n", + " (('za', 'granicę'), 4),\n", + " (('to', 'już'), 4),\n", + " (('tak', 'na'), 4),\n", + " (('rzekł', 'do'), 4),\n", + " (('do', 'warszawy'), 4),\n", + " (('ja', 'to'), 4),\n", + " (('ruskie', 'przysłowie'), 4),\n", + " (('tak', 'i'), 4),\n", + " (('raz', 'w'), 4),\n", + " (('końcu', 'stoła'), 4),\n", + " (('na', 'złość'), 4),\n", + " (('z', 'nami'), 4),\n", + " (('może', 'by'), 4),\n", + " (('w', 'wilnie'), 4),\n", + " (('bo', 'z'), 4),\n", + " (('by', 'nie'), 4),\n", + " (('nie', 'lada'), 4),\n", + " (('prosto', 'w'), 4),\n", + " (('nim', 'w'), 4),\n", + " (('na', 'stół'), 4),\n", + " (('strony', 'i'), 4),\n", + " (('tadeusz', 'i'), 4),\n", + " (('lasu', 'i'), 4),\n", + " (('je', 'w'), 4),\n", + " (('na', 'wielkim'), 4),\n", + " (('z', 'całej'), 4),\n", + " (('rzekł', 'z'), 4),\n", + " (('w', 'stolicy'), 4),\n", + " (('krzyknęli', 'wszyscy'), 4),\n", + " (('z', 'całym'), 4),\n", + " (('go', 'na'), 4),\n", + " (('oczu', 'nie'), 4),\n", + " (('z', 'jednej'), 4),\n", + " (('ten', 'zamek'), 4),\n", + " (('uciszcie', 'się'), 4),\n", + " (('na', 'ziemię'), 4),\n", + " (('jak', 'on'), 4),\n", + " (('i', 'gdzie'), 4),\n", + " (('nagle', 'z'), 4),\n", + " (('w', 'okolicy'), 4),\n", + " (('i', 'tylko'), 4),\n", + " (('z', 'nas'), 4),\n", + " (('ze', 'strzelbą'), 4),\n", + " (('bo', 'na'), 4),\n", + " (('nad', 'głową'), 4),\n", + " (('i', 'przez'), 4),\n", + " (('już', 'na'), 4),\n", + " (('za', 'drugim'), 4),\n", + " (('asesor', 'z'), 4),\n", + " (('asesor', 'i'), 4),\n", + " (('w', 'jego'), 4),\n", + " (('odbijał', 'się'), 4),\n", + " (('z', 'drogi'), 4),\n", + " (('od', 'lat'), 4),\n", + " (('stąd', 'też'), 4),\n", + " (('to', 'prawda'), 4),\n", + " (('w', 'ręce'), 4),\n", + " (('lub', 'w'), 4),\n", + " (('gerwazy', 'w'), 4),\n", + " (('szlachty', 'i'), 4),\n", + " (('na', 'ścianie'), 4),\n", + " (('do', 'stołu'), 4),\n", + " (('aż', 'tu'), 4),\n", + " (('czy', 'z'), 4),\n", + " (('we', 'mnie'), 4),\n", + " (('nie', 'mogąc'), 4),\n", + " (('w', 'ich'), 4),\n", + " (('prawą', 'rękę'), 4),\n", + " (('nie', 'dla'), 4),\n", + " (('śmiejąc', 'się'), 4),\n", + " (('w', 'ogród'), 4),\n", + " (('oczy', 'w'), 4),\n", + " (('znak', 'że'), 4),\n", + " (('o', 'łowach'), 4),\n", + " (('już', 'go'), 4),\n", + " (('nie', 'są'), 4),\n", + " (('przed', 'światem'), 4),\n", + " (('może', 'z'), 4),\n", + " (('to', 'się'), 4),\n", + " (('tam', 'z'), 4),\n", + " (('w', 'biurku'), 4),\n", + " (('do', 'ogrodu'), 4),\n", + " (('nie', 'chcę'), 4),\n", + " (('jeszcze', 'nie'), 4),\n", + " (('w', 'tłumie'), 4),\n", + " (('za', 'nią'), 4),\n", + " (('a', 'tak'), 4),\n", + " (('gdy', 'na'), 4),\n", + " (('przeze', 'drzwi'), 4),\n", + " (('gdy', 'już'), 4),\n", + " (('tyłu', 'za'), 4),\n", + " (('się', 'jeszcze'), 4),\n", + " (('się', 'ożenił'), 4),\n", + " (('i', 'gdy'), 4),\n", + " (('a', 'drugą'), 4),\n", + " (('telimena', 'w'), 4),\n", + " (('się', 'zdawało'), 4),\n", + " (('zdawało', 'że'), 4),\n", + " (('a', 'nawet'), 4),\n", + " (('teraz', 'w'), 4),\n", + " (('do', 'ust'), 4),\n", + " (('jak', 'wąż'), 4),\n", + " (('ale', 'z'), 4),\n", + " (('na', 'wskroś'), 4),\n", + " (('bo', 'gdy'), 4),\n", + " (('w', 'tyle'), 4),\n", + " (('było', 'po'), 4),\n", + " (('ten', 'z'), 4),\n", + " (('po', 'wierzchu'), 4),\n", + " (('było', 'w'), 4),\n", + " (('tu', 'z'), 4),\n", + " (('tylko', 'w'), 4),\n", + " (('bez', 'liku'), 4),\n", + " (('schyla', 'się'), 4),\n", + " (('się', 'bokiem'), 4),\n", + " (('od', 'której'), 4),\n", + " (('okiem', 'i'), 4),\n", + " (('od', 'czasu'), 4),\n", + " (('nie', 'chce'), 4),\n", + " (('bóg', 'wie'), 4),\n", + " (('żeby', 'się'), 4),\n", + " (('na', 'przykład'), 4),\n", + " (('za', 'młodu'), 4),\n", + " (('byłem', 'w'), 4),\n", + " (('to', 'nic'), 4),\n", + " (('w', 'karczmie'), 4),\n", + " (('i', 'ręką'), 4),\n", + " (('nie', 'można'), 4),\n", + " (('i', 'coraz'), 4),\n", + " (('to', 'jak'), 4),\n", + " (('co', 'jest'), 4),\n", + " (('na', 'pierś'), 4),\n", + " (('się', 'ale'), 4),\n", + " (('go', 'po'), 4),\n", + " (('co', 'mu'), 4),\n", + " (('zerwał', 'się'), 4),\n", + " (('w', 'górze'), 4),\n", + " (('i', 'bez'), 4),\n", + " (('ze', 'szlachty'), 4),\n", + " (('słychać', 'że'), 4),\n", + " (('z', 'niej'), 4),\n", + " (('spojrzał', 'na'), 4),\n", + " (('w', 'wojsku'), 4),\n", + " (('się', 'ja'), 4),\n", + " (('stąd', 'to'), 4),\n", + " (('o', 'tobie'), 4),\n", + " (('hrabię', 'i'), 4),\n", + " (('w', 'głąb'), 4),\n", + " (('wszystkim', 'się'), 4),\n", + " (('z', 'prawej'), 4),\n", + " (('strzelać', 'się'), 4),\n", + " (('horeszków', 'chociaż'), 4),\n", + " (('chociaż', 'po'), 4),\n", + " (('zjawił', 'się'), 4),\n", + " (('krzyknął', 'sędzia'), 4),\n", + " (('do', 'zgody'), 4),\n", + " (('ręką', 'jak'), 4),\n", + " (('że', 'już'), 4),\n", + " (('dwa', 'lata'), 4),\n", + " (('lecz', 'z'), 4),\n", + " (('telimena', 'nie'), 4),\n", + " (('nie', 'mogła'), 4),\n", + " (('o', 'głos'), 4),\n", + " (('na', 'ten'), 4),\n", + " (('się', 'oba'), 4),\n", + " (('po', 'staremu'), 4),\n", + " (('w', 'drogę'), 4),\n", + " (('siedział', 'na'), 4),\n", + " (('ja', 'go'), 4),\n", + " (('za', 'drzwi'), 4),\n", + " (('ja', 'cię'), 4),\n", + " (('krzyknął', 'w'), 4),\n", + " (('i', 'gerwazy'), 4),\n", + " (('rzekł', 'klucznik'), 4),\n", + " (('robak', 'z'), 4),\n", + " (('wznosi', 'się'), 4),\n", + " (('to', 'co'), 4),\n", + " (('co', 'do'), 4),\n", + " (('o', 'czym'), 4),\n", + " (('to', 'tylko'), 4),\n", + " (('co', 'myślisz'), 4),\n", + " (('tej', 'chwili'), 4),\n", + " (('mnie', 'na'), 4),\n", + " (('z', 'bliska'), 4),\n", + " (('ręce', 'obie'), 4),\n", + " (('panie', 'buchman'), 4),\n", + " (('prawą', 'ręką'), 4),\n", + " (('głupi', 'a'), 4),\n", + " (('na', 'was'), 4),\n", + " (('to', 'rzekł'), 4),\n", + " (('ten', 'za'), 4),\n", + " (('że', 'mnie'), 4),\n", + " (('lecz', 'sędzia'), 4),\n", + " (('ja', 'was'), 4),\n", + " (('rzekł', 'major'), 4),\n", + " (('plac', 'boju'), 4),\n", + " (('dobrzy', 'do'), 4),\n", + " (('pro', 'publico'), 4),\n", + " (('publico', 'bono'), 4),\n", + " (('spotkanie', 'się'), 3),\n", + " (('kusego', 'i'), 3),\n", + " (('i', 'sokoła'), 3),\n", + " (('ty', 'jesteś'), 3),\n", + " (('z', 'jego'), 3),\n", + " (('jak', 'mnie'), 3),\n", + " (('świeciły', 'się'), 3),\n", + " (('i', 'widać'), 3),\n", + " (('i', 'wszerz'), 3),\n", + " (('dobrze', 'na'), 3),\n", + " (('do', 'folwarku'), 3),\n", + " (('sam', 'na'), 3),\n", + " (('dalej', 'w'), 3),\n", + " (('któż', 'by'), 3),\n", + " (('stanął', 'w'), 3),\n", + " (('nie', 'widać'), 3),\n", + " (('na', 'parkanie'), 3),\n", + " (('nie', 'miała'), 3),\n", + " (('na', 'piersiach'), 3),\n", + " (('bo', 'od'), 3),\n", + " (('twarzy', 'nie'), 3),\n", + " (('daleko', 'na'), 3),\n", + " (('na', 'dole'), 3),\n", + " (('zląkł', 'się'), 3),\n", + " (('i', 'czuł'), 3),\n", + " (('bo', 'sędzia'), 3),\n", + " (('pod', 'lasem'), 3),\n", + " (('jeszcze', 'się'), 3),\n", + " (('do', 'woli'), 3),\n", + " (('boru', 'i'), 3),\n", + " (('u', 'niego'), 3),\n", + " (('jak', 'długo'), 3),\n", + " (('cieszą', 'się'), 3),\n", + " (('młodzież', 'na'), 3),\n", + " (('tak', 'każe'), 3),\n", + " (('tam', 'nie'), 3),\n", + " (('sędzia', 'w'), 3),\n", + " (('domy', 'i'), 3),\n", + " (('a', 'choć'), 3),\n", + " (('wzgląd', 'na'), 3),\n", + " (('było', 'z'), 3),\n", + " (('sędzia', 'choć'), 3),\n", + " (('chociaż', 'w'), 3),\n", + " (('się', 'sam'), 3),\n", + " (('w', 'niebytność'), 3),\n", + " (('w', 'pośrodku'), 3),\n", + " (('widne', 'były'), 3),\n", + " (('sień', 'wielka'), 3),\n", + " (('z', 'miny'), 3),\n", + " (('lecz', 'hrabia'), 3),\n", + " (('z', 'opieki'), 3),\n", + " (('i', 'goście'), 3),\n", + " (('goście', 'weszli'), 3),\n", + " (('porządku', 'i'), 3),\n", + " (('i', 'stanęli'), 3),\n", + " (('stanęli', 'kołem'), 3),\n", + " (('kołem', 'podkomorzy'), 3),\n", + " (('podkomorzy', 'najwyższe'), 3),\n", + " (('najwyższe', 'brał'), 3),\n", + " (('miejsce', 'za'), 3),\n", + " (('stołem', 'z'), 3),\n", + " (('się', 'damom'), 3),\n", + " (('damom', 'starcom'), 3),\n", + " (('starcom', 'i'), 3),\n", + " (('kwestarz', 'sędzia'), 3),\n", + " (('sędzia', 'tuż'), 3),\n", + " (('przy', 'bernardynie'), 3),\n", + " (('wszyscy', 'siedli'), 3),\n", + " (('siedli', 'i'), 3),\n", + " (('żwawo', 'jedli'), 3),\n", + " (('nim', 'i'), 3),\n", + " (('puste', 'miejsce'), 3),\n", + " (('ku', 'drzwiom'), 3),\n", + " (('po', 'tym'), 3),\n", + " (('od', 'stołu'), 3),\n", + " (('tadeusza', 'i'), 3),\n", + " (('do', 'stolicy'), 3),\n", + " (('co', 'dzień'), 3),\n", + " (('z', 'ludźmi'), 3),\n", + " (('za', 'kolana'), 3),\n", + " (('na', 'jego'), 3),\n", + " (('w', 'moim'), 3),\n", + " (('jest', 'bez'), 3),\n", + " (('trzeba', 'się'), 3),\n", + " (('ażeby', 'nie'), 3),\n", + " (('nie', 'pytaj'), 3),\n", + " (('milczeniu', 'głębokiem'), 3),\n", + " (('i', 'dalej'), 3),\n", + " (('stąd', 'się'), 3),\n", + " (('rzekł', 'mój'), 3),\n", + " (('kiedy', 'do'), 3),\n", + " (('prawa', 'i'), 3),\n", + " (('w', 'różne'), 3),\n", + " (('nie', 'śmieli'), 3),\n", + " (('chodził', 'po'), 3),\n", + " (('jak', 'od'), 3),\n", + " (('w', 'wielkiej'), 3),\n", + " (('a', 'my'), 3),\n", + " (('w', 'świecie'), 3),\n", + " (('nic', 'a'), 3),\n", + " (('a', 'nic'), 3),\n", + " (('to', 'są'), 3),\n", + " (('cóż', 'o'), 3),\n", + " (('są', 'tu'), 3),\n", + " (('to', 'pan'), 3),\n", + " (('prosił', 'na'), 3),\n", + " (('ojczyzna', 'ja'), 3),\n", + " (('to', 'my'), 3),\n", + " (('jak', 'po'), 3),\n", + " (('majora', 'płuta'), 3),\n", + " (('czy', 'na'), 3),\n", + " (('to', 'on'), 3),\n", + " (('nas', 'w'), 3),\n", + " (('się', 'stało'), 3),\n", + " (('dla', 'zabawki'), 3),\n", + " (('pukle', 'i'), 3),\n", + " (('że', 'zbyt'), 3),\n", + " (('suwała', 'się'), 3),\n", + " (('nie', 'stało'), 3),\n", + " (('trzeba', 'było'), 3),\n", + " (('nieco', 'i'), 3),\n", + " (('na', 'pana'), 3),\n", + " (('że', 'on'), 3),\n", + " (('z', 'podkomorzym'), 3),\n", + " (('strony', 'obie'), 3),\n", + " (('się', 'serce'), 3),\n", + " (('serce', 'mu'), 3),\n", + " (('a', 'u'), 3),\n", + " (('zdawała', 'się'), 3),\n", + " (('zda', 'się'), 3),\n", + " (('od', 'dzieciństwa'), 3),\n", + " (('i', 'serce'), 3),\n", + " (('ale', 'razem'), 3),\n", + " (('na', 'wychowanie'), 3),\n", + " (('siedząc', 'w'), 3),\n", + " (('te', 'wszystkie'), 3),\n", + " (('z', 'której'), 3),\n", + " (('ilekroć', 'z'), 3),\n", + " (('z', 'jej'), 3),\n", + " (('i', 'cztery'), 3),\n", + " (('tadeusz', 'na'), 3),\n", + " (('rzecz', 'o'), 3),\n", + " (('pół', 'godziny'), 3),\n", + " (('bo', 'tam'), 3),\n", + " (('się', 'nagle'), 3),\n", + " (('się', 'strony'), 3),\n", + " (('przy', 'boku'), 3),\n", + " (('i', 'asesor'), 3),\n", + " (('się', 'przed'), 3),\n", + " (('nad', 'uchem'), 3),\n", + " (('właśnie', 'w'), 3),\n", + " (('puścił', 'z'), 3),\n", + " (('w', 'języku'), 3),\n", + " (('jeszcze', 'z'), 3),\n", + " (('a', 'był'), 3),\n", + " (('pani', 'telimena'), 3),\n", + " (('nie', 'gadał'), 3),\n", + " (('on', 'się'), 3),\n", + " (('skłonił', 'i'), 3),\n", + " (('w', 'nią'), 3),\n", + " (('na', 'jutro'), 3),\n", + " (('polowanie', 'i'), 3),\n", + " (('głową', 'rzekł'), 3),\n", + " (('z', 'gorzkim'), 3),\n", + " (('gorzkim', 'uśmiechem'), 3),\n", + " (('rzekł', 'na'), 3),\n", + " (('a', 'od'), 3),\n", + " (('na', 'polowanie'), 3),\n", + " (('przed', 'oczyma'), 3),\n", + " (('jaśnie', 'wielmożny'), 3),\n", + " (('wielmożny', 'podkomorzy'), 3),\n", + " (('niech', 'mi'), 3),\n", + " (('nigdy', 'na'), 3),\n", + " (('lecz', 'go'), 3),\n", + " (('i', 'kończył'), 3),\n", + " (('na', 'świadki'), 3),\n", + " (('z', 'kieszeni'), 3),\n", + " (('sam', 'siebie'), 3),\n", + " (('do', 'stoła'), 3),\n", + " (('on', 'za'), 3),\n", + " (('jenerał', 'dąbrowski'), 3),\n", + " (('z', 'ziemi'), 3),\n", + " (('do', 'kraju'), 3),\n", + " (('skradał', 'się'), 3),\n", + " (('kryć', 'się'), 3),\n", + " (('na', 'wzgórek'), 3),\n", + " (('i', 'ziemię'), 3),\n", + " (('na', 'skarb'), 3),\n", + " (('wieść', 'o'), 3),\n", + " (('po', 'tych'), 3),\n", + " (('rozeszła', 'się'), 3),\n", + " (('w', 'sąsiedztwie'), 3),\n", + " (('ten', 'nie'), 3),\n", + " (('nie', 'dostał'), 3),\n", + " (('miał', 'coś'), 3),\n", + " (('pan', 'z'), 3),\n", + " (('jednym', 'razem'), 3),\n", + " (('razem', 'jakby'), 3),\n", + " (('i', 'słowa'), 3),\n", + " (('tym', 'co'), 3),\n", + " (('w', 'cudzych'), 3),\n", + " (('ostatni', 'z'), 3),\n", + " (('w', 'trawie'), 3),\n", + " (('w', 'niebie'), 3),\n", + " (('broń', 'na'), 3),\n", + " (('odezwały', 'się'), 3),\n", + " (('bo', 'też'), 3),\n", + " (('że', 'o'), 3),\n", + " (('kręcił', 'się'), 3),\n", + " (('w', 'wodę'), 3),\n", + " (('na', 'dziedzińcu'), 3),\n", + " (('choć', 'na'), 3),\n", + " (('idąc', 'na'), 3),\n", + " (('nie', 'zdoła'), 3),\n", + " (('dawno', 'już'), 3),\n", + " (('i', 'pod'), 3),\n", + " (('pod', 'opoką'), 3),\n", + " (('ten', 'pan'), 3),\n", + " (('do', 'nich'), 3),\n", + " (('i', 'znów'), 3),\n", + " (('jak', 'kot'), 3),\n", + " (('w', 'kieszenie'), 3),\n", + " (('lat', 'wielu'), 3),\n", + " (('o', 'jego'), 3),\n", + " (('dla', 'siebie'), 3),\n", + " (('z', 'głowy'), 3),\n", + " (('pan', 'mój'), 3),\n", + " (('z', 'soplicami'), 3),\n", + " (('z', 'konia'), 3),\n", + " (('w', 'progu'), 3),\n", + " (('lub', 'na'), 3),\n", + " (('na', 'łowy'), 3),\n", + " (('a', 'gdy'), 3),\n", + " (('chciał', 'mówić'), 3),\n", + " (('machnął', 'ręką'), 3),\n", + " (('że', 'je'), 3),\n", + " (('to', 'wszystko'), 3),\n", + " (('jacek', 'soplica'), 3),\n", + " (('pan', 'stolnik'), 3),\n", + " (('w', 'czas'), 3),\n", + " (('gdy', 'nagle'), 3),\n", + " (('więc', 'za'), 3),\n", + " (('z', 'dołu'), 3),\n", + " (('trzy', 'razy'), 3),\n", + " (('na', 'ganek'), 3),\n", + " (('po', 'wzroście'), 3),\n", + " (('na', 'cel'), 3),\n", + " (('dwa', 'razy'), 3),\n", + " (('na', 'odsiecz'), 3),\n", + " (('który', 'by'), 3),\n", + " (('się', 'tam'), 3),\n", + " (('dotąd', 'i'), 3),\n", + " (('tu', 'w'), 3),\n", + " (('a', 'ty'), 3),\n", + " (('szkoda', 'że'), 3),\n", + " (('o', 'jakimś'), 3),\n", + " (('a', 'gerwazy'), 3),\n", + " (('o', 'wszystkim'), 3),\n", + " (('przy', 'płocie'), 3),\n", + " (('aż', 'w'), 3),\n", + " (('na', 'ręku'), 3),\n", + " (('rękami', 'i'), 3),\n", + " (('dał', 'znak'), 3),\n", + " (('oczyma', 'i'), 3),\n", + " (('ale', 'już'), 3),\n", + " (('wszczął', 'się'), 3),\n", + " (('tak', 'jak'), 3),\n", + " (('i', 'sędzia'), 3),\n", + " (('dawnego', 'zwyczaju'), 3),\n", + " (('jest', 'do'), 3),\n", + " (('lub', 'z'), 3),\n", + " (('we', 'dwóch'), 3),\n", + " (('nikt', 'pewnie'), 3),\n", + " (('pewnie', 'nie'), 3),\n", + " (('ni', 'w'), 3),\n", + " (('się', 'dowiedział'), 3),\n", + " (('dowiedział', 'że'), 3),\n", + " (('i', 'nawet'), 3),\n", + " (('chował', 'się'), 3),\n", + " (('się', 'hrabia'), 3),\n", + " (('znam', 'ja'), 3),\n", + " (('jak', 'tam'), 3),\n", + " (('i', 'kręcił'), 3),\n", + " (('u', 'nóg'), 3),\n", + " (('w', 'podarunku'), 3),\n", + " (('pyta', 'się'), 3),\n", + " (('za', 'uszy'), 3),\n", + " (('że', 'sam'), 3),\n", + " (('głową', 'i'), 3),\n", + " (('wziąć', 'w'), 3),\n", + " (('w', 'areszt'), 3),\n", + " (('nas', 'nie'), 3),\n", + " (('z', 'lewej'), 3),\n", + " (('nie', 'dziw'), 3),\n", + " (('lecz', 'wojski'), 3),\n", + " (('się', 'mocno'), 3),\n", + " (('strzelców', 'i'), 3),\n", + " (('wielki', 'jak'), 3),\n", + " (('drzwi', 'na'), 3),\n", + " (('i', 'bardzo'), 3),\n", + " (('miał', 'ochoty'), 3),\n", + " (('między', 'dwiema'), 3),\n", + " (('się', 'oczy'), 3),\n", + " (('ze', 'skóry'), 3),\n", + " (('spotkać', 'się'), 3),\n", + " (('gdzie', 'jest'), 3),\n", + " (('od', 'pana'), 3),\n", + " (('wtenczas', 'na'), 3),\n", + " (('jej', 'w'), 3),\n", + " (('zostać', 'w'), 3),\n", + " (('rękę', 'a'), 3),\n", + " (('w', 'świątyni'), 3),\n", + " (('świątyni', 'dumania'), 3),\n", + " (('a', 'sam'), 3),\n", + " (('a', 'hrabia'), 3),\n", + " (('głowę', 'i'), 3),\n", + " (('tu', 'i'), 3),\n", + " (('tym', 'łacniej'), 3),\n", + " (('w', 'piasku'), 3),\n", + " (('się', 'razem'), 3),\n", + " (('w', 'powietrzu'), 3),\n", + " (('nie', 'wiedząc'), 3),\n", + " (('już', 'z'), 3),\n", + " (('przez', 'zagony'), 3),\n", + " (('się', 'nisko'), 3),\n", + " ...]" + ] + }, + "execution_count": 13, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "cnt.most_common()" + ] + }, + { + "cell_type": "code", + "execution_count": 14, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "Counter({('adam', 'mickiewicz'): 1,\n", + " ('mickiewicz', 'pan'): 1,\n", + " ('pan', 'tadeusz'): 8,\n", + " ('tadeusz', 'czyli'): 1,\n", + " ('czyli', 'ostatni'): 1,\n", + " ('ostatni', 'zajazd'): 1,\n", + " ('zajazd', 'na'): 1,\n", + " ('na', 'litwie'): 14,\n", + " ('litwie', 'księga'): 2,\n", + " ('księga', 'pierwsza'): 1,\n", + " ('pierwsza', 'gospodarstwo'): 1,\n", + " ('gospodarstwo', 'powrót'): 1,\n", + " ('powrót', 'panicza'): 1,\n", + " ('panicza', 'spotkanie'): 1,\n", + " ('spotkanie', 'się'): 3,\n", + " ('się', 'pierwsze'): 1,\n", + " ('pierwsze', 'w'): 1,\n", + " ('w', 'pokoiku'): 1,\n", + " ('pokoiku', 'drugie'): 1,\n", + " ('drugie', 'u'): 1,\n", + " ('u', 'stołu'): 5,\n", + " ('stołu', 'ważna'): 1,\n", + " ('ważna', 'sędziego'): 1,\n", + " ('sędziego', 'nauka'): 1,\n", + " ('nauka', 'o'): 1,\n", + " ('o', 'grzeczności'): 1,\n", + " ('grzeczności', 'podkomorzego'): 1,\n", + " ('podkomorzego', 'uwagi'): 1,\n", + " ('uwagi', 'polityczne'): 1,\n", + " ('polityczne', 'nad'): 1,\n", + " ('nad', 'modami'): 1,\n", + " ('modami', 'początek'): 1,\n", + " ('początek', 'sporu'): 1,\n", + " ('sporu', 'o'): 1,\n", + " ('o', 'kusego'): 4,\n", + " ('kusego', 'i'): 3,\n", + " ('i', 'sokoła'): 3,\n", + " ('sokoła', 'żale'): 1,\n", + " ('żale', 'wojskiego'): 1,\n", + " ('wojskiego', 'ostatni'): 1,\n", + " ('ostatni', 'woźny'): 1,\n", + " ('woźny', 'trybunału'): 2,\n", + " ('trybunału', 'rzut'): 1,\n", + " ('rzut', 'oka'): 2,\n", + " ('oka', 'na'): 1,\n", + " ('na', 'ówczesny'): 1,\n", + " ('ówczesny', 'stan'): 1,\n", + " ('stan', 'polityczny'): 1,\n", + " ('polityczny', 'litwy'): 1,\n", + " ('litwy', 'i'): 1,\n", + " ('i', 'europy'): 1,\n", + " ('europy', 'litwo'): 1,\n", + " ('litwo', 'ojczyzno'): 1,\n", + " ('ojczyzno', 'moja'): 1,\n", + " ('moja', 'ty'): 1,\n", + " ('ty', 'jesteś'): 3,\n", + " ('jesteś', 'jak'): 1,\n", + " ('jak', 'zdrowie'): 1,\n", + " ('zdrowie', 'ile'): 1,\n", + " ('ile', 'cię'): 1,\n", + " ('cię', 'trzeba'): 1,\n", + " ('trzeba', 'cenić'): 1,\n", + " ('cenić', 'ten'): 1,\n", + " ('ten', 'tylko'): 1,\n", + " ('tylko', 'się'): 5,\n", + " ('się', 'dowie'): 2,\n", + " ('dowie', 'kto'): 1,\n", + " ('kto', 'cię'): 1,\n", + " ('cię', 'stracił'): 1,\n", + " ('stracił', 'dziś'): 1,\n", + " ('dziś', 'piękność'): 1,\n", + " ('piękność', 'twą'): 1,\n", + " ('twą', 'w'): 1,\n", + " ('w', 'całej'): 4,\n", + " ('całej', 'ozdobie'): 1,\n", + " ('ozdobie', 'widzę'): 1,\n", + " ('widzę', 'i'): 1,\n", + " ('i', 'opisuję'): 1,\n", + " ('opisuję', 'bo'): 1,\n", + " ('bo', 'tęsknię'): 1,\n", + " ('tęsknię', 'po'): 1,\n", + " ('po', 'tobie'): 1,\n", + " ('tobie', 'panno'): 1,\n", + " ('panno', 'święta'): 1,\n", + " ('święta', 'co'): 1,\n", + " ('co', 'jasnej'): 1,\n", + " ('jasnej', 'bronisz'): 1,\n", + " ('bronisz', 'częstochowy'): 1,\n", + " ('częstochowy', 'i'): 1,\n", + " ('i', 'w'): 44,\n", + " ('w', 'ostrej'): 1,\n", + " ('ostrej', 'świecisz'): 1,\n", + " ('świecisz', 'bramie'): 1,\n", + " ('bramie', 'ty'): 1,\n", + " ('ty', 'co'): 1,\n", + " ('co', 'gród'): 1,\n", + " ('gród', 'zamkowy'): 1,\n", + " ('zamkowy', 'nowogródzki'): 1,\n", + " ('nowogródzki', 'ochraniasz'): 1,\n", + " ('ochraniasz', 'z'): 1,\n", + " ('z', 'jego'): 3,\n", + " ('jego', 'wiernym'): 1,\n", + " ('wiernym', 'ludem'): 1,\n", + " ('ludem', 'jak'): 1,\n", + " ('jak', 'mnie'): 3,\n", + " ('mnie', 'dziecko'): 1,\n", + " ('dziecko', 'do'): 1,\n", + " ('do', 'zdrowia'): 1,\n", + " ('zdrowia', 'powróciłaś'): 1,\n", + " ('powróciłaś', 'cudem'): 1,\n", + " ('cudem', 'gdy'): 1,\n", + " ('gdy', 'od'): 1,\n", + " ('od', 'płaczącej'): 1,\n", + " ('płaczącej', 'matki'): 1,\n", + " ('matki', 'pod'): 1,\n", + " ('pod', 'twoją'): 1,\n", + " ('twoją', 'opiekę'): 1,\n", + " ('opiekę', 'ofiarowany'): 1,\n", + " ('ofiarowany', 'martwą'): 1,\n", + " ('martwą', 'podniosłem'): 1,\n", + " ('podniosłem', 'powiekę'): 1,\n", + " ('powiekę', 'i'): 1,\n", + " ('i', 'zaraz'): 5,\n", + " ('zaraz', 'mogłem'): 1,\n", + " ('mogłem', 'pieszo'): 1,\n", + " ('pieszo', 'do'): 1,\n", + " ('do', 'twych'): 1,\n", + " ('twych', 'świątyń'): 1,\n", + " ('świątyń', 'progu'): 1,\n", + " ('progu', 'iść'): 1,\n", + " ('iść', 'za'): 1,\n", + " ('za', 'wrócone'): 1,\n", + " ('wrócone', 'życie'): 1,\n", + " ('życie', 'podziękować'): 1,\n", + " ('podziękować', 'bogu'): 1,\n", + " ('bogu', 'tak'): 1,\n", + " ('tak', 'nas'): 2,\n", + " ('nas', 'powrócisz'): 1,\n", + " ('powrócisz', 'cudem'): 1,\n", + " ('cudem', 'na'): 1,\n", + " ('na', 'ojczyzny'): 1,\n", + " ('ojczyzny', 'łono'): 1,\n", + " ('łono', 'tymczasem'): 1,\n", + " ('tymczasem', 'przenoś'): 1,\n", + " ('przenoś', 'moją'): 1,\n", + " ('moją', 'duszę'): 1,\n", + " ('duszę', 'utęsknioną'): 1,\n", + " ('utęsknioną', 'do'): 1,\n", + " ('do', 'tych'): 4,\n", + " ('tych', 'pagórków'): 1,\n", + " ('pagórków', 'leśnych'): 1,\n", + " ('leśnych', 'do'): 1,\n", + " ('tych', 'łąk'): 1,\n", + " ('łąk', 'zielonych'): 1,\n", + " ('zielonych', 'szeroko'): 1,\n", + " ('szeroko', 'nad'): 1,\n", + " ('nad', 'błękitnym'): 1,\n", + " ('błękitnym', 'niemnem'): 1,\n", + " ('niemnem', 'rozciągnionych'): 1,\n", + " ('rozciągnionych', 'do'): 1,\n", + " ('tych', 'pól'): 1,\n", + " ('pól', 'malowanych'): 1,\n", + " ('malowanych', 'zbożem'): 1,\n", + " ('zbożem', 'rozmaitem'): 1,\n", + " ('rozmaitem', 'wyzłacanych'): 1,\n", + " ('wyzłacanych', 'pszenicą'): 1,\n", + " ('pszenicą', 'posrebrzanych'): 1,\n", + " ('posrebrzanych', 'żytem'): 1,\n", + " ('żytem', 'gdzie'): 1,\n", + " ('gdzie', 'bursztynowy'): 1,\n", + " ('bursztynowy', 'świerzop'): 1,\n", + " ('świerzop', 'gryka'): 1,\n", + " ('gryka', 'jak'): 1,\n", + " ('jak', 'śnieg'): 2,\n", + " ('śnieg', 'biała'): 1,\n", + " ('biała', 'gdzie'): 1,\n", + " ('gdzie', 'panieńskim'): 1,\n", + " ('panieńskim', 'rumieńcem'): 1,\n", + " ('rumieńcem', 'dzięcielina'): 1,\n", + " ('dzięcielina', 'pała'): 1,\n", + " ('pała', 'a'): 1,\n", + " ('a', 'wszystko'): 4,\n", + " ('wszystko', 'przepasane'): 1,\n", + " ('przepasane', 'jakby'): 1,\n", + " ('jakby', 'wstęgą'): 1,\n", + " ('wstęgą', 'miedzą'): 1,\n", + " ('miedzą', 'zieloną'): 1,\n", + " ('zieloną', 'na'): 1,\n", + " ('na', 'niej'): 1,\n", + " ('niej', 'z'): 2,\n", + " ('z', 'rzadka'): 5,\n", + " ('rzadka', 'ciche'): 1,\n", + " ('ciche', 'grusze'): 1,\n", + " ('grusze', 'siedzą'): 1,\n", + " ('siedzą', 'śród'): 2,\n", + " ('śród', 'takich'): 1,\n", + " ('takich', 'pól'): 1,\n", + " ('pól', 'przed'): 1,\n", + " ('przed', 'laty'): 4,\n", + " ('laty', 'nad'): 1,\n", + " ('nad', 'brzegiem'): 2,\n", + " ('brzegiem', 'ruczaju'): 1,\n", + " ('ruczaju', 'na'): 1,\n", + " ('na', 'pagórku'): 1,\n", + " ('pagórku', 'niewielkim'): 1,\n", + " ('niewielkim', 'we'): 1,\n", + " ('we', 'brzozowym'): 1,\n", + " ('brzozowym', 'gaju'): 1,\n", + " ('gaju', 'stał'): 1,\n", + " ('stał', 'dwór'): 1,\n", + " ('dwór', 'szlachecki'): 1,\n", + " ('szlachecki', 'z'): 1,\n", + " ('z', 'drzewa'): 4,\n", + " ('drzewa', 'lecz'): 1,\n", + " ('lecz', 'podmurowany'): 1,\n", + " ('podmurowany', 'świeciły'): 1,\n", + " ('świeciły', 'się'): 3,\n", + " ('się', 'z'): 56,\n", + " ('z', 'daleka'): 8,\n", + " ('daleka', 'pobielane'): 1,\n", + " ('pobielane', 'ściany'): 1,\n", + " ('ściany', 'tym'): 1,\n", + " ('tym', 'bielsze'): 1,\n", + " ('bielsze', 'że'): 1,\n", + " ('że', 'odbite'): 1,\n", + " ('odbite', 'od'): 1,\n", + " ('od', 'ciemnej'): 1,\n", + " ('ciemnej', 'zieleni'): 1,\n", + " ('zieleni', 'topoli'): 1,\n", + " ('topoli', 'co'): 1,\n", + " ('co', 'go'): 2,\n", + " ('go', 'bronią'): 1,\n", + " ('bronią', 'od'): 1,\n", + " ('od', 'wiatrów'): 1,\n", + " ('wiatrów', 'jesieni'): 1,\n", + " ('jesieni', 'dom'): 1,\n", + " ('dom', 'mieszkalny'): 1,\n", + " ('mieszkalny', 'niewielki'): 1,\n", + " ('niewielki', 'lecz'): 1,\n", + " ('lecz', 'zewsząd'): 1,\n", + " ('zewsząd', 'chędogi'): 1,\n", + " ('chędogi', 'i'): 1,\n", + " ('i', 'stodołę'): 1,\n", + " ('stodołę', 'miał'): 1,\n", + " ('miał', 'wielką'): 1,\n", + " ('wielką', 'i'): 1,\n", + " ('i', 'przy'): 1,\n", + " ('przy', 'niej'): 1,\n", + " ('niej', 'trzy'): 1,\n", + " ('trzy', 'stogi'): 1,\n", + " ('stogi', 'użątku'): 1,\n", + " ('użątku', 'co'): 1,\n", + " ('co', 'pod'): 1,\n", + " ('pod', 'strzechą'): 2,\n", + " ('strzechą', 'zmieścić'): 1,\n", + " ('zmieścić', 'się'): 1,\n", + " ('się', 'nie'): 20,\n", + " ('nie', 'może'): 10,\n", + " ('może', 'widać'): 1,\n", + " ('widać', 'że'): 12,\n", + " ('że', 'okolica'): 1,\n", + " ('okolica', 'obfita'): 1,\n", + " ('obfita', 'we'): 1,\n", + " ('we', 'zboże'): 1,\n", + " ('zboże', 'i'): 2,\n", + " ('i', 'widać'): 3,\n", + " ('widać', 'z'): 7,\n", + " ('z', 'liczby'): 2,\n", + " ('liczby', 'kopic'): 1,\n", + " ('kopic', 'co'): 1,\n", + " ('co', 'wzdłuż'): 1,\n", + " ('wzdłuż', 'i'): 2,\n", + " ('i', 'wszerz'): 3,\n", + " ('wszerz', 'smugów'): 1,\n", + " ('smugów', 'świecą'): 1,\n", + " ('świecą', 'gęsto'): 1,\n", + " ('gęsto', 'jak'): 1,\n", + " ('jak', 'gwiazdy'): 1,\n", + " ('gwiazdy', 'widać'): 1,\n", + " ('liczby', 'pługów'): 1,\n", + " ('pługów', 'orzących'): 1,\n", + " ('orzących', 'wcześnie'): 1,\n", + " ('wcześnie', 'łany'): 1,\n", + " ('łany', 'ogromne'): 1,\n", + " ('ogromne', 'ugoru'): 1,\n", + " ('ugoru', 'czarnoziemne'): 1,\n", + " ('czarnoziemne', 'zapewne'): 1,\n", + " ('zapewne', 'należne'): 1,\n", + " ('należne', 'do'): 1,\n", + " ('do', 'dworu'): 9,\n", + " ('dworu', 'uprawne'): 1,\n", + " ('uprawne', 'dobrze'): 1,\n", + " ('dobrze', 'na'): 3,\n", + " ('na', 'kształt'): 20,\n", + " ('kształt', 'ogrodowych'): 1,\n", + " ('ogrodowych', 'grządek'): 1,\n", + " ('grządek', 'że'): 1,\n", + " ('że', 'w'): 19,\n", + " ('w', 'tym'): 20,\n", + " ('tym', 'domu'): 1,\n", + " ('domu', 'dostatek'): 1,\n", + " ('dostatek', 'mieszka'): 1,\n", + " ('mieszka', 'i'): 1,\n", + " ('i', 'porządek'): 1,\n", + " ('porządek', 'brama'): 1,\n", + " ('brama', 'na'): 1,\n", + " ('na', 'wciąż'): 1,\n", + " ('wciąż', 'otwarta'): 1,\n", + " ('otwarta', 'przechodniom'): 1,\n", + " ('przechodniom', 'ogłasza'): 1,\n", + " ('ogłasza', 'że'): 1,\n", + " ('że', 'gościnna'): 1,\n", + " ('gościnna', 'i'): 1,\n", + " ('i', 'wszystkich'): 2,\n", + " ('wszystkich', 'w'): 2,\n", + " ('w', 'gościnę'): 1,\n", + " ('gościnę', 'zaprasza'): 1,\n", + " ('zaprasza', 'właśnie'): 1,\n", + " ('właśnie', 'dwukonną'): 1,\n", + " ('dwukonną', 'bryką'): 1,\n", + " ('bryką', 'wjechał'): 1,\n", + " ('wjechał', 'młody'): 1,\n", + " ('młody', 'panek'): 1,\n", + " ('panek', 'i'): 1,\n", + " ('i', 'obiegłszy'): 1,\n", + " ('obiegłszy', 'dziedziniec'): 1,\n", + " ('dziedziniec', 'zawrócił'): 1,\n", + " ('zawrócił', 'przed'): 1,\n", + " ('przed', 'ganek'): 2,\n", + " ('ganek', 'wysiadł'): 1,\n", + " ('wysiadł', 'z'): 1,\n", + " ('z', 'powozu'): 1,\n", + " ('powozu', 'konie'): 1,\n", + " ('konie', 'porzucone'): 1,\n", + " ('porzucone', 'same'): 1,\n", + " ('same', 'szczypiąc'): 1,\n", + " ('szczypiąc', 'trawę'): 1,\n", + " ('trawę', 'ciągnęły'): 1,\n", + " ('ciągnęły', 'powoli'): 1,\n", + " ('powoli', 'pod'): 1,\n", + " ('pod', 'bramę'): 2,\n", + " ('bramę', 'we'): 1,\n", + " ('we', 'dworze'): 10,\n", + " ('dworze', 'pusto'): 1,\n", + " ('pusto', 'bo'): 1,\n", + " ('bo', 'drzwi'): 2,\n", + " ('drzwi', 'od'): 1,\n", + " ('od', 'ganku'): 1,\n", + " ('ganku', 'zamknięto'): 1,\n", + " ('zamknięto', 'zaszczepkami'): 1,\n", + " ('zaszczepkami', 'i'): 1,\n", + " ('i', 'kołkiem'): 1,\n", + " ('kołkiem', 'zaszczepki'): 1,\n", + " ('zaszczepki', 'przetknięto'): 1,\n", + " ('przetknięto', 'podróżny'): 1,\n", + " ('podróżny', 'do'): 1,\n", + " ('do', 'folwarku'): 3,\n", + " ('folwarku', 'nie'): 2,\n", + " ('nie', 'biegł'): 1,\n", + " ('biegł', 'sług'): 1,\n", + " ('sług', 'zapytać'): 1,\n", + " ('zapytać', 'odemknął'): 1,\n", + " ('odemknął', 'wbiegł'): 1,\n", + " ('wbiegł', 'do'): 1,\n", + " ('do', 'domu'): 12,\n", + " ('domu', 'pragnął'): 1,\n", + " ('pragnął', 'go'): 1,\n", + " ('go', 'powitać'): 1,\n", + " ('powitać', 'dawno'): 1,\n", + " ('dawno', 'domu'): 1,\n", + " ('domu', 'nie'): 1,\n", + " ('nie', 'widział'): 7,\n", + " ('widział', 'bo'): 2,\n", + " ('bo', 'w'): 8,\n", + " ('w', 'dalekim'): 1,\n", + " ('dalekim', 'mieście'): 1,\n", + " ('mieście', 'kończył'): 1,\n", + " ('kończył', 'nauki'): 1,\n", + " ('nauki', 'końca'): 1,\n", + " ('końca', 'doczekał'): 1,\n", + " ('doczekał', 'nareszcie'): 1,\n", + " ('nareszcie', 'wbiega'): 1,\n", + " ('wbiega', 'i'): 1,\n", + " ('i', 'okiem'): 2,\n", + " ('okiem', 'chciwie'): 1,\n", + " ('chciwie', 'ściany'): 1,\n", + " ('ściany', 'starodawne'): 1,\n", + " ('starodawne', 'ogląda'): 1,\n", + " ('ogląda', 'czule'): 1,\n", + " ('czule', 'jako'): 1,\n", + " ('jako', 'swe'): 1,\n", + " ('swe', 'znajome'): 1,\n", + " ('znajome', 'dawne'): 1,\n", + " ('dawne', 'też'): 1,\n", + " ('też', 'same'): 4,\n", + " ('same', 'widzi'): 1,\n", + " ('widzi', 'sprzęty'): 1,\n", + " ('sprzęty', 'też'): 1,\n", + " ('same', 'obicia'): 1,\n", + " ('obicia', 'z'): 1,\n", + " ('z', 'którymi'): 1,\n", + " ('którymi', 'się'): 1,\n", + " ('się', 'zabawiać'): 1,\n", + " ('zabawiać', 'lubił'): 1,\n", + " ('lubił', 'od'): 1,\n", + " ('od', 'powicia'): 1,\n", + " ('powicia', 'lecz'): 1,\n", + " ('lecz', 'mniej'): 1,\n", + " ('mniej', 'wielkie'): 1,\n", + " ('wielkie', 'mniej'): 1,\n", + " ('mniej', 'piękne'): 1,\n", + " ('piękne', 'niż'): 1,\n", + " ('niż', 'się'): 2,\n", + " ('się', 'dawniej'): 1,\n", + " ('dawniej', 'zdały'): 1,\n", + " ('zdały', 'i'): 1,\n", + " ('i', 'też'): 1,\n", + " ('same', 'portrety'): 1,\n", + " ('portrety', 'na'): 1,\n", + " ('na', 'ścianach'): 1,\n", + " ('ścianach', 'wisiały'): 1,\n", + " ('wisiały', 'tu'): 1,\n", + " ('tu', 'kościuszko'): 1,\n", + " ('kościuszko', 'w'): 1,\n", + " ('w', 'czamarce'): 1,\n", + " ('czamarce', 'krakowskiej'): 1,\n", + " ('krakowskiej', 'z'): 1,\n", + " ('z', 'oczyma'): 2,\n", + " ('oczyma', 'podniesionymi'): 1,\n", + " ('podniesionymi', 'w'): 1,\n", + " ('w', 'niebo'): 8,\n", + " ('niebo', 'miecz'): 1,\n", + " ('miecz', 'oburącz'): 1,\n", + " ('oburącz', 'trzyma'): 1,\n", + " ('trzyma', 'takim'): 1,\n", + " ('takim', 'był'): 1,\n", + " ('był', 'gdy'): 1,\n", + " ('gdy', 'przysięgał'): 1,\n", + " ('przysięgał', 'na'): 1,\n", + " ('na', 'stopniach'): 1,\n", + " ('stopniach', 'ołtarzów'): 1,\n", + " ('ołtarzów', 'że'): 1,\n", + " ('że', 'tym'): 1,\n", + " ('tym', 'mieczem'): 1,\n", + " ('mieczem', 'wypędzi'): 1,\n", + " ('wypędzi', 'z'): 1,\n", + " ('z', 'polski'): 2,\n", + " ('polski', 'trzech'): 1,\n", + " ('trzech', 'mocarzów'): 1,\n", + " ('mocarzów', 'albo'): 1,\n", + " ('albo', 'sam'): 1,\n", + " ('sam', 'na'): 3,\n", + " ('na', 'nim'): 10,\n", + " ('nim', 'padnie'): 1,\n", + " ('padnie', 'dalej'): 1,\n", + " ('dalej', 'w'): 3,\n", + " ('w', 'polskiej'): 1,\n", + " ('polskiej', 'szacie'): 1,\n", + " ('szacie', 'siedzi'): 1,\n", + " ('siedzi', 'rejtan'): 1,\n", + " ('rejtan', 'żałośny'): 1,\n", + " ('żałośny', 'po'): 1,\n", + " ('po', 'wolności'): 1,\n", + " ('wolności', 'stracie'): 1,\n", + " ('stracie', 'w'): 1,\n", + " ('w', 'ręku'): 15,\n", + " ('ręku', 'trzyma'): 1,\n", + " ('trzyma', 'nóż'): 1,\n", + " ('nóż', 'ostrzem'): 1,\n", + " ('ostrzem', 'zwrócony'): 1,\n", + " ('zwrócony', 'do'): 2,\n", + " ('do', 'łona'): 1,\n", + " ('łona', 'a'): 1,\n", + " ('a', 'przed'): 2,\n", + " ('przed', 'nim'): 5,\n", + " ('nim', 'leży'): 1,\n", + " ('leży', 'fedon'): 1,\n", + " ('fedon', 'i'): 1,\n", + " ('i', 'żywot'): 1,\n", + " ('żywot', 'katona'): 1,\n", + " ('katona', 'dalej'): 1,\n", + " ('dalej', 'jasiński'): 1,\n", + " ('jasiński', 'młodzian'): 1,\n", + " ('młodzian', 'piękny'): 1,\n", + " ('piękny', 'i'): 1,\n", + " ('i', 'posępny'): 2,\n", + " ('posępny', 'obok'): 1,\n", + " ('obok', 'korsak'): 1,\n", + " ('korsak', 'towarzysz'): 1,\n", + " ('towarzysz', 'jego'): 1,\n", + " ('jego', 'nieodstępny'): 1,\n", + " ('nieodstępny', 'stoją'): 1,\n", + " ('stoją', 'na'): 2,\n", + " ('na', 'szańcach'): 1,\n", + " ('szańcach', 'pragi'): 1,\n", + " ('pragi', 'na'): 1,\n", + " ('na', 'stosach'): 1,\n", + " ('stosach', 'moskali'): 1,\n", + " ('moskali', 'siekąc'): 1,\n", + " ('siekąc', 'wrogów'): 1,\n", + " ('wrogów', 'a'): 2,\n", + " ('a', 'praga'): 1,\n", + " ('praga', 'już'): 1,\n", + " ('już', 'się'): 5,\n", + " ('się', 'wkoło'): 5,\n", + " ('wkoło', 'pali'): 1,\n", + " ('pali', 'nawet'): 1,\n", + " ('nawet', 'stary'): 1,\n", + " ('stary', 'stojący'): 1,\n", + " ('stojący', 'zegar'): 1,\n", + " ('zegar', 'kurantowy'): 1,\n", + " ('kurantowy', 'w'): 1,\n", + " ('w', 'drewnianej'): 1,\n", + " ('drewnianej', 'szafie'): 1,\n", + " ('szafie', 'poznał'): 1,\n", + " ('poznał', 'u'): 1,\n", + " ('u', 'wniścia'): 1,\n", + " ('wniścia', 'alkowy'): 1,\n", + " ('alkowy', 'i'): 1,\n", + " ('i', 'z'): 54,\n", + " ('z', 'dziecinną'): 1,\n", + " ('dziecinną', 'radością'): 1,\n", + " ('radością', 'pociągnął'): 1,\n", + " ('pociągnął', 'za'): 1,\n", + " ('za', 'sznurek'): 1,\n", + " ('sznurek', 'by'): 1,\n", + " ('by', 'stary'): 1,\n", + " ('stary', 'dąbrowskiego'): 1,\n", + " ('dąbrowskiego', 'usłyszeć'): 1,\n", + " ('usłyszeć', 'mazurek'): 1,\n", + " ('mazurek', 'biegał'): 1,\n", + " ('biegał', 'po'): 2,\n", + " ('po', 'całym'): 2,\n", + " ('całym', 'domu'): 1,\n", + " ('domu', 'i'): 5,\n", + " ('i', 'szukał'): 2,\n", + " ('szukał', 'komnaty'): 1,\n", + " ('komnaty', 'gdzie'): 1,\n", + " ('gdzie', 'mieszkał'): 1,\n", + " ('mieszkał', 'dzieckiem'): 1,\n", + " ('dzieckiem', 'będąc'): 1,\n", + " ('będąc', 'przed'): 1,\n", + " ('przed', 'dziesięciu'): 1,\n", + " ('dziesięciu', 'laty'): 1,\n", + " ('laty', 'wchodzi'): 1,\n", + " ('wchodzi', 'cofnął'): 1,\n", + " ('cofnął', 'się'): 4,\n", + " ('się', 'toczył'): 2,\n", + " ('toczył', 'zdumione'): 1,\n", + " ('zdumione', 'źrenice'): 1,\n", + " ('źrenice', 'po'): 1,\n", + " ('po', 'ścianach'): 1,\n", + " ('ścianach', 'w'): 1,\n", + " ('w', 'tej'): 13,\n", + " ('tej', 'komnacie'): 1,\n", + " ('komnacie', 'mieszkanie'): 1,\n", + " ('mieszkanie', 'kobiéce'): 1,\n", + " ('kobiéce', 'któż'): 1,\n", + " ('któż', 'by'): 3,\n", + " ('by', 'tu'): 1,\n", + " ('tu', 'mieszkał'): 1,\n", + " ('mieszkał', 'stary'): 1,\n", + " ('stary', 'stryj'): 1,\n", + " ('stryj', 'nie'): 1,\n", + " ('nie', 'był'): 10,\n", + " ('był', 'żonaty'): 1,\n", + " ('żonaty', 'a'): 1,\n", + " ('a', 'ciotka'): 1,\n", + " ('ciotka', 'w'): 1,\n", + " ('w', 'petersburgu'): 1,\n", + " ('petersburgu', 'mieszkała'): 1,\n", + " ('mieszkała', 'przed'): 1,\n", + " ('laty', 'to'): 1,\n", + " ('to', 'nie'): 13,\n", + " ('był', 'ochmistrzyni'): 1,\n", + " ('ochmistrzyni', 'pokój'): 1,\n", + " ('pokój', 'fortepiano'): 1,\n", + " ('fortepiano', 'na'): 1,\n", + " ('nim', 'nuty'): 1,\n", + " ('nuty', 'i'): 1,\n", + " ('i', 'książki'): 1,\n", + " ('książki', 'wszystko'): 1,\n", + " ('wszystko', 'porzucano'): 1,\n", + " ('porzucano', 'niedbale'): 1,\n", + " ('niedbale', 'i'): 1,\n", + " ('i', 'bezładnie'): 1,\n", + " ('bezładnie', 'nieporządek'): 1,\n", + " ('nieporządek', 'miły'): 1,\n", + " ('miły', 'niestare'): 1,\n", + " ('niestare', 'były'): 1,\n", + " ('były', 'rączki'): 1,\n", + " ('rączki', 'co'): 1,\n", + " ('co', 'je'): 2,\n", + " ('je', 'tak'): 1,\n", + " ('tak', 'rzuciły'): 1,\n", + " ('rzuciły', 'tuż'): 1,\n", + " ('tuż', 'i'): 2,\n", + " ('i', 'sukienka'): 1,\n", + " ('sukienka', 'biała'): 1,\n", + " ('biała', 'świeżo'): 1,\n", + " ('świeżo', 'z'): 1,\n", + " ('z', 'kołka'): 2,\n", + " ('kołka', 'zdjęta'): 1,\n", + " ('zdjęta', 'do'): 1,\n", + " ('do', 'ubrania'): 2,\n", + " ('ubrania', 'na'): 1,\n", + " ('na', 'krzesła'): 1,\n", + " ('krzesła', 'poręczu'): 1,\n", + " ('poręczu', 'rozpięta'): 1,\n", + " ('rozpięta', 'a'): 1,\n", + " ('a', 'na'): 15,\n", + " ('na', 'oknach'): 1,\n", + " ('oknach', 'donice'): 1,\n", + " ('donice', 'z'): 1,\n", + " ('z', 'pachnącymi'): 1,\n", + " ('pachnącymi', 'ziołki'): 1,\n", + " ('ziołki', 'geranium'): 1,\n", + " ('geranium', 'lewkonija'): 1,\n", + " ('lewkonija', 'astry'): 1,\n", + " ('astry', 'i'): 1,\n", + " ('i', 'fijołki'): 1,\n", + " ('fijołki', 'podróżny'): 1,\n", + " ('podróżny', 'stanął'): 1,\n", + " ('stanął', 'w'): 3,\n", + " ('w', 'jednym'): 2,\n", + " ('jednym', 'z'): 1,\n", + " ('z', 'okien'): 1,\n", + " ('okien', 'nowe'): 1,\n", + " ('nowe', 'dziwo'): 1,\n", + " ('dziwo', 'w'): 1,\n", + " ('w', 'sadzie'): 2,\n", + " ('sadzie', 'na'): 1,\n", + " ('na', 'brzegu'): 1,\n", + " ('brzegu', 'niegdyś'): 1,\n", + " ('niegdyś', 'zarosłym'): 1,\n", + " ('zarosłym', 'pokrzywą'): 1,\n", + " ('pokrzywą', 'był'): 1,\n", + " ('był', 'maleńki'): 1,\n", + " ('maleńki', 'ogródek'): 1,\n", + " ('ogródek', 'ścieżkami'): 1,\n", + " ('ścieżkami', 'porznięty'): 1,\n", + " ('porznięty', 'pełen'): 1,\n", + " ('pełen', 'bukietów'): 1,\n", + " ('bukietów', 'trawy'): 1,\n", + " ('trawy', 'angielskiej'): 1,\n", + " ('angielskiej', 'i'): 1,\n", + " ('i', 'mięty'): 1,\n", + " ('mięty', 'drewniany'): 1,\n", + " ('drewniany', 'drobny'): 1,\n", + " ('drobny', 'w'): 1,\n", + " ('w', 'cyfrę'): 1,\n", + " ('cyfrę', 'powiązany'): 1,\n", + " ('powiązany', 'płotek'): 1,\n", + " ('płotek', 'połyskał'): 1,\n", + " ('połyskał', 'się'): 2,\n", + " ('się', 'wstążkami'): 1,\n", + " ('wstążkami', 'jaskrawych'): 1,\n", + " ('jaskrawych', 'stokrotek'): 1,\n", + " ('stokrotek', 'grządki'): 1,\n", + " ('grządki', 'widać'): 1,\n", + " ('że', 'były'): 1,\n", + " ('były', 'świeżo'): 1,\n", + " ('świeżo', 'polewane'): 1,\n", + " ('polewane', 'tuż'): 1,\n", + " ('tuż', 'stało'): 1,\n", + " ('stało', 'wody'): 1,\n", + " ('wody', 'pełne'): 1,\n", + " ('pełne', 'naczynie'): 1,\n", + " ('naczynie', 'blaszane'): 1,\n", + " ('blaszane', 'ale'): 1,\n", + " ('ale', 'nigdzie'): 1,\n", + " ('nigdzie', 'nie'): 1,\n", + " ('nie', 'widać'): 3,\n", + " ('widać', 'było'): 6,\n", + " ('było', 'ogrodniczki'): 1,\n", + " ('ogrodniczki', 'tylko'): 1,\n", + " ('tylko', 'co'): 2,\n", + " ('co', 'wyszła'): 1,\n", + " ('wyszła', 'jeszcze'): 1,\n", + " ('jeszcze', 'kołyszą'): 1,\n", + " ('kołyszą', 'się'): 1,\n", + " ('się', 'drzwiczki'): 1,\n", + " ('drzwiczki', 'świeżo'): 1,\n", + " ('świeżo', 'trącone'): 1,\n", + " ('trącone', 'blisko'): 1,\n", + " ('blisko', 'drzwi'): 1,\n", + " ('drzwi', 'ślad'): 1,\n", + " ('ślad', 'widać'): 1,\n", + " ('widać', 'nóżki'): 1,\n", + " ('nóżki', 'na'): 1,\n", + " ('na', 'piasku'): 2,\n", + " ('piasku', 'bez'): 1,\n", + " ('bez', 'trzewika'): 1,\n", + " ('trzewika', 'była'): 1,\n", + " ('była', 'i'): 2,\n", + " ('i', 'pończoszki'): 1,\n", + " ('pończoszki', 'na'): 1,\n", + " ('piasku', 'drobnym'): 1,\n", + " ('drobnym', 'suchym'): 1,\n", + " ('suchym', 'białym'): 1,\n", + " ('białym', 'na'): 1,\n", + " ('kształt', 'śniegu'): 1,\n", + " ('śniegu', 'ślad'): 1,\n", + " ('ślad', 'wyraźny'): 1,\n", + " ('wyraźny', 'lecz'): 1,\n", + " ('lecz', 'lekki'): 1,\n", + " ('lekki', 'odgadniesz'): 1,\n", + " ('odgadniesz', 'że'): 1,\n", + " ('w', 'biegu'): 6,\n", + " ('biegu', 'chybkim'): 1,\n", + " ('chybkim', 'był'): 1,\n", + " ('był', 'zostawiony'): 1,\n", + " ('zostawiony', 'nóżkami'): 1,\n", + " ('nóżkami', 'drobnemi'): 1,\n", + " ('drobnemi', 'od'): 1,\n", + " ('od', 'kogoś'): 1,\n", + " ('kogoś', 'co'): 1,\n", + " ('co', 'zaledwie'): 1,\n", + " ('zaledwie', 'dotykał'): 1,\n", + " ('dotykał', 'się'): 1,\n", + " ('się', 'ziemi'): 1,\n", + " ('ziemi', 'podróżny'): 1,\n", + " ('podróżny', 'długo'): 1,\n", + " ('długo', 'w'): 4,\n", + " ('w', 'oknie'): 1,\n", + " ('oknie', 'stał'): 1,\n", + " ('stał', 'patrząc'): 1,\n", + " ('patrząc', 'dumając'): 1,\n", + " ('dumając', 'wonnymi'): 1,\n", + " ('wonnymi', 'powiewami'): 1,\n", + " ('powiewami', 'kwiatów'): 1,\n", + " ('kwiatów', 'oddychając'): 1,\n", + " ('oddychając', 'oblicze'): 1,\n", + " ('oblicze', 'aż'): 1,\n", + " ('aż', 'na'): 4,\n", + " ('na', 'krzaki'): 1,\n", + " ('krzaki', 'fijołkowe'): 1,\n", + " ('fijołkowe', 'skłonił'): 1,\n", + " ('skłonił', 'oczyma'): 1,\n", + " ('oczyma', 'ciekawymi'): 1,\n", + " ('ciekawymi', 'po'): 1,\n", + " ('po', 'drożynach'): 1,\n", + " ('drożynach', 'gonił'): 1,\n", + " ('gonił', 'i'): 2,\n", + " ('i', 'znowu'): 10,\n", + " ('znowu', 'je'): 1,\n", + " ('je', 'na'): 2,\n", + " ('na', 'drobnych'): 1,\n", + " ('drobnych', 'śladach'): 1,\n", + " ('śladach', 'zatrzymywał'): 1,\n", + " ('zatrzymywał', 'myślał'): 1,\n", + " ('myślał', 'o'): 1,\n", + " ('o', 'nich'): 2,\n", + " ('nich', 'i'): 1,\n", + " ('i', 'czyje'): 1,\n", + " ('czyje', 'były'): 1,\n", + " ('były', 'odgadywał'): 1,\n", + " ('odgadywał', 'przypadkiem'): 1,\n", + " ('przypadkiem', 'oczy'): 1,\n", + " ('oczy', 'podniósł'): 2,\n", + " ('podniósł', 'i'): 2,\n", + " ('i', 'tuż'): 1,\n", + " ('tuż', 'na'): 1,\n", + " ('na', 'parkanie'): 3,\n", + " ('parkanie', 'stała'): 1,\n", + " ('stała', 'młoda'): 1,\n", + " ('młoda', 'dziewczyna'): 1,\n", + " ('dziewczyna', 'białe'): 1,\n", + " ('białe', 'jej'): 1,\n", + " ('jej', 'ubranie'): 1,\n", + " ('ubranie', 'wysmukłą'): 1,\n", + " ('wysmukłą', 'postać'): 1,\n", + " ('postać', 'tylko'): 1,\n", + " ('tylko', 'aż'): 1,\n", + " ('aż', 'do'): 10,\n", + " ('do', 'piersi'): 2,\n", + " ('piersi', 'kryje'): 1,\n", + " ('kryje', 'odsłaniając'): 1,\n", + " ('odsłaniając', 'ramiona'): 1,\n", + " ('ramiona', 'i'): 2,\n", + " ('i', 'łabędzią'): 1,\n", + " ('łabędzią', 'szyję'): 1,\n", + " ('szyję', 'w'): 1,\n", + " ('w', 'takim'): 4,\n", + " ('takim', 'litwinka'): 1,\n", + " ('litwinka', 'tylko'): 1,\n", + " ('tylko', 'chodzić'): 1,\n", + " ('chodzić', 'zwykła'): 1,\n", + " ('zwykła', 'z'): 1,\n", + " ('z', 'rana'): 7,\n", + " ('rana', 'w'): 1,\n", + " ('takim', 'nigdy'): 1,\n", + " ('nigdy', 'nie'): 13,\n", + " ('nie', 'bywa'): 1,\n", + " ('bywa', 'od'): 1,\n", + " ('od', 'mężczyzn'): 1,\n", + " ('mężczyzn', 'widziana'): 1,\n", + " ('widziana', 'więc'): 1,\n", + " ('więc', 'choć'): 1,\n", + " ('choć', 'świadka'): 1,\n", + " ('świadka', 'nie'): 1,\n", + " ('nie', 'miała'): 3,\n", + " ('miała', 'założyła'): 1,\n", + " ('założyła', 'ręce'): 1,\n", + " ('ręce', 'na'): 2,\n", + " ('na', 'piersiach'): 3,\n", + " ('piersiach', 'przydawając'): 1,\n", + " ('przydawając', 'zasłony'): 1,\n", + " ('zasłony', 'sukience'): 1,\n", + " ('sukience', 'włos'): 1,\n", + " ('włos', 'w'): 1,\n", + " ('w', 'pukle'): 2,\n", + " ('pukle', 'nierozwity'): 1,\n", + " ('nierozwity', 'lecz'): 1,\n", + " ('lecz', 'w'): 6,\n", + " ('w', 'węzełki'): 1,\n", + " ('węzełki', 'małe'): 1,\n", + " ('małe', 'pokręcony'): 1,\n", + " ('pokręcony', 'schowany'): 1,\n", + " ('schowany', 'w'): 1,\n", + " ('w', 'drobne'): 2,\n", + " ('drobne', 'strączki'): 1,\n", + " ('strączki', 'białe'): 1,\n", + " ('białe', 'dziwnie'): 1,\n", + " ('dziwnie', 'ozdabiał'): 1,\n", + " ('ozdabiał', 'głowę'): 1,\n", + " ('głowę', 'bo'): 1,\n", + " ('bo', 'od'): 3,\n", + " ('od', 'słońca'): 5,\n", + " ('słońca', 'blasku'): 2,\n", + " ('blasku', 'świecił'): 1,\n", + " ('świecił', 'się'): 2,\n", + " ('się', 'jak'): 17,\n", + " ('jak', 'korona'): 2,\n", + " ('korona', 'na'): 2,\n", + " ('na', 'świętych'): 2,\n", + " ('świętych', 'obrazku'): 2,\n", + " ('obrazku', 'twarzy'): 1,\n", + " ('twarzy', 'nie'): 3,\n", + " ('nie', 'było'): 13,\n", + " ('było', 'widać'): 2,\n", + " ('widać', 'zwrócona'): 1,\n", + " ('zwrócona', 'na'): 1,\n", + " ('na', 'pole'): 6,\n", + " ('pole', 'szukała'): 1,\n", + " ('szukała', 'kogoś'): 1,\n", + " ('kogoś', 'okiem'): 1,\n", + " ('okiem', 'daleko'): 1,\n", + " ('daleko', 'na'): 3,\n", + " ('na', 'dole'): 3,\n", + " ('dole', 'ujrzała'): 1,\n", + " ('ujrzała', 'zaśmiała'): 1,\n", + " ('zaśmiała', 'się'): 2,\n", + " ('się', 'i'): 46,\n", + " ('i', 'klasnęła'): 2,\n", + " ('klasnęła', 'w'): 2,\n", + " ('w', 'dłonie'): 2,\n", + " ('dłonie', 'jak'): 1,\n", + " ('jak', 'biały'): 1,\n", + " ('biały', 'ptak'): 1,\n", + " ('ptak', 'zleciała'): 1,\n", + " ('zleciała', 'z'): 1,\n", + " ('z', 'parkanu'): 1,\n", + " ('parkanu', 'na'): 1,\n", + " ('na', 'błonie'): 2,\n", + " ('błonie', 'i'): 1,\n", + " ('i', 'wionęła'): 1,\n", + " ('wionęła', 'ogrodem'): 1,\n", + " ('ogrodem', 'przez'): 1,\n", + " ('przez', 'płotki'): 1,\n", + " ('płotki', 'przez'): 1,\n", + " ('przez', 'kwiaty'): 1,\n", + " ('kwiaty', 'i'): 2,\n", + " ('i', 'po'): 16,\n", + " ('po', 'desce'): 1,\n", + " ('desce', 'opartej'): 1,\n", + " ('opartej', 'o'): 1,\n", + " ('o', 'ścianę'): 2,\n", + " ('ścianę', 'komnaty'): 1,\n", + " ('komnaty', 'nim'): 1,\n", + " ('nim', 'spostrzegł'): 1,\n", + " ('spostrzegł', 'się'): 1,\n", + " ('się', 'wleciała'): 1,\n", + " ('wleciała', 'przez'): 1,\n", + " ('przez', 'okno'): 5,\n", + " ('okno', 'świecąca'): 1,\n", + " ('świecąca', 'nagła'): 1,\n", + " ('nagła', 'cicha'): 1,\n", + " ('cicha', 'i'): 2,\n", + " ('i', 'lekka'): 1,\n", + " ('lekka', 'jak'): 1,\n", + " ('jak', 'światłość'): 1,\n", + " ('światłość', 'miesiąca'): 1,\n", + " ('miesiąca', 'nucąc'): 1,\n", + " ('nucąc', 'chwyciła'): 1,\n", + " ('chwyciła', 'suknie'): 1,\n", + " ('suknie', 'biegła'): 1,\n", + " ('biegła', 'do'): 1,\n", + " ('do', 'zwierciadła'): 1,\n", + " ('zwierciadła', 'wtem'): 1,\n", + " ('wtem', 'ujrzała'): 1,\n", + " ('ujrzała', 'młodzieńca'): 1,\n", + " ('młodzieńca', 'i'): 1,\n", + " ('z', 'rąk'): 8,\n", + " ('rąk', 'jej'): 1,\n", + " ('jej', 'wypadła'): 1,\n", + " ('wypadła', 'suknia'): 1,\n", + " ('suknia', 'a'): 1,\n", + " ('a', 'twarz'): 1,\n", + " ('twarz', 'od'): 1,\n", + " ('od', 'strachu'): 1,\n", + " ('strachu', 'i'): 1,\n", + " ('i', 'dziwu'): 1,\n", + " ('dziwu', 'pobladła'): 1,\n", + " ('pobladła', 'twarz'): 1,\n", + " ('twarz', 'podróżnego'): 1,\n", + " ('podróżnego', 'barwą'): 1,\n", + " ('barwą', 'spłonęła'): 1,\n", + " ('spłonęła', 'rumianą'): 1,\n", + " ('rumianą', 'jak'): 1,\n", + " ('jak', 'obłok'): 1,\n", + " ('obłok', 'gdy'): 1,\n", + " ('gdy', 'z'): 5,\n", + " ('z', 'jutrzenką'): 1,\n", + " ('jutrzenką', 'napotka'): 1,\n", + " ('napotka', 'się'): 1,\n", + " ('się', 'raną'): 1,\n", + " ('raną', 'skromny'): 1,\n", + " ('skromny', 'młodzieniec'): 1,\n", + " ('młodzieniec', 'oczy'): 1,\n", + " ('oczy', 'zmrużył'): 2,\n", + " ('zmrużył', 'i'): 1,\n", + " ('i', 'przysłonił'): 1,\n", + " ('przysłonił', 'chciał'): 1,\n", + " ('chciał', 'coś'): 2,\n", + " ('coś', 'mówić'): 2,\n", + " ('mówić', 'przepraszać'): 1,\n", + " ('przepraszać', 'tylko'): 1,\n", + " ('się', 'ukłonił'): 1,\n", + " ('ukłonił', 'i'): 1,\n", + " ('i', 'cofnął'): 1,\n", + " ('się', 'dziewica'): 1,\n", + " ('dziewica', 'krzyknęła'): 1,\n", + " ('krzyknęła', 'boleśnie'): 1,\n", + " ('boleśnie', 'niewyraźnie'): 1,\n", + " ('niewyraźnie', 'jak'): 1,\n", + " ('jak', 'dziecko'): 2,\n", + " ('dziecko', 'przestraszone'): 1,\n", + " ('przestraszone', 'we'): 1,\n", + " ('we', 'śnie'): 2,\n", + " ('śnie', 'podróżny'): 1,\n", + " ('podróżny', 'zląkł'): 1,\n", + " ('zląkł', 'się'): 3,\n", + " ('się', 'spojrzał'): 1,\n", + " ('spojrzał', 'lecz'): 1,\n", + " ('lecz', 'już'): 1,\n", + " ('już', 'jej'): 1,\n", + " ('jej', 'nie'): 4,\n", + " ('było', 'wyszedł'): 1,\n", + " ('wyszedł', 'zmieszany'): 1,\n", + " ('zmieszany', 'i'): 1,\n", + " ('i', 'czuł'): 3,\n", + " ('czuł', 'że'): 7,\n", + " ('że', 'mu'): 5,\n", + " ('mu', 'serce'): 1,\n", + " ('serce', 'biło'): 1,\n", + " ('biło', 'głośno'): 1,\n", + " ('głośno', 'i'): 1,\n", + " ('i', 'sam'): 5,\n", + " ('sam', 'nie'): 9,\n", + " ('nie', 'wiedział'): 8,\n", + " ('wiedział', 'czy'): 2,\n", + " ('czy', 'go'): 1,\n", + " ('go', 'miało'): 1,\n", + " ('miało', 'śmieszyć'): 1,\n", + " ('śmieszyć', 'to'): 1,\n", + " ('to', 'dziwaczne'): 1,\n", + " ('dziwaczne', 'spotkanie'): 1,\n", + " ('spotkanie', 'czy'): 1,\n", + " ('czy', 'wstydzić'): 1,\n", + " ('wstydzić', 'czy'): 1,\n", + " ('czy', 'cieszyć'): 1,\n", + " ('cieszyć', 'tymczasem'): 1,\n", + " ('tymczasem', 'na'): 2,\n", + " ('na', 'folwarku'): 1,\n", + " ('nie', 'uszło'): 1,\n", + " ('uszło', 'baczności'): 1,\n", + " ('baczności', 'że'): 1,\n", + " ('że', 'przed'): 1,\n", + " ('ganek', 'zajechał'): 1,\n", + " ('zajechał', 'któryś'): 1,\n", + " ('któryś', 'z'): 1,\n", + " ('z', 'nowych'): 1,\n", + " ('nowych', 'gości'): 1,\n", + " ('gości', 'już'): 1,\n", + " ('już', 'konie'): 1,\n", + " ('konie', 'w'): 1,\n", + " ('w', 'stajnią'): 1,\n", + " ('stajnią', 'wzięto'): 1,\n", + " ('wzięto', 'już'): 1,\n", + " ...})" + ] + }, + "execution_count": 14, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "cnt" + ] + }, + { + "cell_type": "code", + "execution_count": 15, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "150" + ] + }, + "execution_count": 15, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "sum({bigram:number for bigram,number in cnt.items() if bigram[0] == 'pan'}.values())" + ] + }, + { + "cell_type": "code", + "execution_count": 16, + "metadata": { + "scrolled": true + }, + "outputs": [], + "source": [ + "pan_cnt = Counter({bigram:number for bigram,number in cnt.items() if bigram[0] == 'pan'})" + ] + }, + { + "cell_type": "code", + "execution_count": 17, + "metadata": { + "scrolled": true + }, + "outputs": [ + { + "data": { + "text/plain": [ + "[(('pan', 'sędzia'), 15),\n", + " (('pan', 'hrabia'), 11),\n", + " (('pan', 'rejent'), 9),\n", + " (('pan', 'tadeusz'), 8),\n", + " (('pan', 'wojski'), 7),\n", + " (('pan', 'bóg'), 6),\n", + " (('pan', 'nie'), 6),\n", + " (('pan', 'podkomorzy'), 4),\n", + " (('pan', 'z'), 3),\n", + " (('pan', 'mój'), 3),\n", + " (('pan', 'stolnik'), 3),\n", + " (('pan', 'jacek'), 3),\n", + " (('pan', 'zawsze'), 2),\n", + " (('pan', 'i'), 2),\n", + " (('pan', 'mu'), 2),\n", + " (('pan', 'że'), 2),\n", + " (('pan', 'to'), 2),\n", + " (('pan', 'świata'), 1),\n", + " (('pan', 'podczaszyc'), 1),\n", + " (('pan', 'kapitan'), 1),\n", + " (('pan', 'kusość'), 1),\n", + " (('pan', 'taki'), 1),\n", + " (('pan', 'nigdy'), 1),\n", + " (('pan', 'może'), 1),\n", + " (('pan', 'grosza'), 1),\n", + " (('pan', 'żartuje'), 1),\n", + " (('pan', 'tylko'), 1),\n", + " (('pan', 'obaczy'), 1),\n", + " (('pan', 'sam'), 1),\n", + " (('pan', 'godził'), 1),\n", + " (('pan', 'tyle'), 1),\n", + " (('pan', 'historyi'), 1),\n", + " (('pan', 'w'), 1),\n", + " (('pan', 'popierał'), 1),\n", + " (('pan', 'słaniając'), 1),\n", + " (('pan', 'potężny'), 1),\n", + " (('pan', 'o'), 1),\n", + " (('pan', 'tak'), 1),\n", + " (('pan', 'się'), 1),\n", + " (('pan', 'patrzcie'), 1),\n", + " (('pan', 'słusznej'), 1),\n", + " (('pan', 'możny'), 1),\n", + " (('pan', 'przychodzi'), 1),\n", + " (('pan', 'dobrodziéj'), 1),\n", + " (('pan', 'wstaje'), 1),\n", + " (('pan', 'zaspał'), 1),\n", + " (('pan', 'najjaśniejszy'), 1),\n", + " (('pan', 'jenerał'), 1),\n", + " (('pan', 'chorąży'), 1),\n", + " (('pan', 'zabił'), 1),\n", + " (('pan', 'bredzi'), 1),\n", + " (('pan', 'zmienni'), 1),\n", + " (('pan', 'dobrze'), 1),\n", + " (('pan', 'rejtan'), 1),\n", + " (('pan', 'nasz'), 1),\n", + " (('pan', 'co'), 1),\n", + " (('pan', 'jadasz'), 1),\n", + " (('pan', 'chce'), 1),\n", + " (('pan', 'wie'), 1),\n", + " (('pan', 'niechaj'), 1),\n", + " (('pan', 'spać'), 1),\n", + " (('pan', 'ma'), 1),\n", + " (('pan', 'wyfuka'), 1),\n", + " (('pan', 'dumny'), 1),\n", + " (('pan', 'pociej'), 1),\n", + " (('pan', 'komisarz'), 1),\n", + " (('pan', 'klucznik'), 1),\n", + " (('pan', 'drze'), 1),\n", + " (('pan', 'maciek'), 1),\n", + " (('pan', 'wołk'), 1),\n", + " (('pan', 'tyzenhauz'), 1),\n", + " (('pan', 'sołtan'), 1),\n", + " (('pan', 'nikita'), 1),\n", + " (('pan', 'zan'), 1),\n", + " (('pan', 'chować'), 1),\n", + " (('pan', 'wyzwałeś'), 1),\n", + " (('pan', 'przerwał'), 1),\n", + " (('pan', 'odjeżdżasz'), 1),\n", + " (('pan', 'głowę'), 1)]" + ] + }, + "execution_count": 17, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "pan_cnt.most_common()" + ] + }, + { + "cell_type": "code", + "execution_count": 18, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "150" + ] + }, + "execution_count": 18, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "sum(pan_cnt.values())" + ] + }, + { + "cell_type": "code", + "execution_count": 19, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "8" + ] + }, + "execution_count": 19, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "pan_cnt[('pan', 'tadeusz')]" + ] + }, + { + "cell_type": "code", + "execution_count": 20, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "0.05333333333333334" + ] + }, + "execution_count": 20, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "pan_cnt[('pan', 'tadeusz')] / sum(pan_cnt.values())" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "## zadanie \n", + "\n", + "- (zad1) napisać funkcję unigram_most_probable(), która zwraca listę 10 najbardziej prawdopodobnych słów wraz z ich prawdopodobieństwami wg modelu unigramowego\n", + "\n", + "- (zad2) napisać funkcję bigram_most_probable(word1), która zwraca listę 10 najbardziej prawdopodobnych słów wraz z ich prawdopodobieństawami w zależności od word1 wg modelu bigramowego\n", + "\n", + "- (zad3) napisać funkcję trigram_most_probable(word1), która zwraca listę 10 najbardziej prawdopodobnych słów wraz z ich prawdopodobieństawami w zależności od word1, word2 wg modelu trigramowego\n", + "\n", + "- (zad4) sprawdzić ile razy wystąpił najliczniejszy unigram, bigram i trigram\n", + "\n", + "- (zad5) jakie jest prawdpodobieństwo p('lasu' | 'młodzież', 'poszła', 'do, ) wg modelu unigramowego, bigramowego, trigramowego?\n", + "\n", + "- (zad6) Jakie jest prawdopodobieństwo wystąpienia stokenizowanych sekwencji wg modelu bigramowego? \"I z łąk, i z pastwisk razem wracało do dworu.\"\n", + " \"Tadeusz lewą dłonią dotykając głowy, Pozdrowił swych dowódców przez ukłon wojskowy;\" \n", + " ( Pierwszy tekst pochodzi ze zbioru trenującego, a drugi ze zbioru testowego )\n", + "\n", + "- (zad7) Jakie jest perplexity dla powyższych zdań wg modelu bigramowego z wygładzaniem laplaca?" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "## Wzory\n", + "\n", + "### Unigram\n", + "$p(w_1, w_2, \\ldots, w_n) = p(w_1)*p(w_2)*\\ldots*p(w_n)$\n", + "\n", + "$p(w_n| w_{n-1}, \\ldots w_1) = p(w_n)$\n", + "\n", + "### Bigram \n", + "$p(w_1, w_2, \\ldots, w_n) = p(w_1)*p(w_2|w1)*\\ldots*p(w_n|w_{n-1})$\n", + "\n", + "$p(w_n| w_{n-1}, \\ldots w_1) = p(w_n|w_{n-1})$\n", + "\n", + "### Trigram\n", + "$p(w_1, w_2, \\ldots, w_n) = p(w_1)*p(w_2|w1)* p(w_3|w1,w2)*\\ldots*p(w_n|w_{n-1}, w_{n-2})$\n", + "\n", + "$p(w_n| w_{n-1}, \\ldots w_1) = p(w_n|w_{n-1}, w_{n-2})$\n", + "\n", + "\n", + "Komentarz: W tym przypadku $p(w_1)$ weź z modelu unigramowego, a $p(w_2|w1)$ z modelu bigramowego. Analogicznie zrób z modelem bigramowym. Gdybyśmy mieli wiele dokumentów, można by brać $p(w_1|)$\n", + "\n", + "### Wygładzanie laplaca\n", + "$P(w_i) = \\frac{c_i + 1}{N + V}$\n", + "\n", + "\n", + "### Perplexity\n", + "$PP(w_1,\\ldots, w_n) = p(w_1,\\ldots, w_n)^{-\\frac{1}{N}}$" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "### ODPOWIEDZI\n", + "\n" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "### zad1" + ] + }, + { + "cell_type": "code", + "execution_count": 21, + "metadata": {}, + "outputs": [], + "source": [ + "ngrams_1 = list(ngrams(corpora_train_tokenized, 1))\n", + "cnt_1_grams = Counter(ngrams_1)" + ] + }, + { + "cell_type": "code", + "execution_count": 22, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "[(('i',), 1768),\n", + " (('w',), 1426),\n", + " (('się',), 1275),\n", + " (('z',), 1176),\n", + " (('na',), 1083),\n", + " (('nie',), 801),\n", + " (('jak',), 500),\n", + " (('do',), 480),\n", + " (('a',), 470),\n", + " (('że',), 456)]" + ] + }, + "execution_count": 22, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "cnt_1_grams.most_common(10)" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "### zad2" + ] + }, + { + "cell_type": "code", + "execution_count": 23, + "metadata": {}, + "outputs": [], + "source": [ + "ngrams_2 = list(ngrams(corpora_train_tokenized, 2))\n", + "cnt_2_grams = Counter(ngrams_2)" + ] + }, + { + "cell_type": "code", + "execution_count": 24, + "metadata": { + "scrolled": true + }, + "outputs": [ + { + "data": { + "text/plain": [ + "Counter({('adam', 'mickiewicz'): 1,\n", + " ('mickiewicz', 'pan'): 1,\n", + " ('pan', 'tadeusz'): 8,\n", + " ('tadeusz', 'czyli'): 1,\n", + " ('czyli', 'ostatni'): 1,\n", + " ('ostatni', 'zajazd'): 1,\n", + " ('zajazd', 'na'): 1,\n", + " ('na', 'litwie'): 14,\n", + " ('litwie', 'księga'): 2,\n", + " ('księga', 'pierwsza'): 1,\n", + " ('pierwsza', 'gospodarstwo'): 1,\n", + " ('gospodarstwo', 'powrót'): 1,\n", + " ('powrót', 'panicza'): 1,\n", + " ('panicza', 'spotkanie'): 1,\n", + " ('spotkanie', 'się'): 3,\n", + " ('się', 'pierwsze'): 1,\n", + " ('pierwsze', 'w'): 1,\n", + " ('w', 'pokoiku'): 1,\n", + " ('pokoiku', 'drugie'): 1,\n", + " ('drugie', 'u'): 1,\n", + " ('u', 'stołu'): 5,\n", + " ('stołu', 'ważna'): 1,\n", + " ('ważna', 'sędziego'): 1,\n", + " ('sędziego', 'nauka'): 1,\n", + " ('nauka', 'o'): 1,\n", + " ('o', 'grzeczności'): 1,\n", + " ('grzeczności', 'podkomorzego'): 1,\n", + " ('podkomorzego', 'uwagi'): 1,\n", + " ('uwagi', 'polityczne'): 1,\n", + " ('polityczne', 'nad'): 1,\n", + " ('nad', 'modami'): 1,\n", + " ('modami', 'początek'): 1,\n", + " ('początek', 'sporu'): 1,\n", + " ('sporu', 'o'): 1,\n", + " ('o', 'kusego'): 4,\n", + " ('kusego', 'i'): 3,\n", + " ('i', 'sokoła'): 3,\n", + " ('sokoła', 'żale'): 1,\n", + " ('żale', 'wojskiego'): 1,\n", + " ('wojskiego', 'ostatni'): 1,\n", + " ('ostatni', 'woźny'): 1,\n", + " ('woźny', 'trybunału'): 2,\n", + " ('trybunału', 'rzut'): 1,\n", + " ('rzut', 'oka'): 2,\n", + " ('oka', 'na'): 1,\n", + " ('na', 'ówczesny'): 1,\n", + " ('ówczesny', 'stan'): 1,\n", + " ('stan', 'polityczny'): 1,\n", + " ('polityczny', 'litwy'): 1,\n", + " ('litwy', 'i'): 1,\n", + " ('i', 'europy'): 1,\n", + " ('europy', 'litwo'): 1,\n", + " ('litwo', 'ojczyzno'): 1,\n", + " ('ojczyzno', 'moja'): 1,\n", + " ('moja', 'ty'): 1,\n", + " ('ty', 'jesteś'): 3,\n", + " ('jesteś', 'jak'): 1,\n", + " ('jak', 'zdrowie'): 1,\n", + " ('zdrowie', 'ile'): 1,\n", + " ('ile', 'cię'): 1,\n", + " ('cię', 'trzeba'): 1,\n", + " ('trzeba', 'cenić'): 1,\n", + " ('cenić', 'ten'): 1,\n", + " ('ten', 'tylko'): 1,\n", + " ('tylko', 'się'): 5,\n", + " ('się', 'dowie'): 2,\n", + " ('dowie', 'kto'): 1,\n", + " ('kto', 'cię'): 1,\n", + " ('cię', 'stracił'): 1,\n", + " ('stracił', 'dziś'): 1,\n", + " ('dziś', 'piękność'): 1,\n", + " ('piękność', 'twą'): 1,\n", + " ('twą', 'w'): 1,\n", + " ('w', 'całej'): 4,\n", + " ('całej', 'ozdobie'): 1,\n", + " ('ozdobie', 'widzę'): 1,\n", + " ('widzę', 'i'): 1,\n", + " ('i', 'opisuję'): 1,\n", + " ('opisuję', 'bo'): 1,\n", + " ('bo', 'tęsknię'): 1,\n", + " ('tęsknię', 'po'): 1,\n", + " ('po', 'tobie'): 1,\n", + " ('tobie', 'panno'): 1,\n", + " ('panno', 'święta'): 1,\n", + " ('święta', 'co'): 1,\n", + " ('co', 'jasnej'): 1,\n", + " ('jasnej', 'bronisz'): 1,\n", + " ('bronisz', 'częstochowy'): 1,\n", + " ('częstochowy', 'i'): 1,\n", + " ('i', 'w'): 44,\n", + " ('w', 'ostrej'): 1,\n", + " ('ostrej', 'świecisz'): 1,\n", + " ('świecisz', 'bramie'): 1,\n", + " ('bramie', 'ty'): 1,\n", + " ('ty', 'co'): 1,\n", + " ('co', 'gród'): 1,\n", + " ('gród', 'zamkowy'): 1,\n", + " ('zamkowy', 'nowogródzki'): 1,\n", + " ('nowogródzki', 'ochraniasz'): 1,\n", + " ('ochraniasz', 'z'): 1,\n", + " ('z', 'jego'): 3,\n", + " ('jego', 'wiernym'): 1,\n", + " ('wiernym', 'ludem'): 1,\n", + " ('ludem', 'jak'): 1,\n", + " ('jak', 'mnie'): 3,\n", + " ('mnie', 'dziecko'): 1,\n", + " ('dziecko', 'do'): 1,\n", + " ('do', 'zdrowia'): 1,\n", + " ('zdrowia', 'powróciłaś'): 1,\n", + " ('powróciłaś', 'cudem'): 1,\n", + " ('cudem', 'gdy'): 1,\n", + " ('gdy', 'od'): 1,\n", + " ('od', 'płaczącej'): 1,\n", + " ('płaczącej', 'matki'): 1,\n", + " ('matki', 'pod'): 1,\n", + " ('pod', 'twoją'): 1,\n", + " ('twoją', 'opiekę'): 1,\n", + " ('opiekę', 'ofiarowany'): 1,\n", + " ('ofiarowany', 'martwą'): 1,\n", + " ('martwą', 'podniosłem'): 1,\n", + " ('podniosłem', 'powiekę'): 1,\n", + " ('powiekę', 'i'): 1,\n", + " ('i', 'zaraz'): 5,\n", + " ('zaraz', 'mogłem'): 1,\n", + " ('mogłem', 'pieszo'): 1,\n", + " ('pieszo', 'do'): 1,\n", + " ('do', 'twych'): 1,\n", + " ('twych', 'świątyń'): 1,\n", + " ('świątyń', 'progu'): 1,\n", + " ('progu', 'iść'): 1,\n", + " ('iść', 'za'): 1,\n", + " ('za', 'wrócone'): 1,\n", + " ('wrócone', 'życie'): 1,\n", + " ('życie', 'podziękować'): 1,\n", + " ('podziękować', 'bogu'): 1,\n", + " ('bogu', 'tak'): 1,\n", + " ('tak', 'nas'): 2,\n", + " ('nas', 'powrócisz'): 1,\n", + " ('powrócisz', 'cudem'): 1,\n", + " ('cudem', 'na'): 1,\n", + " ('na', 'ojczyzny'): 1,\n", + " ('ojczyzny', 'łono'): 1,\n", + " ('łono', 'tymczasem'): 1,\n", + " ('tymczasem', 'przenoś'): 1,\n", + " ('przenoś', 'moją'): 1,\n", + " ('moją', 'duszę'): 1,\n", + " ('duszę', 'utęsknioną'): 1,\n", + " ('utęsknioną', 'do'): 1,\n", + " ('do', 'tych'): 4,\n", + " ('tych', 'pagórków'): 1,\n", + " ('pagórków', 'leśnych'): 1,\n", + " ('leśnych', 'do'): 1,\n", + " ('tych', 'łąk'): 1,\n", + " ('łąk', 'zielonych'): 1,\n", + " ('zielonych', 'szeroko'): 1,\n", + " ('szeroko', 'nad'): 1,\n", + " ('nad', 'błękitnym'): 1,\n", + " ('błękitnym', 'niemnem'): 1,\n", + " ('niemnem', 'rozciągnionych'): 1,\n", + " ('rozciągnionych', 'do'): 1,\n", + " ('tych', 'pól'): 1,\n", + " ('pól', 'malowanych'): 1,\n", + " ('malowanych', 'zbożem'): 1,\n", + " ('zbożem', 'rozmaitem'): 1,\n", + " ('rozmaitem', 'wyzłacanych'): 1,\n", + " ('wyzłacanych', 'pszenicą'): 1,\n", + " ('pszenicą', 'posrebrzanych'): 1,\n", + " ('posrebrzanych', 'żytem'): 1,\n", + " ('żytem', 'gdzie'): 1,\n", + " ('gdzie', 'bursztynowy'): 1,\n", + " ('bursztynowy', 'świerzop'): 1,\n", + " ('świerzop', 'gryka'): 1,\n", + " ('gryka', 'jak'): 1,\n", + " ('jak', 'śnieg'): 2,\n", + " ('śnieg', 'biała'): 1,\n", + " ('biała', 'gdzie'): 1,\n", + " ('gdzie', 'panieńskim'): 1,\n", + " ('panieńskim', 'rumieńcem'): 1,\n", + " ('rumieńcem', 'dzięcielina'): 1,\n", + " ('dzięcielina', 'pała'): 1,\n", + " ('pała', 'a'): 1,\n", + " ('a', 'wszystko'): 4,\n", + " ('wszystko', 'przepasane'): 1,\n", + " ('przepasane', 'jakby'): 1,\n", + " ('jakby', 'wstęgą'): 1,\n", + " ('wstęgą', 'miedzą'): 1,\n", + " ('miedzą', 'zieloną'): 1,\n", + " ('zieloną', 'na'): 1,\n", + " ('na', 'niej'): 1,\n", + " ('niej', 'z'): 2,\n", + " ('z', 'rzadka'): 5,\n", + " ('rzadka', 'ciche'): 1,\n", + " ('ciche', 'grusze'): 1,\n", + " ('grusze', 'siedzą'): 1,\n", + " ('siedzą', 'śród'): 2,\n", + " ('śród', 'takich'): 1,\n", + " ('takich', 'pól'): 1,\n", + " ('pól', 'przed'): 1,\n", + " ('przed', 'laty'): 4,\n", + " ('laty', 'nad'): 1,\n", + " ('nad', 'brzegiem'): 2,\n", + " ('brzegiem', 'ruczaju'): 1,\n", + " ('ruczaju', 'na'): 1,\n", + " ('na', 'pagórku'): 1,\n", + " ('pagórku', 'niewielkim'): 1,\n", + " ('niewielkim', 'we'): 1,\n", + " ('we', 'brzozowym'): 1,\n", + " ('brzozowym', 'gaju'): 1,\n", + " ('gaju', 'stał'): 1,\n", + " ('stał', 'dwór'): 1,\n", + " ('dwór', 'szlachecki'): 1,\n", + " ('szlachecki', 'z'): 1,\n", + " ('z', 'drzewa'): 4,\n", + " ('drzewa', 'lecz'): 1,\n", + " ('lecz', 'podmurowany'): 1,\n", + " ('podmurowany', 'świeciły'): 1,\n", + " ('świeciły', 'się'): 3,\n", + " ('się', 'z'): 56,\n", + " ('z', 'daleka'): 8,\n", + " ('daleka', 'pobielane'): 1,\n", + " ('pobielane', 'ściany'): 1,\n", + " ('ściany', 'tym'): 1,\n", + " ('tym', 'bielsze'): 1,\n", + " ('bielsze', 'że'): 1,\n", + " ('że', 'odbite'): 1,\n", + " ('odbite', 'od'): 1,\n", + " ('od', 'ciemnej'): 1,\n", + " ('ciemnej', 'zieleni'): 1,\n", + " ('zieleni', 'topoli'): 1,\n", + " ('topoli', 'co'): 1,\n", + " ('co', 'go'): 2,\n", + " ('go', 'bronią'): 1,\n", + " ('bronią', 'od'): 1,\n", + " ('od', 'wiatrów'): 1,\n", + " ('wiatrów', 'jesieni'): 1,\n", + " ('jesieni', 'dom'): 1,\n", + " ('dom', 'mieszkalny'): 1,\n", + " ('mieszkalny', 'niewielki'): 1,\n", + " ('niewielki', 'lecz'): 1,\n", + " ('lecz', 'zewsząd'): 1,\n", + " ('zewsząd', 'chędogi'): 1,\n", + " ('chędogi', 'i'): 1,\n", + " ('i', 'stodołę'): 1,\n", + " ('stodołę', 'miał'): 1,\n", + " ('miał', 'wielką'): 1,\n", + " ('wielką', 'i'): 1,\n", + " ('i', 'przy'): 1,\n", + " ('przy', 'niej'): 1,\n", + " ('niej', 'trzy'): 1,\n", + " ('trzy', 'stogi'): 1,\n", + " ('stogi', 'użątku'): 1,\n", + " ('użątku', 'co'): 1,\n", + " ('co', 'pod'): 1,\n", + " ('pod', 'strzechą'): 2,\n", + " ('strzechą', 'zmieścić'): 1,\n", + " ('zmieścić', 'się'): 1,\n", + " ('się', 'nie'): 20,\n", + " ('nie', 'może'): 10,\n", + " ('może', 'widać'): 1,\n", + " ('widać', 'że'): 12,\n", + " ('że', 'okolica'): 1,\n", + " ('okolica', 'obfita'): 1,\n", + " ('obfita', 'we'): 1,\n", + " ('we', 'zboże'): 1,\n", + " ('zboże', 'i'): 2,\n", + " ('i', 'widać'): 3,\n", + " ('widać', 'z'): 7,\n", + " ('z', 'liczby'): 2,\n", + " ('liczby', 'kopic'): 1,\n", + " ('kopic', 'co'): 1,\n", + " ('co', 'wzdłuż'): 1,\n", + " ('wzdłuż', 'i'): 2,\n", + " ('i', 'wszerz'): 3,\n", + " ('wszerz', 'smugów'): 1,\n", + " ('smugów', 'świecą'): 1,\n", + " ('świecą', 'gęsto'): 1,\n", + " ('gęsto', 'jak'): 1,\n", + " ('jak', 'gwiazdy'): 1,\n", + " ('gwiazdy', 'widać'): 1,\n", + " ('liczby', 'pługów'): 1,\n", + " ('pługów', 'orzących'): 1,\n", + " ('orzących', 'wcześnie'): 1,\n", + " ('wcześnie', 'łany'): 1,\n", + " ('łany', 'ogromne'): 1,\n", + " ('ogromne', 'ugoru'): 1,\n", + " ('ugoru', 'czarnoziemne'): 1,\n", + " ('czarnoziemne', 'zapewne'): 1,\n", + " ('zapewne', 'należne'): 1,\n", + " ('należne', 'do'): 1,\n", + " ('do', 'dworu'): 9,\n", + " ('dworu', 'uprawne'): 1,\n", + " ('uprawne', 'dobrze'): 1,\n", + " ('dobrze', 'na'): 3,\n", + " ('na', 'kształt'): 20,\n", + " ('kształt', 'ogrodowych'): 1,\n", + " ('ogrodowych', 'grządek'): 1,\n", + " ('grządek', 'że'): 1,\n", + " ('że', 'w'): 19,\n", + " ('w', 'tym'): 20,\n", + " ('tym', 'domu'): 1,\n", + " ('domu', 'dostatek'): 1,\n", + " ('dostatek', 'mieszka'): 1,\n", + " ('mieszka', 'i'): 1,\n", + " ('i', 'porządek'): 1,\n", + " ('porządek', 'brama'): 1,\n", + " ('brama', 'na'): 1,\n", + " ('na', 'wciąż'): 1,\n", + " ('wciąż', 'otwarta'): 1,\n", + " ('otwarta', 'przechodniom'): 1,\n", + " ('przechodniom', 'ogłasza'): 1,\n", + " ('ogłasza', 'że'): 1,\n", + " ('że', 'gościnna'): 1,\n", + " ('gościnna', 'i'): 1,\n", + " ('i', 'wszystkich'): 2,\n", + " ('wszystkich', 'w'): 2,\n", + " ('w', 'gościnę'): 1,\n", + " ('gościnę', 'zaprasza'): 1,\n", + " ('zaprasza', 'właśnie'): 1,\n", + " ('właśnie', 'dwukonną'): 1,\n", + " ('dwukonną', 'bryką'): 1,\n", + " ('bryką', 'wjechał'): 1,\n", + " ('wjechał', 'młody'): 1,\n", + " ('młody', 'panek'): 1,\n", + " ('panek', 'i'): 1,\n", + " ('i', 'obiegłszy'): 1,\n", + " ('obiegłszy', 'dziedziniec'): 1,\n", + " ('dziedziniec', 'zawrócił'): 1,\n", + " ('zawrócił', 'przed'): 1,\n", + " ('przed', 'ganek'): 2,\n", + " ('ganek', 'wysiadł'): 1,\n", + " ('wysiadł', 'z'): 1,\n", + " ('z', 'powozu'): 1,\n", + " ('powozu', 'konie'): 1,\n", + " ('konie', 'porzucone'): 1,\n", + " ('porzucone', 'same'): 1,\n", + " ('same', 'szczypiąc'): 1,\n", + " ('szczypiąc', 'trawę'): 1,\n", + " ('trawę', 'ciągnęły'): 1,\n", + " ('ciągnęły', 'powoli'): 1,\n", + " ('powoli', 'pod'): 1,\n", + " ('pod', 'bramę'): 2,\n", + " ('bramę', 'we'): 1,\n", + " ('we', 'dworze'): 10,\n", + " ('dworze', 'pusto'): 1,\n", + " ('pusto', 'bo'): 1,\n", + " ('bo', 'drzwi'): 2,\n", + " ('drzwi', 'od'): 1,\n", + " ('od', 'ganku'): 1,\n", + " ('ganku', 'zamknięto'): 1,\n", + " ('zamknięto', 'zaszczepkami'): 1,\n", + " ('zaszczepkami', 'i'): 1,\n", + " ('i', 'kołkiem'): 1,\n", + " ('kołkiem', 'zaszczepki'): 1,\n", + " ('zaszczepki', 'przetknięto'): 1,\n", + " ('przetknięto', 'podróżny'): 1,\n", + " ('podróżny', 'do'): 1,\n", + " ('do', 'folwarku'): 3,\n", + " ('folwarku', 'nie'): 2,\n", + " ('nie', 'biegł'): 1,\n", + " ('biegł', 'sług'): 1,\n", + " ('sług', 'zapytać'): 1,\n", + " ('zapytać', 'odemknął'): 1,\n", + " ('odemknął', 'wbiegł'): 1,\n", + " ('wbiegł', 'do'): 1,\n", + " ('do', 'domu'): 12,\n", + " ('domu', 'pragnął'): 1,\n", + " ('pragnął', 'go'): 1,\n", + " ('go', 'powitać'): 1,\n", + " ('powitać', 'dawno'): 1,\n", + " ('dawno', 'domu'): 1,\n", + " ('domu', 'nie'): 1,\n", + " ('nie', 'widział'): 7,\n", + " ('widział', 'bo'): 2,\n", + " ('bo', 'w'): 8,\n", + " ('w', 'dalekim'): 1,\n", + " ('dalekim', 'mieście'): 1,\n", + " ('mieście', 'kończył'): 1,\n", + " ('kończył', 'nauki'): 1,\n", + " ('nauki', 'końca'): 1,\n", + " ('końca', 'doczekał'): 1,\n", + " ('doczekał', 'nareszcie'): 1,\n", + " ('nareszcie', 'wbiega'): 1,\n", + " ('wbiega', 'i'): 1,\n", + " ('i', 'okiem'): 2,\n", + " ('okiem', 'chciwie'): 1,\n", + " ('chciwie', 'ściany'): 1,\n", + " ('ściany', 'starodawne'): 1,\n", + " ('starodawne', 'ogląda'): 1,\n", + " ('ogląda', 'czule'): 1,\n", + " ('czule', 'jako'): 1,\n", + " ('jako', 'swe'): 1,\n", + " ('swe', 'znajome'): 1,\n", + " ('znajome', 'dawne'): 1,\n", + " ('dawne', 'też'): 1,\n", + " ('też', 'same'): 4,\n", + " ('same', 'widzi'): 1,\n", + " ('widzi', 'sprzęty'): 1,\n", + " ('sprzęty', 'też'): 1,\n", + " ('same', 'obicia'): 1,\n", + " ('obicia', 'z'): 1,\n", + " ('z', 'którymi'): 1,\n", + " ('którymi', 'się'): 1,\n", + " ('się', 'zabawiać'): 1,\n", + " ('zabawiać', 'lubił'): 1,\n", + " ('lubił', 'od'): 1,\n", + " ('od', 'powicia'): 1,\n", + " ('powicia', 'lecz'): 1,\n", + " ('lecz', 'mniej'): 1,\n", + " ('mniej', 'wielkie'): 1,\n", + " ('wielkie', 'mniej'): 1,\n", + " ('mniej', 'piękne'): 1,\n", + " ('piękne', 'niż'): 1,\n", + " ('niż', 'się'): 2,\n", + " ('się', 'dawniej'): 1,\n", + " ('dawniej', 'zdały'): 1,\n", + " ('zdały', 'i'): 1,\n", + " ('i', 'też'): 1,\n", + " ('same', 'portrety'): 1,\n", + " ('portrety', 'na'): 1,\n", + " ('na', 'ścianach'): 1,\n", + " ('ścianach', 'wisiały'): 1,\n", + " ('wisiały', 'tu'): 1,\n", + " ('tu', 'kościuszko'): 1,\n", + " ('kościuszko', 'w'): 1,\n", + " ('w', 'czamarce'): 1,\n", + " ('czamarce', 'krakowskiej'): 1,\n", + " ('krakowskiej', 'z'): 1,\n", + " ('z', 'oczyma'): 2,\n", + " ('oczyma', 'podniesionymi'): 1,\n", + " ('podniesionymi', 'w'): 1,\n", + " ('w', 'niebo'): 8,\n", + " ('niebo', 'miecz'): 1,\n", + " ('miecz', 'oburącz'): 1,\n", + " ('oburącz', 'trzyma'): 1,\n", + " ('trzyma', 'takim'): 1,\n", + " ('takim', 'był'): 1,\n", + " ('był', 'gdy'): 1,\n", + " ('gdy', 'przysięgał'): 1,\n", + " ('przysięgał', 'na'): 1,\n", + " ('na', 'stopniach'): 1,\n", + " ('stopniach', 'ołtarzów'): 1,\n", + " ('ołtarzów', 'że'): 1,\n", + " ('że', 'tym'): 1,\n", + " ('tym', 'mieczem'): 1,\n", + " ('mieczem', 'wypędzi'): 1,\n", + " ('wypędzi', 'z'): 1,\n", + " ('z', 'polski'): 2,\n", + " ('polski', 'trzech'): 1,\n", + " ('trzech', 'mocarzów'): 1,\n", + " ('mocarzów', 'albo'): 1,\n", + " ('albo', 'sam'): 1,\n", + " ('sam', 'na'): 3,\n", + " ('na', 'nim'): 10,\n", + " ('nim', 'padnie'): 1,\n", + " ('padnie', 'dalej'): 1,\n", + " ('dalej', 'w'): 3,\n", + " ('w', 'polskiej'): 1,\n", + " ('polskiej', 'szacie'): 1,\n", + " ('szacie', 'siedzi'): 1,\n", + " ('siedzi', 'rejtan'): 1,\n", + " ('rejtan', 'żałośny'): 1,\n", + " ('żałośny', 'po'): 1,\n", + " ('po', 'wolności'): 1,\n", + " ('wolności', 'stracie'): 1,\n", + " ('stracie', 'w'): 1,\n", + " ('w', 'ręku'): 15,\n", + " ('ręku', 'trzyma'): 1,\n", + " ('trzyma', 'nóż'): 1,\n", + " ('nóż', 'ostrzem'): 1,\n", + " ('ostrzem', 'zwrócony'): 1,\n", + " ('zwrócony', 'do'): 2,\n", + " ('do', 'łona'): 1,\n", + " ('łona', 'a'): 1,\n", + " ('a', 'przed'): 2,\n", + " ('przed', 'nim'): 5,\n", + " ('nim', 'leży'): 1,\n", + " ('leży', 'fedon'): 1,\n", + " ('fedon', 'i'): 1,\n", + " ('i', 'żywot'): 1,\n", + " ('żywot', 'katona'): 1,\n", + " ('katona', 'dalej'): 1,\n", + " ('dalej', 'jasiński'): 1,\n", + " ('jasiński', 'młodzian'): 1,\n", + " ('młodzian', 'piękny'): 1,\n", + " ('piękny', 'i'): 1,\n", + " ('i', 'posępny'): 2,\n", + " ('posępny', 'obok'): 1,\n", + " ('obok', 'korsak'): 1,\n", + " ('korsak', 'towarzysz'): 1,\n", + " ('towarzysz', 'jego'): 1,\n", + " ('jego', 'nieodstępny'): 1,\n", + " ('nieodstępny', 'stoją'): 1,\n", + " ('stoją', 'na'): 2,\n", + " ('na', 'szańcach'): 1,\n", + " ('szańcach', 'pragi'): 1,\n", + " ('pragi', 'na'): 1,\n", + " ('na', 'stosach'): 1,\n", + " ('stosach', 'moskali'): 1,\n", + " ('moskali', 'siekąc'): 1,\n", + " ('siekąc', 'wrogów'): 1,\n", + " ('wrogów', 'a'): 2,\n", + " ('a', 'praga'): 1,\n", + " ('praga', 'już'): 1,\n", + " ('już', 'się'): 5,\n", + " ('się', 'wkoło'): 5,\n", + " ('wkoło', 'pali'): 1,\n", + " ('pali', 'nawet'): 1,\n", + " ('nawet', 'stary'): 1,\n", + " ('stary', 'stojący'): 1,\n", + " ('stojący', 'zegar'): 1,\n", + " ('zegar', 'kurantowy'): 1,\n", + " ('kurantowy', 'w'): 1,\n", + " ('w', 'drewnianej'): 1,\n", + " ('drewnianej', 'szafie'): 1,\n", + " ('szafie', 'poznał'): 1,\n", + " ('poznał', 'u'): 1,\n", + " ('u', 'wniścia'): 1,\n", + " ('wniścia', 'alkowy'): 1,\n", + " ('alkowy', 'i'): 1,\n", + " ('i', 'z'): 54,\n", + " ('z', 'dziecinną'): 1,\n", + " ('dziecinną', 'radością'): 1,\n", + " ('radością', 'pociągnął'): 1,\n", + " ('pociągnął', 'za'): 1,\n", + " ('za', 'sznurek'): 1,\n", + " ('sznurek', 'by'): 1,\n", + " ('by', 'stary'): 1,\n", + " ('stary', 'dąbrowskiego'): 1,\n", + " ('dąbrowskiego', 'usłyszeć'): 1,\n", + " ('usłyszeć', 'mazurek'): 1,\n", + " ('mazurek', 'biegał'): 1,\n", + " ('biegał', 'po'): 2,\n", + " ('po', 'całym'): 2,\n", + " ('całym', 'domu'): 1,\n", + " ('domu', 'i'): 5,\n", + " ('i', 'szukał'): 2,\n", + " ('szukał', 'komnaty'): 1,\n", + " ('komnaty', 'gdzie'): 1,\n", + " ('gdzie', 'mieszkał'): 1,\n", + " ('mieszkał', 'dzieckiem'): 1,\n", + " ('dzieckiem', 'będąc'): 1,\n", + " ('będąc', 'przed'): 1,\n", + " ('przed', 'dziesięciu'): 1,\n", + " ('dziesięciu', 'laty'): 1,\n", + " ('laty', 'wchodzi'): 1,\n", + " ('wchodzi', 'cofnął'): 1,\n", + " ('cofnął', 'się'): 4,\n", + " ('się', 'toczył'): 2,\n", + " ('toczył', 'zdumione'): 1,\n", + " ('zdumione', 'źrenice'): 1,\n", + " ('źrenice', 'po'): 1,\n", + " ('po', 'ścianach'): 1,\n", + " ('ścianach', 'w'): 1,\n", + " ('w', 'tej'): 13,\n", + " ('tej', 'komnacie'): 1,\n", + " ('komnacie', 'mieszkanie'): 1,\n", + " ('mieszkanie', 'kobiéce'): 1,\n", + " ('kobiéce', 'któż'): 1,\n", + " ('któż', 'by'): 3,\n", + " ('by', 'tu'): 1,\n", + " ('tu', 'mieszkał'): 1,\n", + " ('mieszkał', 'stary'): 1,\n", + " ('stary', 'stryj'): 1,\n", + " ('stryj', 'nie'): 1,\n", + " ('nie', 'był'): 10,\n", + " ('był', 'żonaty'): 1,\n", + " ('żonaty', 'a'): 1,\n", + " ('a', 'ciotka'): 1,\n", + " ('ciotka', 'w'): 1,\n", + " ('w', 'petersburgu'): 1,\n", + " ('petersburgu', 'mieszkała'): 1,\n", + " ('mieszkała', 'przed'): 1,\n", + " ('laty', 'to'): 1,\n", + " ('to', 'nie'): 13,\n", + " ('był', 'ochmistrzyni'): 1,\n", + " ('ochmistrzyni', 'pokój'): 1,\n", + " ('pokój', 'fortepiano'): 1,\n", + " ('fortepiano', 'na'): 1,\n", + " ('nim', 'nuty'): 1,\n", + " ('nuty', 'i'): 1,\n", + " ('i', 'książki'): 1,\n", + " ('książki', 'wszystko'): 1,\n", + " ('wszystko', 'porzucano'): 1,\n", + " ('porzucano', 'niedbale'): 1,\n", + " ('niedbale', 'i'): 1,\n", + " ('i', 'bezładnie'): 1,\n", + " ('bezładnie', 'nieporządek'): 1,\n", + " ('nieporządek', 'miły'): 1,\n", + " ('miły', 'niestare'): 1,\n", + " ('niestare', 'były'): 1,\n", + " ('były', 'rączki'): 1,\n", + " ('rączki', 'co'): 1,\n", + " ('co', 'je'): 2,\n", + " ('je', 'tak'): 1,\n", + " ('tak', 'rzuciły'): 1,\n", + " ('rzuciły', 'tuż'): 1,\n", + " ('tuż', 'i'): 2,\n", + " ('i', 'sukienka'): 1,\n", + " ('sukienka', 'biała'): 1,\n", + " ('biała', 'świeżo'): 1,\n", + " ('świeżo', 'z'): 1,\n", + " ('z', 'kołka'): 2,\n", + " ('kołka', 'zdjęta'): 1,\n", + " ('zdjęta', 'do'): 1,\n", + " ('do', 'ubrania'): 2,\n", + " ('ubrania', 'na'): 1,\n", + " ('na', 'krzesła'): 1,\n", + " ('krzesła', 'poręczu'): 1,\n", + " ('poręczu', 'rozpięta'): 1,\n", + " ('rozpięta', 'a'): 1,\n", + " ('a', 'na'): 15,\n", + " ('na', 'oknach'): 1,\n", + " ('oknach', 'donice'): 1,\n", + " ('donice', 'z'): 1,\n", + " ('z', 'pachnącymi'): 1,\n", + " ('pachnącymi', 'ziołki'): 1,\n", + " ('ziołki', 'geranium'): 1,\n", + " ('geranium', 'lewkonija'): 1,\n", + " ('lewkonija', 'astry'): 1,\n", + " ('astry', 'i'): 1,\n", + " ('i', 'fijołki'): 1,\n", + " ('fijołki', 'podróżny'): 1,\n", + " ('podróżny', 'stanął'): 1,\n", + " ('stanął', 'w'): 3,\n", + " ('w', 'jednym'): 2,\n", + " ('jednym', 'z'): 1,\n", + " ('z', 'okien'): 1,\n", + " ('okien', 'nowe'): 1,\n", + " ('nowe', 'dziwo'): 1,\n", + " ('dziwo', 'w'): 1,\n", + " ('w', 'sadzie'): 2,\n", + " ('sadzie', 'na'): 1,\n", + " ('na', 'brzegu'): 1,\n", + " ('brzegu', 'niegdyś'): 1,\n", + " ('niegdyś', 'zarosłym'): 1,\n", + " ('zarosłym', 'pokrzywą'): 1,\n", + " ('pokrzywą', 'był'): 1,\n", + " ('był', 'maleńki'): 1,\n", + " ('maleńki', 'ogródek'): 1,\n", + " ('ogródek', 'ścieżkami'): 1,\n", + " ('ścieżkami', 'porznięty'): 1,\n", + " ('porznięty', 'pełen'): 1,\n", + " ('pełen', 'bukietów'): 1,\n", + " ('bukietów', 'trawy'): 1,\n", + " ('trawy', 'angielskiej'): 1,\n", + " ('angielskiej', 'i'): 1,\n", + " ('i', 'mięty'): 1,\n", + " ('mięty', 'drewniany'): 1,\n", + " ('drewniany', 'drobny'): 1,\n", + " ('drobny', 'w'): 1,\n", + " ('w', 'cyfrę'): 1,\n", + " ('cyfrę', 'powiązany'): 1,\n", + " ('powiązany', 'płotek'): 1,\n", + " ('płotek', 'połyskał'): 1,\n", + " ('połyskał', 'się'): 2,\n", + " ('się', 'wstążkami'): 1,\n", + " ('wstążkami', 'jaskrawych'): 1,\n", + " ('jaskrawych', 'stokrotek'): 1,\n", + " ('stokrotek', 'grządki'): 1,\n", + " ('grządki', 'widać'): 1,\n", + " ('że', 'były'): 1,\n", + " ('były', 'świeżo'): 1,\n", + " ('świeżo', 'polewane'): 1,\n", + " ('polewane', 'tuż'): 1,\n", + " ('tuż', 'stało'): 1,\n", + " ('stało', 'wody'): 1,\n", + " ('wody', 'pełne'): 1,\n", + " ('pełne', 'naczynie'): 1,\n", + " ('naczynie', 'blaszane'): 1,\n", + " ('blaszane', 'ale'): 1,\n", + " ('ale', 'nigdzie'): 1,\n", + " ('nigdzie', 'nie'): 1,\n", + " ('nie', 'widać'): 3,\n", + " ('widać', 'było'): 6,\n", + " ('było', 'ogrodniczki'): 1,\n", + " ('ogrodniczki', 'tylko'): 1,\n", + " ('tylko', 'co'): 2,\n", + " ('co', 'wyszła'): 1,\n", + " ('wyszła', 'jeszcze'): 1,\n", + " ('jeszcze', 'kołyszą'): 1,\n", + " ('kołyszą', 'się'): 1,\n", + " ('się', 'drzwiczki'): 1,\n", + " ('drzwiczki', 'świeżo'): 1,\n", + " ('świeżo', 'trącone'): 1,\n", + " ('trącone', 'blisko'): 1,\n", + " ('blisko', 'drzwi'): 1,\n", + " ('drzwi', 'ślad'): 1,\n", + " ('ślad', 'widać'): 1,\n", + " ('widać', 'nóżki'): 1,\n", + " ('nóżki', 'na'): 1,\n", + " ('na', 'piasku'): 2,\n", + " ('piasku', 'bez'): 1,\n", + " ('bez', 'trzewika'): 1,\n", + " ('trzewika', 'była'): 1,\n", + " ('była', 'i'): 2,\n", + " ('i', 'pończoszki'): 1,\n", + " ('pończoszki', 'na'): 1,\n", + " ('piasku', 'drobnym'): 1,\n", + " ('drobnym', 'suchym'): 1,\n", + " ('suchym', 'białym'): 1,\n", + " ('białym', 'na'): 1,\n", + " ('kształt', 'śniegu'): 1,\n", + " ('śniegu', 'ślad'): 1,\n", + " ('ślad', 'wyraźny'): 1,\n", + " ('wyraźny', 'lecz'): 1,\n", + " ('lecz', 'lekki'): 1,\n", + " ('lekki', 'odgadniesz'): 1,\n", + " ('odgadniesz', 'że'): 1,\n", + " ('w', 'biegu'): 6,\n", + " ('biegu', 'chybkim'): 1,\n", + " ('chybkim', 'był'): 1,\n", + " ('był', 'zostawiony'): 1,\n", + " ('zostawiony', 'nóżkami'): 1,\n", + " ('nóżkami', 'drobnemi'): 1,\n", + " ('drobnemi', 'od'): 1,\n", + " ('od', 'kogoś'): 1,\n", + " ('kogoś', 'co'): 1,\n", + " ('co', 'zaledwie'): 1,\n", + " ('zaledwie', 'dotykał'): 1,\n", + " ('dotykał', 'się'): 1,\n", + " ('się', 'ziemi'): 1,\n", + " ('ziemi', 'podróżny'): 1,\n", + " ('podróżny', 'długo'): 1,\n", + " ('długo', 'w'): 4,\n", + " ('w', 'oknie'): 1,\n", + " ('oknie', 'stał'): 1,\n", + " ('stał', 'patrząc'): 1,\n", + " ('patrząc', 'dumając'): 1,\n", + " ('dumając', 'wonnymi'): 1,\n", + " ('wonnymi', 'powiewami'): 1,\n", + " ('powiewami', 'kwiatów'): 1,\n", + " ('kwiatów', 'oddychając'): 1,\n", + " ('oddychając', 'oblicze'): 1,\n", + " ('oblicze', 'aż'): 1,\n", + " ('aż', 'na'): 4,\n", + " ('na', 'krzaki'): 1,\n", + " ('krzaki', 'fijołkowe'): 1,\n", + " ('fijołkowe', 'skłonił'): 1,\n", + " ('skłonił', 'oczyma'): 1,\n", + " ('oczyma', 'ciekawymi'): 1,\n", + " ('ciekawymi', 'po'): 1,\n", + " ('po', 'drożynach'): 1,\n", + " ('drożynach', 'gonił'): 1,\n", + " ('gonił', 'i'): 2,\n", + " ('i', 'znowu'): 10,\n", + " ('znowu', 'je'): 1,\n", + " ('je', 'na'): 2,\n", + " ('na', 'drobnych'): 1,\n", + " ('drobnych', 'śladach'): 1,\n", + " ('śladach', 'zatrzymywał'): 1,\n", + " ('zatrzymywał', 'myślał'): 1,\n", + " ('myślał', 'o'): 1,\n", + " ('o', 'nich'): 2,\n", + " ('nich', 'i'): 1,\n", + " ('i', 'czyje'): 1,\n", + " ('czyje', 'były'): 1,\n", + " ('były', 'odgadywał'): 1,\n", + " ('odgadywał', 'przypadkiem'): 1,\n", + " ('przypadkiem', 'oczy'): 1,\n", + " ('oczy', 'podniósł'): 2,\n", + " ('podniósł', 'i'): 2,\n", + " ('i', 'tuż'): 1,\n", + " ('tuż', 'na'): 1,\n", + " ('na', 'parkanie'): 3,\n", + " ('parkanie', 'stała'): 1,\n", + " ('stała', 'młoda'): 1,\n", + " ('młoda', 'dziewczyna'): 1,\n", + " ('dziewczyna', 'białe'): 1,\n", + " ('białe', 'jej'): 1,\n", + " ('jej', 'ubranie'): 1,\n", + " ('ubranie', 'wysmukłą'): 1,\n", + " ('wysmukłą', 'postać'): 1,\n", + " ('postać', 'tylko'): 1,\n", + " ('tylko', 'aż'): 1,\n", + " ('aż', 'do'): 10,\n", + " ('do', 'piersi'): 2,\n", + " ('piersi', 'kryje'): 1,\n", + " ('kryje', 'odsłaniając'): 1,\n", + " ('odsłaniając', 'ramiona'): 1,\n", + " ('ramiona', 'i'): 2,\n", + " ('i', 'łabędzią'): 1,\n", + " ('łabędzią', 'szyję'): 1,\n", + " ('szyję', 'w'): 1,\n", + " ('w', 'takim'): 4,\n", + " ('takim', 'litwinka'): 1,\n", + " ('litwinka', 'tylko'): 1,\n", + " ('tylko', 'chodzić'): 1,\n", + " ('chodzić', 'zwykła'): 1,\n", + " ('zwykła', 'z'): 1,\n", + " ('z', 'rana'): 7,\n", + " ('rana', 'w'): 1,\n", + " ('takim', 'nigdy'): 1,\n", + " ('nigdy', 'nie'): 13,\n", + " ('nie', 'bywa'): 1,\n", + " ('bywa', 'od'): 1,\n", + " ('od', 'mężczyzn'): 1,\n", + " ('mężczyzn', 'widziana'): 1,\n", + " ('widziana', 'więc'): 1,\n", + " ('więc', 'choć'): 1,\n", + " ('choć', 'świadka'): 1,\n", + " ('świadka', 'nie'): 1,\n", + " ('nie', 'miała'): 3,\n", + " ('miała', 'założyła'): 1,\n", + " ('założyła', 'ręce'): 1,\n", + " ('ręce', 'na'): 2,\n", + " ('na', 'piersiach'): 3,\n", + " ('piersiach', 'przydawając'): 1,\n", + " ('przydawając', 'zasłony'): 1,\n", + " ('zasłony', 'sukience'): 1,\n", + " ('sukience', 'włos'): 1,\n", + " ('włos', 'w'): 1,\n", + " ('w', 'pukle'): 2,\n", + " ('pukle', 'nierozwity'): 1,\n", + " ('nierozwity', 'lecz'): 1,\n", + " ('lecz', 'w'): 6,\n", + " ('w', 'węzełki'): 1,\n", + " ('węzełki', 'małe'): 1,\n", + " ('małe', 'pokręcony'): 1,\n", + " ('pokręcony', 'schowany'): 1,\n", + " ('schowany', 'w'): 1,\n", + " ('w', 'drobne'): 2,\n", + " ('drobne', 'strączki'): 1,\n", + " ('strączki', 'białe'): 1,\n", + " ('białe', 'dziwnie'): 1,\n", + " ('dziwnie', 'ozdabiał'): 1,\n", + " ('ozdabiał', 'głowę'): 1,\n", + " ('głowę', 'bo'): 1,\n", + " ('bo', 'od'): 3,\n", + " ('od', 'słońca'): 5,\n", + " ('słońca', 'blasku'): 2,\n", + " ('blasku', 'świecił'): 1,\n", + " ('świecił', 'się'): 2,\n", + " ('się', 'jak'): 17,\n", + " ('jak', 'korona'): 2,\n", + " ('korona', 'na'): 2,\n", + " ('na', 'świętych'): 2,\n", + " ('świętych', 'obrazku'): 2,\n", + " ('obrazku', 'twarzy'): 1,\n", + " ('twarzy', 'nie'): 3,\n", + " ('nie', 'było'): 13,\n", + " ('było', 'widać'): 2,\n", + " ('widać', 'zwrócona'): 1,\n", + " ('zwrócona', 'na'): 1,\n", + " ('na', 'pole'): 6,\n", + " ('pole', 'szukała'): 1,\n", + " ('szukała', 'kogoś'): 1,\n", + " ('kogoś', 'okiem'): 1,\n", + " ('okiem', 'daleko'): 1,\n", + " ('daleko', 'na'): 3,\n", + " ('na', 'dole'): 3,\n", + " ('dole', 'ujrzała'): 1,\n", + " ('ujrzała', 'zaśmiała'): 1,\n", + " ('zaśmiała', 'się'): 2,\n", + " ('się', 'i'): 46,\n", + " ('i', 'klasnęła'): 2,\n", + " ('klasnęła', 'w'): 2,\n", + " ('w', 'dłonie'): 2,\n", + " ('dłonie', 'jak'): 1,\n", + " ('jak', 'biały'): 1,\n", + " ('biały', 'ptak'): 1,\n", + " ('ptak', 'zleciała'): 1,\n", + " ('zleciała', 'z'): 1,\n", + " ('z', 'parkanu'): 1,\n", + " ('parkanu', 'na'): 1,\n", + " ('na', 'błonie'): 2,\n", + " ('błonie', 'i'): 1,\n", + " ('i', 'wionęła'): 1,\n", + " ('wionęła', 'ogrodem'): 1,\n", + " ('ogrodem', 'przez'): 1,\n", + " ('przez', 'płotki'): 1,\n", + " ('płotki', 'przez'): 1,\n", + " ('przez', 'kwiaty'): 1,\n", + " ('kwiaty', 'i'): 2,\n", + " ('i', 'po'): 16,\n", + " ('po', 'desce'): 1,\n", + " ('desce', 'opartej'): 1,\n", + " ('opartej', 'o'): 1,\n", + " ('o', 'ścianę'): 2,\n", + " ('ścianę', 'komnaty'): 1,\n", + " ('komnaty', 'nim'): 1,\n", + " ('nim', 'spostrzegł'): 1,\n", + " ('spostrzegł', 'się'): 1,\n", + " ('się', 'wleciała'): 1,\n", + " ('wleciała', 'przez'): 1,\n", + " ('przez', 'okno'): 5,\n", + " ('okno', 'świecąca'): 1,\n", + " ('świecąca', 'nagła'): 1,\n", + " ('nagła', 'cicha'): 1,\n", + " ('cicha', 'i'): 2,\n", + " ('i', 'lekka'): 1,\n", + " ('lekka', 'jak'): 1,\n", + " ('jak', 'światłość'): 1,\n", + " ('światłość', 'miesiąca'): 1,\n", + " ('miesiąca', 'nucąc'): 1,\n", + " ('nucąc', 'chwyciła'): 1,\n", + " ('chwyciła', 'suknie'): 1,\n", + " ('suknie', 'biegła'): 1,\n", + " ('biegła', 'do'): 1,\n", + " ('do', 'zwierciadła'): 1,\n", + " ('zwierciadła', 'wtem'): 1,\n", + " ('wtem', 'ujrzała'): 1,\n", + " ('ujrzała', 'młodzieńca'): 1,\n", + " ('młodzieńca', 'i'): 1,\n", + " ('z', 'rąk'): 8,\n", + " ('rąk', 'jej'): 1,\n", + " ('jej', 'wypadła'): 1,\n", + " ('wypadła', 'suknia'): 1,\n", + " ('suknia', 'a'): 1,\n", + " ('a', 'twarz'): 1,\n", + " ('twarz', 'od'): 1,\n", + " ('od', 'strachu'): 1,\n", + " ('strachu', 'i'): 1,\n", + " ('i', 'dziwu'): 1,\n", + " ('dziwu', 'pobladła'): 1,\n", + " ('pobladła', 'twarz'): 1,\n", + " ('twarz', 'podróżnego'): 1,\n", + " ('podróżnego', 'barwą'): 1,\n", + " ('barwą', 'spłonęła'): 1,\n", + " ('spłonęła', 'rumianą'): 1,\n", + " ('rumianą', 'jak'): 1,\n", + " ('jak', 'obłok'): 1,\n", + " ('obłok', 'gdy'): 1,\n", + " ('gdy', 'z'): 5,\n", + " ('z', 'jutrzenką'): 1,\n", + " ('jutrzenką', 'napotka'): 1,\n", + " ('napotka', 'się'): 1,\n", + " ('się', 'raną'): 1,\n", + " ('raną', 'skromny'): 1,\n", + " ('skromny', 'młodzieniec'): 1,\n", + " ('młodzieniec', 'oczy'): 1,\n", + " ('oczy', 'zmrużył'): 2,\n", + " ('zmrużył', 'i'): 1,\n", + " ('i', 'przysłonił'): 1,\n", + " ('przysłonił', 'chciał'): 1,\n", + " ('chciał', 'coś'): 2,\n", + " ('coś', 'mówić'): 2,\n", + " ('mówić', 'przepraszać'): 1,\n", + " ('przepraszać', 'tylko'): 1,\n", + " ('się', 'ukłonił'): 1,\n", + " ('ukłonił', 'i'): 1,\n", + " ('i', 'cofnął'): 1,\n", + " ('się', 'dziewica'): 1,\n", + " ('dziewica', 'krzyknęła'): 1,\n", + " ('krzyknęła', 'boleśnie'): 1,\n", + " ('boleśnie', 'niewyraźnie'): 1,\n", + " ('niewyraźnie', 'jak'): 1,\n", + " ('jak', 'dziecko'): 2,\n", + " ('dziecko', 'przestraszone'): 1,\n", + " ('przestraszone', 'we'): 1,\n", + " ('we', 'śnie'): 2,\n", + " ('śnie', 'podróżny'): 1,\n", + " ('podróżny', 'zląkł'): 1,\n", + " ('zląkł', 'się'): 3,\n", + " ('się', 'spojrzał'): 1,\n", + " ('spojrzał', 'lecz'): 1,\n", + " ('lecz', 'już'): 1,\n", + " ('już', 'jej'): 1,\n", + " ('jej', 'nie'): 4,\n", + " ('było', 'wyszedł'): 1,\n", + " ('wyszedł', 'zmieszany'): 1,\n", + " ('zmieszany', 'i'): 1,\n", + " ('i', 'czuł'): 3,\n", + " ('czuł', 'że'): 7,\n", + " ('że', 'mu'): 5,\n", + " ('mu', 'serce'): 1,\n", + " ('serce', 'biło'): 1,\n", + " ('biło', 'głośno'): 1,\n", + " ('głośno', 'i'): 1,\n", + " ('i', 'sam'): 5,\n", + " ('sam', 'nie'): 9,\n", + " ('nie', 'wiedział'): 8,\n", + " ('wiedział', 'czy'): 2,\n", + " ('czy', 'go'): 1,\n", + " ('go', 'miało'): 1,\n", + " ('miało', 'śmieszyć'): 1,\n", + " ('śmieszyć', 'to'): 1,\n", + " ('to', 'dziwaczne'): 1,\n", + " ('dziwaczne', 'spotkanie'): 1,\n", + " ('spotkanie', 'czy'): 1,\n", + " ('czy', 'wstydzić'): 1,\n", + " ('wstydzić', 'czy'): 1,\n", + " ('czy', 'cieszyć'): 1,\n", + " ('cieszyć', 'tymczasem'): 1,\n", + " ('tymczasem', 'na'): 2,\n", + " ('na', 'folwarku'): 1,\n", + " ('nie', 'uszło'): 1,\n", + " ('uszło', 'baczności'): 1,\n", + " ('baczności', 'że'): 1,\n", + " ('że', 'przed'): 1,\n", + " ('ganek', 'zajechał'): 1,\n", + " ('zajechał', 'któryś'): 1,\n", + " ('któryś', 'z'): 1,\n", + " ('z', 'nowych'): 1,\n", + " ('nowych', 'gości'): 1,\n", + " ('gości', 'już'): 1,\n", + " ('już', 'konie'): 1,\n", + " ('konie', 'w'): 1,\n", + " ('w', 'stajnią'): 1,\n", + " ('stajnią', 'wzięto'): 1,\n", + " ('wzięto', 'już'): 1,\n", + " ...})" + ] + }, + "execution_count": 24, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "cnt_2_grams" + ] + }, + { + "cell_type": "code", + "execution_count": 25, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "[(('się', 'w'), 67),\n", + " (('się', 'z'), 56),\n", + " (('i', 'z'), 54),\n", + " (('się', 'i'), 46),\n", + " (('i', 'w'), 44),\n", + " (('się', 'na'), 43),\n", + " (('i', 'na'), 31),\n", + " (('i', 'tak'), 30),\n", + " (('co', 'się'), 29),\n", + " (('za', 'nim'), 25)]" + ] + }, + "execution_count": 25, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "cnt_2_grams.most_common(10)" + ] + }, + { + "cell_type": "code", + "execution_count": 26, + "metadata": {}, + "outputs": [], + "source": [ + "def bigram_most_probable(word1):\n", + " word1_count = Counter({bigram:number for bigram,number in cnt_2_grams.items() if bigram[0] == word1})\n", + " total = sum(word1_count.values())\n", + " word1_most_common = dict(word1_count.most_common(10))\n", + " for k in word1_most_common.keys():\n", + " word1_most_common[k] /= total\n", + " return word1_most_common" + ] + }, + { + "cell_type": "code", + "execution_count": 27, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "{('pan', 'sędzia'): 0.1,\n", + " ('pan', 'hrabia'): 0.07333333333333333,\n", + " ('pan', 'rejent'): 0.06,\n", + " ('pan', 'tadeusz'): 0.05333333333333334,\n", + " ('pan', 'wojski'): 0.04666666666666667,\n", + " ('pan', 'bóg'): 0.04,\n", + " ('pan', 'nie'): 0.04,\n", + " ('pan', 'podkomorzy'): 0.02666666666666667,\n", + " ('pan', 'z'): 0.02,\n", + " ('pan', 'mój'): 0.02}" + ] + }, + "execution_count": 27, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "bigram_most_probable('pan')" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "### zad3" + ] + }, + { + "cell_type": "code", + "execution_count": 28, + "metadata": {}, + "outputs": [], + "source": [ + "ngrams_3 = list(ngrams(corpora_train_tokenized, 3))\n", + "cnt_3_grams = Counter(ngrams_3)" + ] + }, + { + "cell_type": "code", + "execution_count": 29, + "metadata": {}, + "outputs": [], + "source": [ + "word1 = 'pan'\n", + "word2 = 'sędzia'" + ] + }, + { + "cell_type": "code", + "execution_count": 30, + "metadata": {}, + "outputs": [], + "source": [ + "count = Counter({trigram:number for trigram,number in cnt.items() if trigram[0] == word1 and trigram[1] == word2})\n", + "total = sum(count.values())\n", + "most_common = dict(count.most_common(10))" + ] + }, + { + "cell_type": "code", + "execution_count": 31, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "[(('się', 'z', 'nim'), 7),\n", + " (('hejże', 'na', 'soplicę'), 6),\n", + " (('za', 'mych', 'czasów'), 5),\n", + " (('ostatniego', 'z', 'horeszków'), 5),\n", + " (('z', 'drugiej', 'strony'), 5),\n", + " (('raz', 'po', 'raz'), 5),\n", + " (('w', 'domu', 'sędziego'), 4),\n", + " (('z', 'wieku', 'mu'), 4),\n", + " (('wieku', 'mu', 'i'), 4),\n", + " (('mu', 'i', 'z'), 4)]" + ] + }, + "execution_count": 31, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "cnt_3_grams.most_common(10)" + ] + }, + { + "cell_type": "code", + "execution_count": 32, + "metadata": {}, + "outputs": [], + "source": [ + "def trigram_most_probable(word1, word2):\n", + " count = Counter({trigram:number for trigram,number in cnt_3_grams.items() if trigram[0] == word1 and trigram[1] == word2})\n", + " total = sum(count.values())\n", + " most_common = dict(count.most_common(10))\n", + " for k in most_common.keys():\n", + " most_common[k] /= total\n", + " return most_common" + ] + }, + { + "cell_type": "code", + "execution_count": 33, + "metadata": { + "scrolled": true + }, + "outputs": [ + { + "data": { + "text/plain": [ + "{('pan', 'sędzia', 'każe'): 0.06666666666666667,\n", + " ('pan', 'sędzia', 'a'): 0.06666666666666667,\n", + " ('pan', 'sędzia', 'nagłym'): 0.06666666666666667,\n", + " ('pan', 'sędzia', 'go'): 0.06666666666666667,\n", + " ('pan', 'sędzia', 'on'): 0.06666666666666667,\n", + " ('pan', 'sędzia', 'siedział'): 0.06666666666666667,\n", + " ('pan', 'sędzia', 'choć'): 0.06666666666666667,\n", + " ('pan', 'sędzia', 'kroczy'): 0.06666666666666667,\n", + " ('pan', 'sędzia', 'żeby'): 0.06666666666666667,\n", + " ('pan', 'sędzia', 'nawet'): 0.06666666666666667}" + ] + }, + "execution_count": 33, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "trigram_most_probable('pan', 'sędzia')" + ] + }, + { + "cell_type": "code", + "execution_count": 34, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "Counter({('pan', 'sędzia', 'każe'): 1,\n", + " ('pan', 'sędzia', 'a'): 1,\n", + " ('pan', 'sędzia', 'nagłym'): 1,\n", + " ('pan', 'sędzia', 'go'): 1,\n", + " ('pan', 'sędzia', 'on'): 1,\n", + " ('pan', 'sędzia', 'siedział'): 1,\n", + " ('pan', 'sędzia', 'choć'): 1,\n", + " ('pan', 'sędzia', 'kroczy'): 1,\n", + " ('pan', 'sędzia', 'żeby'): 1,\n", + " ('pan', 'sędzia', 'nawet'): 1,\n", + " ('pan', 'sędzia', 'ciemiężyciel'): 1,\n", + " ('pan', 'sędzia', 'to'): 1,\n", + " ('pan', 'sędzia', 'majorowi'): 1,\n", + " ('pan', 'sędzia', 'zapytał'): 1,\n", + " ('pan', 'sędzia', 'powinność'): 1})" + ] + }, + "execution_count": 34, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "Counter({trigram:number for trigram,number in cnt_3_grams.items() if trigram[0] == 'pan' and trigram[1] == 'sędzia'})\n" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "### zad5" + ] + }, + { + "cell_type": "code", + "execution_count": 35, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "[(('i',), 1768),\n", + " (('w',), 1426),\n", + " (('się',), 1275),\n", + " (('z',), 1176),\n", + " (('na',), 1083),\n", + " (('nie',), 801),\n", + " (('jak',), 500),\n", + " (('do',), 480),\n", + " (('a',), 470),\n", + " (('że',), 456)]" + ] + }, + "execution_count": 35, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "cnt_1_grams.most_common(10)" + ] + }, + { + "cell_type": "code", + "execution_count": 36, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "0.00029813577453920484" + ] + }, + "execution_count": 36, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "cnt_1_grams[('lasu',)] / sum(cnt_1_grams.values())" + ] + }, + { + "cell_type": "code", + "execution_count": 37, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "0.010416666666666666" + ] + }, + "execution_count": 37, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "(cnt_2_grams[('do','lasu',)] / \n", + " sum({bigram:number for bigram,number in cnt.items() if bigram[0] == 'do'}.values())\n", + ")" + ] + }, + { + "cell_type": "code", + "execution_count": 38, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "3.5076027289149233e-06" + ] + }, + "execution_count": 38, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "(cnt_3_grams[('poszła', 'do','lasu',)] / sum(cnt_3_grams.values())\n", + " /\n", + " sum({trigram:number for trigram,number in cnt.items() if trigram[0] == 'do' and trigram[1] == 'lasu'}.values())\n", + ")" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "### zad6" + ] + }, + { + "cell_type": "code", + "execution_count": 39, + "metadata": {}, + "outputs": [], + "source": [ + "tokenized1 = list(tokenize('I z łąk, i z pastwisk razem wracało do dworu',lowercase = True)) " + ] + }, + { + "cell_type": "code", + "execution_count": 40, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "['i', 'z', 'łąk', 'i', 'z', 'pastwisk', 'razem', 'wracało', 'do', 'dworu']" + ] + }, + "execution_count": 40, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "tokenized1" + ] + }, + { + "cell_type": "code", + "execution_count": 41, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "9" + ] + }, + "execution_count": 41, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "cnt_2_grams[('do','dworu')]" + ] + }, + { + "cell_type": "code", + "execution_count": 42, + "metadata": {}, + "outputs": [], + "source": [ + "def get_bigram_prob(tokenized_list):\n", + " prob = cnt_1_grams[(tokenized_list[0],)] / sum(cnt_1_grams.values())\n", + " for i in range(1,len(tokenized_list)):\n", + " word = tokenized_list[i]\n", + " prev_word = tokenized_list[i-1]\n", + " prob *= (cnt_2_grams[(prev_word,word)] / \n", + " sum({bigram:number for bigram,number in cnt.items() if bigram[0] == tokenized_list[i-1]}.values())\n", + " )\n", + " return prob" + ] + }, + { + "cell_type": "code", + "execution_count": 43, + "metadata": { + "scrolled": true + }, + "outputs": [ + { + "data": { + "text/plain": [ + "7.262117948789027e-16" + ] + }, + "execution_count": 43, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "get_bigram_prob(tokenized1)" + ] + }, + { + "cell_type": "code", + "execution_count": 44, + "metadata": {}, + "outputs": [], + "source": [ + "tokenized2 = list(tokenize(\"Tadeusz lewą dłonią dotykając głowy, Pozdrowił swych dowódców przez ukłon wojskowy;\",lowercase = True)) " + ] + }, + { + "cell_type": "code", + "execution_count": 45, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "['tadeusz',\n", + " 'lewą',\n", + " 'dłonią',\n", + " 'dotykając',\n", + " 'głowy',\n", + " 'pozdrowił',\n", + " 'swych',\n", + " 'dowódców',\n", + " 'przez',\n", + " 'ukłon',\n", + " 'wojskowy']" + ] + }, + "execution_count": 45, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "tokenized2" + ] + }, + { + "cell_type": "code", + "execution_count": 46, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "0.0" + ] + }, + "execution_count": 46, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "get_bigram_prob(tokenized2)" + ] + }, + { + "cell_type": "code", + "execution_count": 47, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "16598" + ] + }, + "execution_count": 47, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "len(cnt_1_grams.keys())" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "### zad7 " + ] + }, + { + "cell_type": "code", + "execution_count": 48, + "metadata": {}, + "outputs": [], + "source": [ + "def get_bigram_smoothed_prob(tokenized_list):\n", + " v_total = len(cnt_1_grams.keys())\n", + " prob = cnt_1_grams[(tokenized_list[0],)] / sum(cnt_1_grams.values())\n", + " for i in range(1,len(tokenized_list)):\n", + " word = tokenized_list[i]\n", + " prev_word = tokenized_list[i-1]\n", + " prob *= ( (cnt_2_grams[(prev_word,word)] +1) / \n", + " (v_total + sum({bigram:number for bigram,number in cnt.items() if bigram[0] == tokenized_list[i-1]}.values()))\n", + " )\n", + " return prob" + ] + }, + { + "cell_type": "code", + "execution_count": 49, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "4.332195692048526e-34" + ] + }, + "execution_count": 49, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "get_bigram_smoothed_prob(tokenized1)" + ] + }, + { + "cell_type": "code", + "execution_count": 50, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "1.0767733038442121e-45" + ] + }, + "execution_count": 50, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "get_bigram_smoothed_prob(tokenized2)" + ] + }, + { + "cell_type": "code", + "execution_count": 51, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "32.65078823244363" + ] + }, + "execution_count": 51, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "get_bigram_prob(tokenized1) ** (-1/len(tokenized1))" + ] + }, + { + "cell_type": "code", + "execution_count": 52, + "metadata": {}, + "outputs": [ + { + "ename": "ZeroDivisionError", + "evalue": "0.0 cannot be raised to a negative power", + "output_type": "error", + "traceback": [ + "\u001b[0;31m---------------------------------------------------------------------------\u001b[0m", + "\u001b[0;31mZeroDivisionError\u001b[0m Traceback (most recent call last)", + "\u001b[0;32m\u001b[0m in \u001b[0;36m\u001b[0;34m\u001b[0m\n\u001b[0;32m----> 1\u001b[0;31m \u001b[0mget_bigram_prob\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mtokenized2\u001b[0m\u001b[0;34m)\u001b[0m \u001b[0;34m**\u001b[0m \u001b[0;34m(\u001b[0m\u001b[0;34m-\u001b[0m\u001b[0;36m1\u001b[0m\u001b[0;34m/\u001b[0m\u001b[0mlen\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mtokenized2\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m", + "\u001b[0;31mZeroDivisionError\u001b[0m: 0.0 cannot be raised to a negative power" + ] + } + ], + "source": [ + "get_bigram_prob(tokenized2) ** (-1/len(tokenized2))" + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": {}, + "outputs": [], + "source": [ + "get_bigram_smoothed_prob(tokenized1) ** (-1/len(tokenized1))" + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": {}, + "outputs": [], + "source": [ + "get_bigram_smoothed_prob(tokenized2) ** (-1/len(tokenized2))" + ] + } + ], + "metadata": { + "kernelspec": { + "display_name": "Python 3", + "language": "python", + "name": "python3" + }, + "language_info": { + "codemirror_mode": { + "name": "ipython", + "version": 3 + }, + "file_extension": ".py", + "mimetype": "text/x-python", + "name": "python", + "nbconvert_exporter": "python", + "pygments_lexer": "ipython3", + "version": "3.8.5" + } + }, + "nbformat": 4, + "nbformat_minor": 4 +}