From 1dc32cbbd01f7a4bfc492529f36c8cc03747d498 Mon Sep 17 00:00:00 2001 From: Jakub Pokrywka Date: Mon, 21 Mar 2022 09:38:15 +0100 Subject: [PATCH] add 04 --- cw/04_statystyczny_model_językowy.ipynb | 30 +++++++++++++----------- 1 file changed, 16 insertions(+), 14 deletions(-) diff --git a/cw/04_statystyczny_model_językowy.ipynb b/cw/04_statystyczny_model_językowy.ipynb index ac776b8..aba0f1d 100644 --- a/cw/04_statystyczny_model_językowy.ipynb +++ b/cw/04_statystyczny_model_językowy.ipynb @@ -16,7 +16,7 @@ }, { "cell_type": "code", - "execution_count": 71, + "execution_count": 1, "metadata": {}, "outputs": [], "source": [ @@ -32,7 +32,7 @@ }, { "cell_type": "code", - "execution_count": 72, + "execution_count": 2, "metadata": {}, "outputs": [], "source": [ @@ -50,7 +50,7 @@ }, { "cell_type": "code", - "execution_count": 73, + "execution_count": 3, "metadata": {}, "outputs": [], "source": [ @@ -60,7 +60,7 @@ }, { "cell_type": "code", - "execution_count": 74, + "execution_count": 4, "metadata": {}, "outputs": [], "source": [ @@ -69,7 +69,7 @@ }, { "cell_type": "code", - "execution_count": 75, + "execution_count": 5, "metadata": {}, "outputs": [], "source": [ @@ -78,7 +78,7 @@ }, { "cell_type": "code", - "execution_count": 76, + "execution_count": 6, "metadata": { "scrolled": true }, @@ -89,7 +89,7 @@ "['Pani', 'Ala', 'ma', 'kota', 'oraz', 'ładnego', 'pieska', 'i', '3', 'chomiki']" ] }, - "execution_count": 76, + "execution_count": 6, "metadata": {}, "output_type": "execute_result" } @@ -100,7 +100,7 @@ }, { "cell_type": "code", - "execution_count": 77, + "execution_count": 7, "metadata": {}, "outputs": [], "source": [ @@ -109,7 +109,7 @@ }, { "cell_type": "code", - "execution_count": 78, + "execution_count": 8, "metadata": {}, "outputs": [ { @@ -127,7 +127,7 @@ " 'chomiki']" ] }, - "execution_count": 78, + "execution_count": 8, "metadata": {}, "output_type": "execute_result" } @@ -159,7 +159,7 @@ }, { "cell_type": "code", - "execution_count": 79, + "execution_count": 9, "metadata": {}, "outputs": [], "source": [ @@ -172,14 +172,14 @@ }, { "cell_type": "code", - "execution_count": 80, + "execution_count": 10, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ - "proszę zgłosić się do prowadzącego\n" + "model trigramowy odwrotny\n" ] } ], @@ -226,10 +226,12 @@ "\n", "Uwagi:\n", "\n", + "- warto wymyślić jakąś metodę wygładazania, bez tego może być bardzo kiepski wynik\n", "- nie trzeba korzystać z całego zbioru trenującego\n", "- zadanie to 50 punktów, za najlepsze rozwiązanie w swojej grupie (g1,g2,g3,g4,g5), przyznaję dodatkowo 40 punktów\n", "- punkty będą przyznane na gonito\n", - "- warto monitorować RAM, próbować z różnym vocab_size, można skorzystać z pythonowego Counter" + "- warto monitorować RAM, próbować z różnym vocab_size, można skorzystać z pythonowego Counter\n", + "- warto sobie zrobić dodatkowo model unigramowy w ramach ćwiczenia" ] }, {