diff --git a/wyk/13_Atencja.ipynb b/wyk/13_Atencja.ipynb index 62c1a64..01ab71f 100644 --- a/wyk/13_Atencja.ipynb +++ b/wyk/13_Atencja.ipynb @@ -111,7 +111,7 @@ "\\vec{v}\\operatorname{tanh}(W_{\\alpha}[E(w_k),E(w_j)] +\n", "\\vec{b_{\\alpha}}).$$\n", "\n", - "W drugim przypadku pojawiają się dodatkowe wyuczalne paramatery: macierz $W_{\\alpha}$, wektory\n", + "W drugim przypadku pojawiają się dodatkowe wyuczalne parametry: macierz $W_{\\alpha}$, wektory\n", "$\\vec{b_{\\alpha}}$ i $\\vec{v}$.\n", "\n" ] @@ -283,7 +283,7 @@ "zdanie) źródłowy (*source sentence*) $S = (u_1,\\dots,u_{|S|})$, celem\n", "jest uzyskanie tekstu docelowego (*target sentence*)\n", "$T=(w_1,\\dots,w_{|T|})$. Zakładamy, że $S$ jest tekstem w pewnym języku\n", - "źródłowym (*source language*), zaś $T$ — w innym języku, języku\n", + "źródłowym (*source language*), $T$ zaś — w innym języku, języku\n", "docelowym (*target language*).\n", "\n", "Współczesne tłumaczenie maszynowe jest oparte na metodach\n", diff --git a/wyk/13_Atencja.org b/wyk/13_Atencja.org index cc84f9c..4ed0278 100644 --- a/wyk/13_Atencja.org +++ b/wyk/13_Atencja.org @@ -61,7 +61,7 @@ $$\hat{\alpha}_{k,j} = \vec{v}\operatorname{tanh}(W_{\alpha}[E(w_k),E(w_j)] + \vec{b_{\alpha}}).$$ -W drugim przypadku pojawiają się dodatkowe wyuczalne paramatery: macierz $W_{\alpha}$, wektory +W drugim przypadku pojawiają się dodatkowe wyuczalne parametry: macierz $W_{\alpha}$, wektory $\vec{b_{\alpha}}$ i $\vec{v}$. *** Normalizacja wag atencji @@ -151,7 +151,7 @@ translation/) na wejściu podawany jest tekst (na ogół pojedyncze zdanie) źródłowy (/source sentence/) $S = (u_1,\dots,u_{|S|})$, celem jest uzyskanie tekstu docelowego (/target sentence/) $T=(w_1,\dots,w_{|T|})$. Zakładamy, że $S$ jest tekstem w pewnym języku -źródłowym (/source language/), zaś $T$ — w innym języku, języku +źródłowym (/source language/), $T$ zaś — w innym języku, języku docelowym (/target language/). Współczesne tłumaczenie maszynowe jest oparte na metodach