diff --git a/docs/Pukownik C - Generowanie muzyki przy pomocy głębokiego uczenia v3.pdf b/docs/Pukownik C - Generowanie muzyki przy pomocy głębokiego uczenia v3.pdf new file mode 100644 index 0000000..9d306d5 Binary files /dev/null and b/docs/Pukownik C - Generowanie muzyki przy pomocy głębokiego uczenia v3.pdf differ diff --git a/docs/document.fdb_latexmk b/docs/document.fdb_latexmk index bac17c8..0ec934f 100644 --- a/docs/document.fdb_latexmk +++ b/docs/document.fdb_latexmk @@ -1,12 +1,12 @@ # Fdb version 3 -["makeindex document.idx"] 1593249604 "document.idx" "document.ind" "document" 1593250250 - "document.idx" 1593250228 0 d41d8cd98f00b204e9800998ecf8427e "pdflatex" +["makeindex document.idx"] 1593249604 "document.idx" "document.ind" "document" 1593251386 + "document.idx" 1593251303 0 d41d8cd98f00b204e9800998ecf8427e "pdflatex" (generated) - "document.ind" "document.ilg" -["pdflatex"] 1593250227 "/home/altarin/praca-magisterska/docs/document.tex" "/home/altarin/praca-magisterska/docs/document.pdf" "document" 1593250250 - "/home/altarin/praca-magisterska/docs/document.aux" 1593250230 11333 26fb0d8ee19be9f7782199f4de0cb310 "" - "/home/altarin/praca-magisterska/docs/document.tex" 1593250249 96169 f0b3958acc69f5dfa2e13dc369d43929 "" + "document.ind" +["pdflatex"] 1593251303 "/home/altarin/praca-magisterska/docs/document.tex" "/home/altarin/praca-magisterska/docs/document.pdf" "document" 1593251386 + "/home/altarin/praca-magisterska/docs/document.aux" 1593251306 11333 26fb0d8ee19be9f7782199f4de0cb310 "" + "/home/altarin/praca-magisterska/docs/document.tex" 1593251385 96194 4a0b7be3b0216a363dff8f924e29e7e4 "" "/usr/share/texmf-dist/fonts/enc/dvips/pl/plit.enc" 1591545468 1946 62ba825cda1ff16dbaa60d53ac60525a "" "/usr/share/texmf-dist/fonts/enc/dvips/pl/plme.enc" 1591545468 3126 59f33ff3e396436ebc36f4e7b444d5c4 "" "/usr/share/texmf-dist/fonts/enc/dvips/pl/plmi.enc" 1591545468 2005 f094775651a1386335c158fb632529f1 "" @@ -186,10 +186,10 @@ "/var/lib/texmf/fonts/map/pdftex/updmap/pdftex.map" 1592503645 334180 163417853e75f7c89e92e140d6d6e976 "" "/var/lib/texmf/web2c/pdftex/pdflatex.fmt" 1592503638 2514048 a56a08c40899d3085b1646631973a91a "" "chapter-style.sty" 1585406727 376 a4a2fb4e6d39af51a43bb1e06c2593ad "" - "document.aux" 1593250230 11333 26fb0d8ee19be9f7782199f4de0cb310 "pdflatex" + "document.aux" 1593251306 11333 26fb0d8ee19be9f7782199f4de0cb310 "pdflatex" "document.ind" 1593249604 0 d41d8cd98f00b204e9800998ecf8427e "makeindex document.idx" - "document.tex" 1593250249 96169 f0b3958acc69f5dfa2e13dc369d43929 "" - "document.toc" 1593250230 4223 dfaa133f35e4a4c6b998ace351c01aa2 "pdflatex" + "document.tex" 1593251385 96194 4a0b7be3b0216a363dff8f924e29e7e4 "" + "document.toc" 1593251306 4223 dfaa133f35e4a4c6b998ace351c01aa2 "pdflatex" "images/autoencoder.png" 1592468053 45138 e24bbc793c0955063eedc2e303d15e73 "" "images/general-midi.png" 1593247395 39913 0e59b8fcc571228fefe1db5497396d44 "" "images/gradient_descent_1_long.png" 1592468053 47914 f9804e5846a64637fbb131c17f1f41cc "" @@ -218,10 +218,10 @@ "images/waveform_axis.png" 1592468053 56303 b651cd61802789878813aad943ba85ba "" "pythonhighlight.sty" 1591814444 4822 44a39a68d852c9742af161f7166b2a03 "" (generated) - "document.aux" - "/home/altarin/praca-magisterska/docs/document.pdf" - "document.pdf" + "document.toc" "document.idx" "document.log" + "document.aux" "/home/altarin/praca-magisterska/docs/document.log" - "document.toc" + "document.pdf" + "/home/altarin/praca-magisterska/docs/document.pdf" diff --git a/docs/document.log b/docs/document.log index 2039593..102a5de 100644 --- a/docs/document.log +++ b/docs/document.log @@ -1,4 +1,4 @@ -This is pdfTeX, Version 3.14159265-2.6-1.40.21 (TeX Live 2020/Arch Linux) (preloaded format=pdflatex 2020.6.18) 27 JUN 2020 11:30 +This is pdfTeX, Version 3.14159265-2.6-1.40.21 (TeX Live 2020/Arch Linux) (preloaded format=pdflatex 2020.6.18) 27 JUN 2020 11:48 entering extended mode restricted \write18 enabled. file:line:error style messages enabled. @@ -773,7 +773,7 @@ Here is how much of TeX's memory you used: 1141 hyphenation exceptions out of 8191 60i,12n,60p,1573b,1991s stack positions out of 5000i,500n,10000p,200000b,80000s {/usr/share/texmf-dist/fonts/enc/dvips/pl/plit.enc}{/usr/share/texmf-dist/fonts/enc/dvips/pl/pltt.enc}{/usr/share/texmf-dist/fonts/enc/dvips/pl/plrm.enc}{/usr/share/texmf-dist/fonts/enc/dvips/pl/plms.enc}{/usr/share/texmf-dist/fonts/enc/dvips/pl/plmi.enc}{/usr/share/texmf-dist/fonts/enc/dvips/pl/plme.enc}{/usr/share/texmf-dist/fonts/enc/dvips/pl/plsc.enc} -Output written on /home/altarin/praca-magisterska/docs/document.pdf (63 pages, 1241518 bytes). +Output written on /home/altarin/praca-magisterska/docs/document.pdf (63 pages, 1241533 bytes). PDF statistics: 351 PDF objects out of 1000 (max. 8388607) 218 compressed objects within 3 object streams diff --git a/docs/document.pdf b/docs/document.pdf index 9d306d5..fdb59c8 100644 Binary files a/docs/document.pdf and b/docs/document.pdf differ diff --git a/docs/document.synctex.gz b/docs/document.synctex.gz index 8d30c7d..7144921 100644 Binary files a/docs/document.synctex.gz and b/docs/document.synctex.gz differ diff --git a/docs/document.tex b/docs/document.tex index f9fc798..77c2112 100644 --- a/docs/document.tex +++ b/docs/document.tex @@ -101,7 +101,7 @@ \hspace{7.5cm}{napisana pod kierunkiem}\\[-12pt] -\hspace{7.5cm}{dr hab. Tomasza Góreckiego} +\hspace{7.5cm}{dra hab. Tomasza Góreckiego} \vspace{2.2cm} @@ -378,7 +378,7 @@ The rest of this chapter discusses an example of using the proposed model to gen \section{Funkcje aktywacji} - Omawiany model służy rozwiązywaniu problemu regresji, ponieważ wartości predykcji nie są uregulowane i mogą przyjmować wartości z $\mathbb{R}$. W celu przekształcenia tego modelu, aby móc go wykorzystać do rozwiązania problemu klasyfikacji, należy dodatkowo na otrzymanym wektorze $\hat{Y}$ wykonać pewną funkcję, która przekształci wynik. W tym celu używamy funkcji aktywacji (\textit{ang. activation function}). Istnieje wiele różnych funkcji aktywacji, a każda posiada inną charakterystykę i wpływ na model. Najpopularniejszą grupą funkcji są funkcje sigmoidalne (\textit{ang. sigmoid functions}). Jedną z nich jest funkcja logistyczna (\textit{ang. logistic curve}) postaci + Omawiany model służy rozwiązywaniu problemu regresji, ponieważ wartości predykcji nie są uregulowane i mogą przyjmować wartości z $\mathbb{R}$. W celu przekształcenia tego modelu, aby móc go wykorzystać do rozwiązania problemu klasyfikacji, należy dodatkowo na otrzymanym wektorze $\boldsymbol{\hat{Y}}$ zastosować pewną funkcję, która przekształci wynik. W tym celu używamy funkcji aktywacji (\textit{ang. activation function}). Istnieje wiele różnych funkcji aktywacji, a każda posiada inną charakterystykę i wpływ na model. Najpopularniejszą grupą funkcji są funkcje sigmoidalne (\textit{ang. sigmoid functions}). Jedną z nich jest funkcja logistyczna (\textit{ang. logistic curve}) postaci \[ \sigma(x) = \frac{1}{1+e^{-x}} \] @@ -529,10 +529,10 @@ The rest of this chapter discusses an example of using the proposed model to gen \label{fig:tanh} \end{figure} - + \subsection{Sequence-to-sequence} - Model w architekturze sequence-to-sequence (\textit{ang. seq2seq}) został wymyślony z myślą o tłumaczeniu maszynowym języków, ale zastosowanie dla niego znaleziono również w rozpoznawaniu mowy, opisywaniu wideo, czy tworzeniu chatbotów. Jego główną zaletą jest przetwarzanie sekwencji elementów o różnych długościach. Jest to naturalne, ponieważ tłumacząc z języka na język często tą samą sentencję można wyrazić różną liczbę słów. Dla przykładu zdanie po polsku ,,Co dzisiaj robisz?'' zawiera trzy słowa, natomiast przetłumaczone na angielski ,,What are you doing today?'' zawiera pięć słów. Nie można tego osiągnąć zwykłą siecią LSTM, dlatego model seq2seq został zaprojektowany, aby móc go zastosować do tego typu problemów \cite{seq2seq}. %\footnote{https://towardsdatascience.com/understanding-encoder-decoder-sequence-to-sequence + Model w architekturze sequence-to-sequence (\textit{ang. seq2seq}) został wymyślony z myślą o tłumaczeniu maszynowym języków, ale zastosowanie dla niego znaleziono również w rozpoznawaniu mowy, opisywaniu wideo, czy tworzeniu chatbotów. Jego główną zaletą jest przetwarzanie sekwencji elementów o różnych długościach. Jest to naturalne, ponieważ tłumacząc z języka na język często tą samą sentencję można wyrazić różną liczbę słów. Dla przykładu zdanie po polsku ,,Co dzisiaj robisz?'' zawiera trzy słowa, natomiast przetłumaczone na język angielski ,,What are you doing today?'' zawiera pięć słów. Nie można tego osiągnąć zwykłą siecią LSTM, dlatego model seq2seq został zaprojektowany, aby móc go zastosować do tego typu problemów \cite{seq2seq}. %\footnote{https://towardsdatascience.com/understanding-encoder-decoder-sequence-to-sequence %-model-679e04af4346 26.05.2020 14:58} Model sequence-to-sequence ma dwie części, enkoder i dekoder. Obie części są w zasadzie dwiema zupełnie osobnymi modelami, połączonymi ze sobą w jedną sieć. Schemat modelu sequence-to-sequence przedstawiono na rysunku~\ref{fig:seq2seq}.