diff --git a/IUM.Dla prowadzacego.ipynb b/IUM.Dla prowadzacego.ipynb index 9972ce7..017f081 100644 --- a/IUM.Dla prowadzacego.ipynb +++ b/IUM.Dla prowadzacego.ipynb @@ -2,6 +2,7 @@ "cells": [ { "cell_type": "markdown", + "id": "3ae03d8e", "metadata": {}, "source": [ "# Środowisko wykorzystywane na zajęciach" @@ -9,6 +10,7 @@ }, { "cell_type": "markdown", + "id": "dc65cc30", "metadata": {}, "source": [ "Certificat SSL dla strony: https://letsencrypt.org/\n", @@ -55,6 +57,7 @@ { "cell_type": "code", "execution_count": null, + "id": "71e2cecc", "metadata": {}, "outputs": [], "source": [] @@ -62,7 +65,7 @@ ], "metadata": { "kernelspec": { - "display_name": "Python 3", + "display_name": "Python 3 (ipykernel)", "language": "python", "name": "python3" }, @@ -76,7 +79,7 @@ "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", - "version": "3.6.9" + "version": "3.10.4" } }, "nbformat": 4, diff --git a/IUM_00.Organizacyjne.ipynb b/IUM_00.Organizacyjne.ipynb index bfb9565..d76d599 100644 --- a/IUM_00.Organizacyjne.ipynb +++ b/IUM_00.Organizacyjne.ipynb @@ -12,7 +12,7 @@ "
\n", "

Inżynieria uczenia maszynowego

\n", "

0. Informacje organizacyjne [laboratoria]

\n", - "

Tomasz Ziętkiewicz (2022)

\n", + "

Tomasz Ziętkiewicz (2023)

\n", "
\n", "\n", "![Logo 2](https://git.wmi.amu.edu.pl/AITech/Szablon/raw/branch/master/Logotyp_AITech2.jpg)" @@ -59,9 +59,10 @@ "- stopień naukowy:\tmagister inżynier\n", "- stanowisko:\tdoktorant\n", "- [Zakład Sztucznej Inteligencji](https://ai.wmi.amu.edu.pl/pl/)\n", + "- CSI - Centrum Sztucznej Inteligencji, projekt Samsung\n", "- email: tomasz.zietkiewicz@amu.edu.pl\n", "\n", - "- https://git.wmi.amu.edu.pl/tzietkiewicz/aitech-ium\n", + "- https://git.wmi.amu.edu.pl/AITech/aitech-ium\n", "- konsultacje: \n", " - przez MS Teams po wcześniejszym umówieniu\n", " - pokój B2-36, wtorki 12:00 - 13:00, po wcześniejszym umówieniu" @@ -99,15 +100,15 @@ "4. Konteneryzacja - Docker\n", "5. Biblioteki ML\n", "6. Jenkins pipeline\n", - "7. Kontrola eksperymentów - Sacred\n", - "8. Kontrola eksperymentów - MLFlow\n", + "7. Hugging Face Hub\n", + "8. Kontrola eksperymentów - Sacred\n", "9. Środowiska wirtualne\n", - "10. Kontrola eksperymentów - DVC\n", - "11. Github Actions i CML\n", - "12. Zarządzanie Jenkins\n", - "13. Raportowanie\n", - "14. Przegląd technologii\n", - "15. Przegląd technologii, cz. 2" + "10. Kontrola eksperymentów - MLFlow\n", + "11. Kontrola eksperymentów - DVC\n", + "12. Github Actions\n", + "13. Kubernetes i Kubeflow\n", + "14. Raportowanie wyników w formie publikacji naukowej\n", + "15. Prezentacja publikacji" ] }, { @@ -155,7 +156,7 @@ "Zgodnie z oficjalnymi zasadami obowiązującymi w projekcie AITech, dopuszczalna liczba nieobecności na zajęciach wynosi 3 (obowiązkowa obecność na 80% zajęć).\n", "Powyżej 3 nieobecności przemiot nie może być zaliczony.\n", "\n", - "Arkusz z obecnościami 2022: https://uam.sharepoint.com/:x:/r/sites/2022SL06-DIUMUI0LABInynieriauczeniamaszynowego-Grupa11/Shared%20Documents/General/IUM_2022-punkty-obecnosci.xlsx?d=wbb3bd617ca544c08b2cecd196b3bd383&csf=1&web=1&e=5LZlpq" + "Arkusz z obecnościami 2023: https://uam.sharepoint.com/:x:/s/2023SL06-DIUMUI0LABInynieriauczeniamaszynowego-Grupa11/EWdi4uIh2AVBmlYx-2j4cpgBEDUOWviU1QHUayM98EuuIw?e=fe4uxl" ] } ], @@ -164,7 +165,7 @@ "celltoolbar": "Slideshow", "email": "tomasz.zietkiewicz@amu.edu.pl", "kernelspec": { - "display_name": "Python 3", + "display_name": "Python 3 (ipykernel)", "language": "python", "name": "python3" }, @@ -179,7 +180,7 @@ "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", - "version": "3.9.1" + "version": "3.10.4" }, "slideshow": { "slide_type": "slide" diff --git a/IUM_01.Wprowadzenie.ipynb b/IUM_01.Wprowadzenie.ipynb index a798c45..0f4e97a 100644 --- a/IUM_01.Wprowadzenie.ipynb +++ b/IUM_01.Wprowadzenie.ipynb @@ -12,7 +12,7 @@ "
\n", "

Inżynieria uczenia maszynowego

\n", "

1. Wprowadzenie [laboratoria]

\n", - "

Tomasz Ziętkiewicz (2021)

\n", + "

Tomasz Ziętkiewicz (2023)

\n", "
\n", "\n", "![Logo 2](https://git.wmi.amu.edu.pl/AITech/Szablon/raw/branch/master/Logotyp_AITech2.jpg)" @@ -115,6 +115,7 @@ "source": [ "## 1.2.1 Systemy ciągłej integracji\n", " - Jenkins
\n", + " - Github Actions
\n", " - Bamboo
\n", " - Circle CI
\n", " - Team City
\n", @@ -205,7 +206,7 @@ "celltoolbar": "Slideshow", "email": "tomasz.zietkiewicz@amu.edu.pl", "kernelspec": { - "display_name": "Python 3", + "display_name": "Python 3 (ipykernel)", "language": "python", "name": "python3" }, @@ -220,7 +221,7 @@ "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", - "version": "3.9.1" + "version": "3.10.4" }, "slideshow": { "slide_type": "slide" diff --git a/IUM_02.Dane.ipynb b/IUM_02.Dane.ipynb index 9c5a5ad..cabe1bf 100644 --- a/IUM_02.Dane.ipynb +++ b/IUM_02.Dane.ipynb @@ -12,7 +12,7 @@ "
\n", "

Inżynieria uczenia maszynowego

\n", "

2. Dane [laboratoria]

\n", - "

Tomasz Ziętkiewicz (2021)

\n", + "

Tomasz Ziętkiewicz (2023)

\n", "
\n", "\n", "![Logo 2](https://git.wmi.amu.edu.pl/AITech/Szablon/raw/branch/master/Logotyp_AITech2.jpg)" @@ -59,11 +59,11 @@ "source": [ "# Źródła danych\n", "- Gotowe zbiory:\n", - " - Otwarte wyzwania (challenge)\n", - " - Repozytoria otwartych zbiorów danych\n", - " - Dane udostępniane przez firmy\n", - " - Repozytoria zbiorów komercyjnych\n", - " - Dane wewnętrzne (np. firmy)" + " - Otwarte wyzwania (challenge)\n", + " - Repozytoria otwartych zbiorów danych\n", + " - Dane udostępniane przez firmy\n", + " - Repozytoria zbiorów komercyjnych\n", + " - Dane wewnętrzne (np. firmy)" ] }, { @@ -96,7 +96,8 @@ "- Semeval: https://semeval.github.io/ - zadania z semantyki\n", "- Poleval: http://poleval.pl/ - przetwarzanie języka polskiego\n", "- WMT http://www.statmt.org/wmt20/ (tłumaczenie maszynowe)\n", - "- IWSLT https://iwslt.org/2021/#shared-tasks (tłumaczenie mowy)" + "- IWSLT https://iwslt.org/2021/#shared-tasks (tłumaczenie mowy)\n", + "- CNLPS - Challenges for Natural Language Processing - https://fedcsis.org/sessions/aaia/cnlps" ] }, { @@ -108,6 +109,7 @@ }, "source": [ "## Repozytoria/wyszukiwarki otwartych zbiorów danych\n", + "- Huggingface Datasets: https://huggingface.co/datasets\n", "- Papers with code: https://paperswithcode.com/datasets\n", "- UCI Machine Learning Repository: https://archive.ics.uci.edu/ml/ (University of California)\n", "- Google dataset search: https://datasetsearch.research.google.com/\n", @@ -126,11 +128,11 @@ "source": [ "## Otwarte zbiory\n", "- Rozpoznawanie mowy:\n", - " - https://www.openslr.org/ - Libri Speech, TED Lium\n", - " - Mozilla Open Voice: https://commonvoice.mozilla.org/\n", + " - https://www.openslr.org/ - Libri Speech, TED Lium\n", + " - Mozilla Open Voice: https://commonvoice.mozilla.org/\n", "- NLP:\n", - " - Clarin: https://clarin-pl.eu/index.php/zasoby/\n", - " - NKJP: http://nkjp.pl/\n", + " - Clarin: https://clarin-pl.eu/index.php/zasoby/\n", + " - NKJP: http://nkjp.pl/\n", " " ] }, @@ -1551,7 +1553,7 @@ "- Skrypt możesz napisać w swoim ulubionym języku. Jedyne ograniczenie: ma działać pod Linuxem\n", "- Wygodnie będzie stworzyć zeszyt Jupyter w tym celu (choć nie jest to konieczne)\n", "- Stwórz na wydziałowym serwerze git (http://git.wmi.amu.edu.pl/) repozytorium \"ium_nrindeksu\" i umieść w nim stworzony skrypt\n", - "- Link do repozytorium wklej do arkusza ze zbiorami: https://uam.sharepoint.com/:x:/s/2022SL06-DIUMUI0LABInynieriauczeniamaszynowego-Grupa11/EaID4LM20YhOhxxL-VHxPogBCTq4uXpLHQAzrCeDzPv1dw?e=HfXKqB\n" + "- Link do repozytorium wklej do arkusza ze zbiorami: https://uam.sharepoint.com/:x:/r/sites/2023SL06-DIUMUI0LABInynieriauczeniamaszynowego-Grupa11/Shared%20Documents/General/IUM-2023-zapisy.xlsx?d=w49d444e07d864d2997ef7d72c5a47da0&csf=1&web=1&e=aeDtve\n" ] }, { @@ -1573,7 +1575,7 @@ "celltoolbar": "Slideshow", "email": "tomasz.zietkiewicz@amu.edu.pl", "kernelspec": { - "display_name": "Python 3", + "display_name": "Python 3 (ipykernel)", "language": "python", "name": "python3" }, @@ -1588,7 +1590,7 @@ "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", - "version": "3.9.1" + "version": "3.10.4" }, "slideshow": { "slide_type": "slide" diff --git a/IUM_05.Biblioteki_DL.ipynb b/IUM_05.Biblioteki_DL.ipynb index a472d9f..bcde56c 100644 --- a/IUM_05.Biblioteki_DL.ipynb +++ b/IUM_05.Biblioteki_DL.ipynb @@ -298,9 +298,10 @@ "\n", "1. Wybierz jeden z frameworków ML (jeden z powyższych, ale może być też inny) i zaimplementuj w nim prostą sieć neuronową rozwiązującą wybrany problem (np regresji lub klasyfikacji) na wybranym na poprzednich zajęciach zbiorze. Możesz wzorować się (lub nawet skopiować) na jednym z tutotoriali do danego frameworka.\n", " - wczytaj dane trenujące z pliku [2 pkt.]\n", - " - wytrenuj na nich model [8 pkt.]\n", - " - przy jego pomocy dokonaj klasyfikacji/regresji na danych ze zbioru testującego [8 pkt.]\n", - " - zapisz wyniki zwrócone przez model do pliku [2 pkt.]
\n", + " - wytrenuj na nich model [6 pkt.]\n", + " - zapisz model do pliku [2 pkt.]\n", + " - w osobnym skypcie, przy pomocy zapisanego wcześniej modelu, dokonaj predykcji na danych ze zbioru testującego [8 pkt.]\n", + " - zapisz wyniki predykcji zwrócone przez model do pliku (nie metryki, tylko wyniki predykcji, czyli te informacje, które model miał przewidzieć) [2 pkt.]
\n", " Uwagi:\n", " - wyniki nie są najważniejsze - o ile twój model nie zwraca losowych danych ;)\n", " - nie musisz wnikać głęboko w szczegóły trenowania modelu i inferencji. W tym zadaniu chodzi o poznanie API i praktycznych aspektów\n", @@ -316,7 +317,7 @@ "celltoolbar": "Slideshow", "email": "tomasz.zietkiewicz@amu.edu.pl", "kernelspec": { - "display_name": "Python 3", + "display_name": "Python 3 (ipykernel)", "language": "python", "name": "python3" }, @@ -331,7 +332,7 @@ "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", - "version": "3.9.1" + "version": "3.10.4" }, "slideshow": { "slide_type": "slide" diff --git a/IUM_06.Jenkins-2.ipynb b/IUM_06.Jenkins-2.ipynb index 9f826f2..f3f5d59 100644 --- a/IUM_06.Jenkins-2.ipynb +++ b/IUM_06.Jenkins-2.ipynb @@ -203,22 +203,27 @@ "source": [ "## Zadanie 2 [15 pkt] (termin: 2 V 2022)\n", "1. Stwórz na Jenkins projekt typu Multibranch pipeline o nazwie s123456-evaluation.\n", - " Projekt ten będzie przeprowadzał ewaluację modelu stworzonego w s123456-training na danych ze zbioru trenującego [1pkt]\n", - "2. Ewaluacja polega na wyliczeniu zbiorczych metryk (1-3 metryki) na zbiorze testującym (np. Accuracy, Micro-avg precission/recall, F1, RMSE - patrz [wykład 4. \"Metody ewaluacji\"])(https://git.wmi.amu.edu.pl/AITech/aitech-uma/src/branch/master/wyk/04_Metody_ewaluacji.ipynb) z przedmiotu Uczenie Maszynowe), zapisaniu metryk(i( do pliku i zarchiwizowaniu go [3 pkt]\n", + " Projekt ten będzie przeprowadzał ewaluację modelu stworzonego w s123456-training na danych ze zbioru trenującego [1 pkt]\n", + "2. Ewaluacja polega na:\n", + " - wczytaniu wytrenowanego wcześniej modelu\n", + " - dokonaniu predykcji na zbiorze testowym za pomocą wczytanego modelu i zapisanie wyników tej predykcji do pliku\n", + " - wyliczeniu zbiorczych metryk (1-3 metryki) na zbiorze testującym (np. Accuracy, Micro-avg precission/recall, F1, RMSE - patrz [wykład 4. \"Metody ewaluacji\"])(https://git.wmi.amu.edu.pl/AITech/aitech-uma/src/branch/master/wyk/04_Metody_ewaluacji.ipynb) z przedmiotu Uczenie Maszynowe), \n", + " - zapisaniu metryk do pliku\n", + " - zarchiwizowaniu go\n", + " [6 pkt]\n", "3. W celu śledzenia zmian wartości metryk, zapisuj wartości kumulatywnie w jednym pliku. Żeby to osiągnąć można: \n", " - zapisywać metryki w ścieżce zewnątrznej w stosunku do Jenkinsa (w innym przypadku mogą zostać nadpisane np. podczas checkout repozytorium) - tej opcji nie wykorzystamy\n", " - dopisywać metrykę do końca pliku skopiowanego z artefaktów poprzedniego builda (należy uczynić kopiowanie tego artefaktu opcjonalnym, żeby pierwszt build na danym branchu nie \"wywalił się\" przy próbie skopiowania artefaktów z nieistniejącego joba) [2 pkt]\n", - "4. Mając skumulowane wartości metryk z wszystkich dotychczasowych buildów, stwórz wykres: na osi X numer builda, na osi Y wartość metryk(i). [3 pkt]\n", + "4. Mając skumulowane wartości metryk z wszystkich dotychczasowych buildów, stwórz wykres: na osi X numer builda, na osi Y wartość metryk(i). [2 pkt]\n", " Możesz w tym celu użyć:\n", " - pluginu [plot](https://plugins.jenkins.io/plot)\n", " - [Matplotlib](https://matplotlib.org/) - biblioteka pythonowa - w tym przypadku archiwizuj wygenerowany obrazek z wykresem\n", " - [Gnuplot](http://www.gnuplot.info/) - w tym przypadku archiwizuj wygenerowany obrazek z wykresem\n", - "5. Projekt powinien odpalać się automatycznie po zakończonym trenowaniu (s123456-training) i kopiować model z artefaktów. Zauważ, że żeby odpalony projekt (s123456-evaluation) skopiował artefakty z odpowiedniego brancha (tego, który go odpalił), projekt s123456-evaluation musi być wywołany przez s123456-training z odpowiednią wartością parametru branch (patrz punkt 7.) [2pkt]\n", + "5. Projekt powinien odpalać się automatycznie po zakończonym trenowaniu (s123456-training) i kopiować model z artefaktów. Zauważ, że żeby odpalony projekt (s123456-evaluation) skopiował artefakty z odpowiedniego brancha (tego, który go odpalił), projekt s123456-evaluation musi być wywołany przez s123456-training z odpowiednią wartością parametru branch (patrz punkt 7.) [1 pkt]\n", "6. Dane testujące powinny być skopiowane z projektu s123456-create-dataset [1pkt]\n", "7. Dodaj parametry umożliwiające wybór:\n", " - gałęzi (branch) projektu s123456-training z której ma być skopiowany model. Można by tutaj użyć prostego parametru typu String, ale użyj łatwiejszego (w użytkowaniu) parametru typu \"Git parameter\" (patrz wyżej)[1 pkt]\n", - " - numeru builda projektu s123456-training (\"Build selector for Copy artifact\", patrz zajęcia 3.) [1pkt]\n", - "8. Ewaluacja modelu potrafi zająć dużo czasu. Sprawdzanie co 10 minut, czy już się zakończyła, to zły pomysł. Dodaj powiadomienie o zakończonej ewaluacji zawierające status builda oraz wynik ewaluacji (wartość obliczonej metryki) [1 pkt]" + " - numeru builda projektu s123456-training (\"Build selector for Copy artifact\", patrz zajęcia 3.) [1pkt]" ] } ], diff --git a/IUM_07.Sacred.ipynb b/IUM_07.Sacred.ipynb index dc5ce50..07a508b 100644 --- a/IUM_07.Sacred.ipynb +++ b/IUM_07.Sacred.ipynb @@ -1621,7 +1621,7 @@ "celltoolbar": "Slideshow", "email": "tomasz.zietkiewicz@amu.edu.pl", "kernelspec": { - "display_name": "Python 3", + "display_name": "Python 3 (ipykernel)", "language": "python", "name": "python3" }, @@ -1636,7 +1636,7 @@ "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", - "version": "3.6.9" + "version": "3.10.4" }, "slideshow": { "slide_type": "slide" diff --git a/IUM_08.MLFlow.ipynb b/IUM_08.MLFlow.ipynb index 6c7cdea..9efe928 100644 --- a/IUM_08.MLFlow.ipynb +++ b/IUM_08.MLFlow.ipynb @@ -1435,7 +1435,7 @@ "celltoolbar": "Slideshow", "email": "tomasz.zietkiewicz@amu.edu.pl", "kernelspec": { - "display_name": "Python 3", + "display_name": "Python 3 (ipykernel)", "language": "python", "name": "python3" }, @@ -1450,7 +1450,7 @@ "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", - "version": "3.6.9" + "version": "3.10.4" }, "slideshow": { "slide_type": "slide" diff --git a/IUM_09.Python_srodowiska.ipynb b/IUM_09.Python_srodowiska.ipynb index 6756f43..1819ac2 100644 --- a/IUM_09.Python_srodowiska.ipynb +++ b/IUM_09.Python_srodowiska.ipynb @@ -1742,7 +1742,7 @@ "celltoolbar": "Slideshow", "email": "tomasz.zietkiewicz@amu.edu.pl", "kernelspec": { - "display_name": "Python 3", + "display_name": "Python 3 (ipykernel)", "language": "python", "name": "python3" }, @@ -1757,7 +1757,7 @@ "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", - "version": "3.6.9" + "version": "3.10.4" }, "slideshow": { "slide_type": "slide" diff --git a/IUM_10.DVC.ipynb b/IUM_10.DVC.ipynb index 8e81d10..fba8869 100644 --- a/IUM_10.DVC.ipynb +++ b/IUM_10.DVC.ipynb @@ -568,7 +568,7 @@ }, { "cell_type": "code", - "execution_count": 2, + "execution_count": 3, "id": "c13c525b", "metadata": { "slideshow": { @@ -602,7 +602,7 @@ }, { "cell_type": "code", - "execution_count": 75, + "execution_count": 4, "id": "44f28226", "metadata": { "slideshow": { @@ -614,23 +614,7 @@ "name": "stdout", "output_type": "stream", "text": [ - "Initialized DVC repository.\n", - "\n", - "You can now commit the changes to git.\n", - "\n", - "\u001b[31m+---------------------------------------------------------------------+\n", - "\u001b[0m\u001b[31m|\u001b[0m \u001b[31m|\u001b[0m\n", - "\u001b[31m|\u001b[0m DVC has enabled anonymous aggregate usage analytics. \u001b[31m|\u001b[0m\n", - "\u001b[31m|\u001b[0m Read the analytics documentation (and how to opt-out) here: \u001b[31m|\u001b[0m\n", - "\u001b[31m|\u001b[0m <\u001b[36mhttps://dvc.org/doc/user-guide/analytics\u001b[39m> \u001b[31m|\u001b[0m\n", - "\u001b[31m|\u001b[0m \u001b[31m|\u001b[0m\n", - "\u001b[31m+---------------------------------------------------------------------+\n", - "\u001b[0m\n", - "\u001b[33mWhat's next?\u001b[39m\n", - "\u001b[33m------------\u001b[39m\n", - "- Check out the documentation: <\u001b[36mhttps://dvc.org/doc\u001b[39m>\n", - "- Get help and share ideas: <\u001b[36mhttps://dvc.org/chat\u001b[39m>\n", - "- Star us on GitHub: <\u001b[36mhttps://github.com/iterative/dvc\u001b[39m>\n", + "\u001b[31mERROR\u001b[39m: failed to initiate DVC - '.dvc' exists. Use `-f` to force.\n", "\u001b[0m" ] } @@ -654,7 +638,7 @@ }, { "cell_type": "code", - "execution_count": 4, + "execution_count": 5, "id": "d1aefe16", "metadata": { "slideshow": { @@ -667,14 +651,9 @@ "output_type": "stream", "text": [ "On branch master\r\n", - "\r\n", - "No commits yet\r\n", - "\r\n", "Changes to be committed:\r\n", - " (use \"git rm --cached ...\" to unstage)\r\n", - "\t\u001b[32mnew file: .dvc/.gitignore\u001b[m\r\n", - "\t\u001b[32mnew file: .dvc/config\u001b[m\r\n", - "\t\u001b[32mnew file: .dvcignore\u001b[m\r\n", + " (use \"git restore --staged ...\" to unstage)\r\n", + "\t\u001b[32mmodified: .dvc/config\u001b[m\r\n", "\r\n" ] } @@ -769,7 +748,7 @@ }, { "cell_type": "code", - "execution_count": 9, + "execution_count": 6, "id": "f05ece1b", "metadata": { "slideshow": { @@ -781,10 +760,9 @@ "name": "stdout", "output_type": "stream", "text": [ - "Warning: Your Kaggle API key is readable by other users on this system! To fix this, you can run 'chmod 600 /home/tomek/.kaggle/kaggle.json'\n", "Downloading iris.zip to /home/tomek/repos/aitech-ium/IUM_10/sample-ml-project\n", " 0%| | 0.00/3.60k [00:00...\" to include in what will be committed)\r\n", - "\t\u001b[31mdata/.gitignore\u001b[m\r\n", - "\t\u001b[31mdata/Iris.csv.dvc\u001b[m\r\n", + "Changes to be committed:\r\n", + " (use \"git restore --staged ...\" to unstage)\r\n", + "\t\u001b[32mmodified: .dvc/config\u001b[m\r\n", "\r\n", - "nothing added to commit but untracked files present (use \"git add\" to track)\r\n" + "Changes not staged for commit:\r\n", + " (use \"git add ...\" to update what will be committed)\r\n", + " (use \"git restore ...\" to discard changes in working directory)\r\n", + "\t\u001b[31mmodified: data/Iris.csv.dvc\u001b[m\r\n", + "\r\n" ] } ], @@ -912,7 +893,7 @@ }, { "cell_type": "code", - "execution_count": 12, + "execution_count": 9, "id": "460c4a17", "metadata": { "slideshow": { @@ -926,7 +907,7 @@ }, { "cell_type": "code", - "execution_count": 13, + "execution_count": 10, "id": "80644077", "metadata": { "slideshow": { @@ -938,10 +919,8 @@ "name": "stdout", "output_type": "stream", "text": [ - "[master 67214ea] Dodano dane IRIS (DVC)\n", - " 2 files changed, 5 insertions(+)\n", - " create mode 100644 data/.gitignore\n", - " create mode 100644 data/Iris.csv.dvc\n" + "[master b37a8d8] Dodano dane IRIS (DVC)\r\n", + " 2 files changed, 2 insertions(+), 6 deletions(-)\r\n" ] } ], @@ -1243,7 +1222,7 @@ }, { "cell_type": "code", - "execution_count": 32, + "execution_count": 12, "id": "dde39796", "metadata": { "slideshow": { @@ -1257,7 +1236,7 @@ }, { "cell_type": "code", - "execution_count": 33, + "execution_count": 13, "id": "7f14ec60", "metadata": { "slideshow": { @@ -1280,7 +1259,7 @@ }, { "cell_type": "code", - "execution_count": 34, + "execution_count": 14, "id": "8a841039", "metadata": { "slideshow": { @@ -1305,7 +1284,7 @@ }, { "cell_type": "code", - "execution_count": 35, + "execution_count": 15, "id": "bf6c1067", "metadata": { "slideshow": { @@ -1326,13 +1305,13 @@ " 0%| |Transferring 0/1 [00:00 master\n", + "Branch 'master' set up to track remote branch 'master' from 'origin'.\n" + ] + } + ], + "source": [ + "!git remote add origin git@git.wmi.amu.edu.pl:tzietkiewicz/sample-ml-project.git\n", + "!git push --set-upstream origin master" + ] + }, + { + "cell_type": "code", + "execution_count": null, + "id": "67896105", + "metadata": {}, + "outputs": [], + "source": [] } ], "metadata": { diff --git a/IUM_11.CML.ipynb b/IUM_11.CML.ipynb index 065eb44..cd789cd 100644 --- a/IUM_11.CML.ipynb +++ b/IUM_11.CML.ipynb @@ -13,7 +13,7 @@ "
\n", "

Inżynieria uczenia maszynowego

\n", "

11. Github actions i CML [laboratoria]

\n", - "

Tomasz Ziętkiewicz (2021)

\n", + "

Tomasz Ziętkiewicz (2022)

\n", "
\n", "\n", "![Logo 2](https://git.wmi.amu.edu.pl/AITech/Szablon/raw/branch/master/Logotyp_AITech2.jpg)" @@ -70,13 +70,13 @@ "source": [ "### Terminologia Github Actions\n", " - *Workflow* - workflow odpowiada \"Pipeline\" z Jenkinsa.\n", + " - *Event* - zdażenie, które odapala (\"triggers\") uruchomienie \"Workflow\". Np. wypchnięcie zmiany do repozytorium (\"push\"), utworzenie Pull requesta. [Pełna lista](https://docs.github.com/en/actions/reference/events-that-trigger-workflows)\n", " - *Job* - workflow składa się z jednego lub kilku \"jobs\". Każdy z nich może być wykonywany równolegle na innej maszynie (patrz \"runner\")\n", " - *Step* - odpowiednik \"Stage\" z Jenkinsa - służu do grupowania \"Actions\"\n", - " - *Action* - odpowiednik \"Step\" z Jenkinsa - pojedyncze polecenie do wykonania, np. dodanie komentarze do Pull requesta, wykonanie polecenia systemowego itp.\n", + " - *Action/command* - odpowiednik \"Step\" z Jenkinsa - pojedyncze polecenie do wykonania, np. dodanie komentarze do Pull requesta, wykonanie polecenia systemowego itp.\n", " - *Runner* - odpowiednik Jenkinsowego \"Agent\" - serwer, na którym mogą być wykonywane zadania (\"jobs\")\n", " - *Github-hosted runner* - serwer utrzymywany przez Github (2-core CPU, 7 GB RAM, 14 GB SSD). Windows, Linux albo macOS\n", - " - *Self-hosted runner* - nasz własny serwer, z zinstalowaną aplikacją [Github actions runner](https://github.com/actions/runner)\n", - " - *Event* - zdażenie, które odapala (\"triggers\") uruchomienie Workflow. Np. wypchnięcie zmiany do repozytorium (\"push\"), utworzenie Pull requesta. [Pełna lista](https://docs.github.com/en/actions/reference/events-that-trigger-workflows)" + " - *Self-hosted runner* - nasz własny serwer, z zinstalowaną aplikacją [Github actions runner](https://github.com/actions/runner)" ] }, { @@ -89,7 +89,7 @@ }, "source": [ "### Definicja workflow\n", - " - Workflow definiuje się w plikach YAM(o rozszerzeniu `*.yml` albo `*.yaml`) umieszczonych w specjalnym folderze `.github/workflows/` wewnątrz repozytorium\n", + " - Workflow definiuje się w plikach YAML(o rozszerzeniu `*.yml` albo `*.yaml`) umieszczonych w specjalnym folderze `.github/workflows/` wewnątrz repozytorium\n", " - Pełna składnia jest opisana [tutaj](https://docs.github.com/en/actions/reference/workflow-syntax-for-github-actions)\n", " - Podstawowe pola:\n", " - `name` [opcjonalna] - nazwa, pod którą workflow/step będzie widoczny w UI. Domyślnie ścieżka do pliku yaml\n", @@ -547,7 +547,7 @@ } }, "source": [ - "## Zadania\n", + "## Zadania [15 pkt]\n", "1. Utwórz konto na Github (jeśli jeszcze nie masz)\n", "2. Stwórz publiczne repozytorium. Link do niego wklej do kolumny \"Link Github\" w arkuszu [\"Zapisy na zbiory\"](https://teams.microsoft.com/l/file/F62B5988-A797-418D-B085-52E0AF8BD55E?tenantId=73689ee1-b42f-4e25-a5f6-66d1f29bc092&fileType=xlsx&objectUrl=https%3A%2F%2Fuam.sharepoint.com%2Fsites%2F2021SL06-DIUMUI0LABInynieriauczeniamaszynowego-Grupa11%2FShared%20Documents%2FGeneral%2FZapisy%20na%20zbiory.xlsx&baseUrl=https%3A%2F%2Fuam.sharepoint.com%2Fsites%2F2021SL06-DIUMUI0LABInynieriauczeniamaszynowego-Grupa11&serviceName=teams&threadId=19:d67b0dc2ee0849eba517a2aa8507df9c@thread.tacv2&groupId=8cd6b30e-edd9-48db-85ab-259fc11d0c5b) [1 pkt]\n", "2. Stwórz prosty Github workflow wykorzystujący akcje CML, który:\n", @@ -562,7 +562,7 @@ "author": "Tomasz Ziętkiewicz", "email": "tomasz.zietkiewicz@amu.edu.pl", "kernelspec": { - "display_name": "Python 3", + "display_name": "Python 3 (ipykernel)", "language": "python", "name": "python3" }, @@ -577,7 +577,7 @@ "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", - "version": "3.9.1" + "version": "3.10.4" }, "slideshow": { "slide_type": "slide" diff --git a/IUM_12.Praca.ipynb b/IUM_12.Praca.ipynb index cd55d87..855b6da 100644 --- a/IUM_12.Praca.ipynb +++ b/IUM_12.Praca.ipynb @@ -66,7 +66,7 @@ "author": "Tomasz Ziętkiewicz", "email": "tomasz.zietkiewicz@amu.edu.pl", "kernelspec": { - "display_name": "Python 3", + "display_name": "Python 3 (ipykernel)", "language": "python", "name": "python3" }, @@ -81,7 +81,7 @@ "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", - "version": "3.9.1" + "version": "3.10.4" }, "slideshow": { "slide_type": "slide" diff --git a/IUM_12.Publikacja.ipynb b/IUM_12.Publikacja.ipynb index 6bdf34d..3942ee9 100644 --- a/IUM_12.Publikacja.ipynb +++ b/IUM_12.Publikacja.ipynb @@ -21,20 +21,186 @@ }, { "cell_type": "markdown", - "id": "harmful-bachelor", + "id": "a5f10a0e", + "metadata": {}, + "source": [ + "# Abstract\n", + "- Umiejętność pisania artykułu naukowego może okazać się przydatna dla osób zajmujących się uczeniem maszynowym.\n", + "- Zastosowanie klarownej struktury dokumentu ułatwia jego odbiór jak i tworzenie.\n", + "- LaTeX + Overleaf jaka narzędzia do składu artykułu" + ] + }, + { + "cell_type": "markdown", + "id": "35d3630d", + "metadata": {}, + "source": [ + "## Introduction\n", + "\n", + "- Uczenie maszynowe i jego zastosowania to prężnie rozwijająca się dziedzina nauki\n", + "- Żeby nadążyć za jej rozwojem musimy czytać artykuły naukowe\n", + "- A jeśli nasza praca ma charakter badawczy, to warto taki artykuł napisać i opublikować\n", + "- Nasz pracodawca może od nas tego wymagać lub przynajmniej zachęcać\n", + "- Dlatego zapoznamy się z:\n", + "1. Strukturą artykułu naukowego\n", + "2. Technicznymi aspektami jego tworzenia" + ] + }, + { + "cell_type": "markdown", + "id": "1033fc4d", + "metadata": {}, + "source": [ + "### Related work\n", + "\n", + "Jak napisać artykuł naukowy z dziedziny ML:\n", + "- http://www.isle.org/~langley/papers/craft.ml2k.pdf / https://icml.cc/Conferences/2002/craft.html\n", + "- https://www.researchgate.net/publication/337857231_How_to_Write_a_Machine_Learning_Paper_for_not_so_Dummies/comments\n", + "- https://towardsdatascience.com/writing-more-successful-machine-learning-research-papers-39863ca9ea90\n", + "- https://towardsdatascience.com/tips-for-reading-and-writing-an-ml-research-paper-a505863055cf\n", + "\n", + "Dobre wyjaśnienie struktury artykułu naukowego znajdziemy w napisanym po polsku artykule\n", + "- https://ekulczycki.pl/warsztat_badacza/struktura-artykulu-naukowego-uniwersalne-wytyczne-i-przydatne-wskazowki/" + ] + }, + { + "cell_type": "markdown", + "id": "2c7eb238", + "metadata": {}, + "source": [ + "## Methods" + ] + }, + { + "cell_type": "markdown", + "id": "changed-president", "metadata": { "slideshow": { "slide_type": "slide" } }, "source": [ - "## Latex\n", + "### Struktura artykułu naukowego\n", + "Struktura [(A)IMRaD](https://en.wikipedia.org/wiki/IMRAD):\n", + "\n", + "0. Abstrakt (**A**bstract) - Dlaczego, jak, \n", + "1. Wprowadzenie (**I**ntroduction) - \"Dlaczego?\"\n", + " \n", + " 1.1 Related work - \"Kontekst naukowy\"\n", + "2. Metody (**M**ethod) - \"Jak?\"\n", + "3. Wyniki (**R**esults) - \"Co?\"\n", + "4. Wnioski (**D**iscussion/Conclusions) - \"Interpretacja wyników\"" + ] + }, + { + "cell_type": "markdown", + "id": "8cb9b025", + "metadata": {}, + "source": [ + "" + ] + }, + { + "cell_type": "markdown", + "id": "d3e245eb", + "metadata": {}, + "source": [ + "#### Tytuł\n", + "- powinien odzwierciedlać treść artykułu ;)\n", + "- nie za długi (< 12 wyrazów)\n", + "- lepiej, żeby nie był pytaniem (patrz [Prawo nagłówków Betteridge'a](https://pl.wikipedia.org/wiki/Prawo_nag%C5%82%C3%B3wk%C3%B3w_Betteridge%E2%80%99a), choć [niekoniecznie](https://link.springer.com/article/10.1007/s11192-016-2030-2))\n", + "- dobry artykuł może mieć krótki, chwytliwy tytuł, szczególnie, jeśli autorzy mają renomę ;) Przykłady:\n", + " - [\"Attention Is All You Need\"](https://arxiv.org/abs/1706.03762)" + ] + }, + { + "cell_type": "markdown", + "id": "1f150ddb", + "metadata": {}, + "source": [ + "#### Abstrakt\n", + "\n", + "- stanowi samodzielną całość - powinien być zrozumiały bez reszty artykułu\n", + "- jest bardzo istotny - stanowi \"reklamówkę\" naszej pracy - ma zachęcić do lektury\n", + "- powinien zawierać wszystkie najważniejsz elementy artykułu i mieć podobną strukturę (IMRaD)" + ] + }, + { + "cell_type": "markdown", + "id": "6005b4bd", + "metadata": {}, + "source": [ + "#### Wprowadzenie\n", + " - Kontekst badań\n", + " - Motywacja\n", + " - Co chcemy właściwie zbadać - sformułowanie hipotezy badawczej" + ] + }, + { + "cell_type": "markdown", + "id": "1308de25", + "metadata": {}, + "source": [ + "#### Related work\n", + " - Kontekst naukowy\n", + " - Co zrobiono przed nami\n", + " - Musimy się do tego odnieść w dalszej części i zaznaczyć co nasze badania wnoszą nowego do dziedziny\n", + " - Cytujemy najważniejsze prace\n", + " - Najlepiej zaczącć szeroko i w przeszłości i stopniowo przechodzili do coraz nowszych i bardziej szczegółowych badań, bliżej związanych z tematyką poruszaną w naszym artykule." + ] + }, + { + "cell_type": "markdown", + "id": "b6cf4464", + "metadata": {}, + "source": [ + "#### Metody\n", + "- Jak przeprowadziliśmy nasze badania/eksperymenty\n", + "- Informacje tu zawarte w powinny umożliwić zreprodukowanie naszych wyników innym badaczom\n", + "- Opisujemy:\n", + " - Dane\n", + " - Algorytmy/architekturę\n", + " - możemy, choć nie musimy, podać techniczne szczegóły dotyczące implementacji, np. użyty framework. Zazwyczaj jednak kwestie techniczne nie są istotne i możemy od nich abstachować a na potrzeby reprodukowalności wyników najlepiej po prostu opublikować kod źródłowy/dane i wspomnieć o tym w artykule\n", + " - Procedurę ewaluacji/testowania\n", + "- Warto na naszych dancyh przetestować metodą bazową (\"baseline\") - np. obecny SOTA (\"State of the art\"), żeby potem móc do niej porównać nasze rozwiązanie." + ] + }, + { + "cell_type": "markdown", + "id": "5aee7988", + "metadata": {}, + "source": [ + "#### Wyniki\n", + "- Jakie wyniki otrzymaliśmy\n", + "- Powstrzymajmy się z ich interpretacją\n", + "- Możemy dokonywać porównań, ale z opiniami w stylu \"Nasze podejście deklasuje obecny SOTA\" (State Of The Art) poczekajmy do następnej sekcji" + ] + }, + { + "cell_type": "markdown", + "id": "7be88b24", + "metadata": {}, + "source": [ + "#### Konkluzje\n", + "- Interpretacja wyników\n", + "- Jakie jest ich znaczenie?\n", + "- Jak prezentują się w szerszym kontekście\n", + "- Tak jak we wprowaszeniu przechodzimy od ogółu do szczegółu (zawężamy perspektywę), tutaj postępujemy odwrotnie - zaczynając od szczegółowej interpretacji przechodzimy do znaczenia wyników w szerszym kontekście" + ] + }, + { + "cell_type": "markdown", + "id": "4753cf22", + "metadata": {}, + "source": [ + "### Latex\n", "\n", "- LaTeX (wym. *Latech*) to system składu tekstu\n", + "- Najbardziej popularny w dziedzinach technicznych\n", "- https://www.latex-project.org//\n", - "- Podejście [WYSIWYM](https://pl.wikipedia.org/wiki/WYSIWYM)(\"What you see is what you mean\") w przeciwieństwie do WYSIWIG (What you see is what you get).\n", - "- Piszemy tekst ze znacznikami, kompipujemy, dostajemy gotowy dokument, np. pdf\n", - "- Stosowany powszechnie do pisania publikacji naukowych na konferencje, do czasopism i książek\n", + "- Podejście [WYSIWYM](https://pl.wikipedia.org/wiki/WYSIWYM)(\"What you see is what you mean\") w przeciwieństwie do WYSIWIG (What you see is what you get - przykład: Word).\n", + "- Piszemy tekst ze znacznikami, kompilujemy, dostajemy gotowy dokument, np. pdf\n", + "- Stosowany powszechnie do pisania publikacji naukowych (artykułów, książek jak i rozpraw nukowych)\n", "- Pozwala łatwo zmienić styl/szablon\n", "- W założeniu, podczas pisania skupiamy się na treści i strukturze a LaTeX sam zatroszczy się o wygląd\n", "- Przystępna dokumentacja: https://www.overleaf.com/learn/latex/Learn_LaTeX_in_30_minutes" @@ -42,7 +208,7 @@ }, { "cell_type": "markdown", - "id": "d9a75fe6", + "id": "918e3b39", "metadata": {}, "source": [ "### Struktura\n", @@ -178,7 +344,7 @@ }, { "cell_type": "markdown", - "id": "dfb6a34c", + "id": "3ea5c879", "metadata": {}, "source": [ "```bibtex\n", @@ -244,50 +410,22 @@ }, { "cell_type": "markdown", - "id": "changed-president", - "metadata": { - "slideshow": { - "slide_type": "slide" - } - }, + "id": "e1822b3c", + "metadata": {}, "source": [ - "## Części artykułu naukowego\n", - "1. Abstract\n", - " \n", - "2. Introduction - \"Dlaczego?\"\n", - "3. Related work - \"Kontekst naukowy\"\n", - "4. Method - \"Jak?\"\n", - "5. Results - \"Co?\"\n", - "6. Conclusions/Discussion - \"Interpretacja wyników\"" + "### JupyterBook\n", + "https://jupyterbook.org/en/stable/intro.html\n" ] }, { "cell_type": "markdown", - "id": "challenging-student", - "metadata": { - "slideshow": { - "slide_type": "slide" - } - }, + "id": "ceef2f3f", + "metadata": {}, "source": [ - "![Tajny język naukowców](https://i1.kwejk.pl/k/obrazki/2017/10/2b48483a6c4f274aa276732e41f856af.jpg)" - ] - }, - { - "cell_type": "markdown", - "id": "dangerous-headquarters", - "metadata": { - "slideshow": { - "slide_type": "slide" - } - }, - "source": [ - "## Jak napisać artykuł naukowy z dziedziny ML:\n", - "- http://www.isle.org/~langley/papers/craft.ml2k.pdf / https://icml.cc/Conferences/2002/craft.html\n", - "- https://www.researchgate.net/publication/337857231_How_to_Write_a_Machine_Learning_Paper_for_not_so_Dummies/comments\n", - "- https://towardsdatascience.com/writing-more-successful-machine-learning-research-papers-39863ca9ea90\n", - "- https://towardsdatascience.com/tips-for-reading-and-writing-an-ml-research-paper-a505863055cf\n", - "- https://ekulczycki.pl/warsztat_badacza/struktura-artykulu-naukowego-uniwersalne-wytyczne-i-przydatne-wskazowki/" + "### The Turing Way\n", + "*The Turing Way handbook to reproducible, ethical and collaborative data science*\n", + "\n", + "https://the-turing-way.netlify.app/welcome.html" ] }, { @@ -299,7 +437,8 @@ } }, "source": [ - "### Zadanie\n", + "## Conclusions\n", + "### Zadanie [30pkt]\n", "1. Wybierz konferencję naukową z dziedziny ML/AI/Computer Science\n", "2. Używając szablonu Latex udostępnionego przez organizatorów konferencji, stwórz szkic artykułu naukowego opisującego wyniki eksperymentów ML, które przeprowadziłaś/eś w trakcie zajęć.\n", "3. Napisz artykuł używając Overleaf. Udostępnij w [arkuszu z zapisami](https://uam.sharepoint.com/:x:/r/sites/2022SL06-DIUMUI0LABInynieriauczeniamaszynowego-Grupa11/Shared%20Documents/General/Zapisy%20zbiory%20danych.xlsx?d=wb3e003a2d1364e88871c4bf951f13e88&csf=1&web=1&e=cXzeeV) link udostępniający dokument ([jak stworzyć taki link](https://www.overleaf.com/learn/how-to/What_is_Link_Sharing%3F))\n", @@ -315,6 +454,18 @@ "Zapewne w napisanym artykule nie opiszą państwo niczego nowatorskiego i wartego publikacji - tutaj udajemy, że zastosowaliśmy metodę po raz pierwszy, osiągnęliśmy nieosiągalne dotąd wyniki itp. Liczy się forma i struktura pracy. Można dodać komentarz wyjaśniający prawdziwy cel artykuły w sekcji/przypisie \"Disclaimer\", żeby nikt Państwa nie posądzał o pisanie nieprawdy.\n", " " ] + }, + { + "cell_type": "markdown", + "id": "challenging-student", + "metadata": { + "slideshow": { + "slide_type": "slide" + } + }, + "source": [ + "![Tajny język naukowców](https://i1.kwejk.pl/k/obrazki/2017/10/2b48483a6c4f274aa276732e41f856af.jpg)" + ] } ], "metadata": {