pms/ium

Fork 1

forked from AITech/aitech-ium

Paweł Skórzewski a2e7fd33ba Drobne poprawki

2024-05-06 10:36:27 +02:00

12 KiB

Raw Blame History

Inżynieria uczenia maszynowego

3 kwietnia 2024

5. Biblioteki do uczenia głębokiego

Plan na dziś

Przegląd bibliotek DL (_deep learning):

Tensorflow
Pytorch
Caffe
Caffe2
Deeplearning4J
CNTK (Microsoft Cognitive Toolkit)
ML.NET
MXNet
Porównanie
Formaty wymiany modeli

Zadanie

Dynamiczne vs statyczne grafy obliczeniowe

Żeby wytrenować sieć neuronową, musimy skonstruować graf obliczeniowy
Graf może być:
- statyczny - definiowany raz dla wszystkich danych wejściowych
- dynamiczny - zmienny, w zależności od danych wejściowych
Zalety grafu dynamicznego:
- bardziej elastyczny i interaktywny - nie musimy kompilować grafu przed jego uruchomieniem
- łatwiejszy w debudowaniu
Zalety grafu statycznego:
- szybszy - łatwiej zaptymalizować
- przenośny - łatwiej go "wyeksportować" - graf zawiera wszystkie informacje konieczne do inferencji

1. Tensorflow

https://tensorflow.org
Open source
Rozwijana przez google
Bogaty "ekosystem"
Napisana w C/C++ i Pythonie
Liczne interfejsy/bindingi: Python, Java, Javascript (poprzez Tensorflow.js), Go, Rust, Swift
Łatwy do osadzenia dzięki Tensorflow Lite - runtime dla urządzeń mobilnych (C,C++,Java,Swift, Objective-C)
"Serwowanie" modeli przez REST API dzięki Tensorflow Serving
Trenowanie na GPU, TPU. Distributed training
Statyczny graf obliczeń, ale of wersji 2.0 dostępne "Eager execution", które umożliwia wykonywanie operacji w sieci bez budowania grafu

1.1 Keras

keras.io
Wysokopoziomowy interfejs do Tensorflow 2.0

Przykład IRIS w Tensorflow/Keras

https://www.tensorflow.org/tutorials/customization/custom_training_walkthrough

2. PyTorch

https://pytorch.org/
Open source (licencja BSD)
Napisana w Pythonie i C++
Interfejs w Python (oraz C++)
Rozwijany przez Facebook jako kontynywacja projektu Torch, napisanego w Lua/C/C++
Bogaty "ekosystem"
Dynamiczny graf obliczeń
Możliwość osadzenia na urządzeniach Android i iOS (Torch mobile)
Serwowanie modeli przez REST dzięki TorchServe
Przykład klasyfikacji Iris w PyTorch: https://www.kaggle.com/aaditkapoor1201/iris-classification-pytorch

3. Caffe

http://caffe.berkeleyvision.org/
Rozwijana przez Berkley AI Research
OpenSource (licencja BSD)
Napisany w C++
Interfejs w C++, Python, Matlab
Używana głównie do ropoznawania obrazów, ale nie tylko

4. Caffe2

https://caffe2.ai/
Rozwijana przez Facebook
zmergowana do repozytorium PyTorch
Open source
Głównie zastosowania produkcyjne, w tym modele embedded (Caffe2go)
PyTorch: łatwość eksperymentowania, research. Caffe2: wydajność, urządzenia mobilne
ONNX jako format wymiany między Caffe2 i PyTorch

5. Deeplearning4J

aka. DL4J, Deep Learning for Java
https://deeplearning4j.org/
Rozwijana przez Eclipse Foundation
Open source (licencja Apache 2.0)
Napisana w Javie i C++
Interfejsy: Java, Scala, Clojure, Kotlin
Możliość importu modeli Keras
Przykład klasyfikacji Iris: https://deeplearning4j.konduit.ai/android/linear-classifier

6. CNTK (Microsoft Cognitive Toolkit)

https://cntk.azurewebsites.net/
Rozwijana przez ... Microsoft (Rozwój porzucony w 2019 roku)
Open source (licencja MIT)
Napisana w C++
API: Python, C#, C++

7. ML.NET

https://dot.net/ml
Rozwijana przez Microsoft
Open source (licencja MIT)
Napisana w C#, C++
API: .NET, Python (bindingi poprzez NimbusML)
Przykłady klasyfikacji Iris:
- https://docs.microsoft.com/pl-pl/dotnet/machine-learning/tutorials/iris-clustering
- https://github.com/dotnet/machinelearning-samples/tree/main/samples/csharp/getting-started/MulticlassClassification_Iris
Więcej przykładów: https://github.com/dotnet/machinelearning-samples

8. MXNet

https://mxnet.apache.org/
Open source (Apache 2.0)
Był rozwijany przez Apache Software Foundation
Backend napisany w C++
Iterfejsy: Python (główny) i dodatkowo for Scala, Julia, Clojure, Java, C++, R i Perl
Możliwość osadzenia na urządzeniach mobilnych dzięki amalgamacji

9. Porównanie

Framework	Autor	Licencja	Język	Interface	Uwagi
Tensorflow	Google	Apache 2.0	C++, Python	C,C++,Python,Java,Javascript
Keras	Google	MIT	Python	Python	Wysokopoziomowy interfejs do Tensorflow
Tensorflow JS	Google	Apache 2.0	Javascript	Javascript
PyTorch	Facebook	BSD	C++,Python	C,Python, Java
Caffe	BAIR	BSD	C++	Python,Matlab
Caffe2	Facebook	BSD	C++	C++,Python	Od 3 lat (2018) część PyTorch
CNTK	Microsoft	MIT	C++	Python, C++, C#	nierozwijany od 01.2019
ML.NET	Microsoft	MIT	C++, C##	.NET, Python
MXNet	Apache Foundation	Apache 2.0	C++, Python	Python, Scala, Julia, Clojure, Java, C++, R i Perl	nierozwijany od 05.2022

9. Formaty wymiany

większość bibliotek używa innego formatu do zapisu modeli
istnieją otwarte, uniwersalne formaty zapisu modeli sieci neuronowych, które mają za zadanie umożliwienie dzielenia modeli między bibliotekami
Lista operacji wspieranych przez formaty nie zawiera wszystkich operacji używanych przez różna biblioteki, dlatego czasami kownwersja do ONNX nie jest w pełni możliwa
ONNX - Open Neural Network Exchange
- https://onnx.ai/
- utrzymywany przez "społeczność"
- narzędzia umożliwiające konwersję do formatu ONNX modeli z najpopularniejszych bibliotek NN/ML
- modele ONNX mogą być uruchomione (czasami po konwersji) przy pomocy wielu runtimów
NNEF - Neural Network Exchange Format
- https://www.khronos.org/nnef/
- wspierany przez Khronos Group (Nvidia, ATI, Intel, Sun, ...) - ta sama, która rozwija OpenGL
- konwersja z/do ONNX, Caffe, Caffe2, TensorFlow

Zadanie [22 pkt.]

Termin: 24 kwietnia 2024

Wybierz jeden z frameworków ML (jeden z powyższych, ale może być też inny) i zaimplementuj w nim prostą sieć neuronową rozwiązującą wybrany problem (np regresji lub klasyfikacji) na wybranym na poprzednich zajęciach zbiorze. Możesz wzorować się (lub nawet skopiować) na jednym z tutoriali do danego frameworka.
- wczytaj dane trenujące [2 pkt.]
- wytrenuj na nich model [6 pkt.]
- zapisz model do pliku [2 pkt.]
- w osobnym skypcie, przy pomocy zapisanego wcześniej modelu, dokonaj predykcji na danych ze zbioru testującego [8 pkt.]
- zapisz wyniki predykcji zwrócone przez model do pliku (nie metryki, tylko wyniki predykcji, czyli te informacje, które model miał przewidzieć) [2 pkt.]
  Uwagi:
- wyniki nie są najważniejsze - o ile twój model nie zwraca losowych danych ;)
- nie musisz wnikać głęboko w szczegóły trenowania modelu i inferencji. W tym zadaniu chodzi o poznanie API i praktycznych aspektów
- kod i stworzony model będziemy wykorzystywać na następnych zajęciach

Dostosuj Dockerfile przygotowany na poprzednich zajęciach tak, żeby móc w zdefiniowanym w nim kontenerze wytrenować i uruchomić sieć przygotowaną w punkcie 1 [2 pkt.]

12 KiB Raw Blame History

Inżynieria uczenia maszynowego

3 kwietnia 2024

5. Biblioteki do uczenia głębokiego

Plan na dziś

Dynamiczne vs statyczne grafy obliczeniowe

1. Tensorflow

1.1 Keras

Przykład IRIS w Tensorflow/Keras

2. PyTorch

3. Caffe

4. Caffe2

5. Deeplearning4J

6. CNTK (Microsoft Cognitive Toolkit)

7. ML.NET

8. MXNet

9. Porównanie

9. Formaty wymiany

Zadanie [22 pkt.]

12 KiB

Raw Blame History