dpzc-4/04_Public_cloud/04_zadania.ipynb
nlitkowski e248075771 a
2022-01-05 01:08:54 +01:00

364 lines
41 KiB
Plaintext

{
"cells": [
{
"cell_type": "markdown",
"metadata": {},
"source": [
"# Zadania domowe\n",
"\n",
"W ramach tego modułu do zdobycia są 4 punkty. \n",
"\n",
"> **Uwaga**: Zdanie 4.1 można wykonać conajwyżej 2 razy u różnych dostawców. Pozostałe zadania można wykonać tylko raz.\n",
"\n",
"> **Uwaga**: Zadanie 4.2 można wykonać tylko u dostawców oferujących usługę automatycznego skalowania (AWS, Azure).\n",
"\n",
"> **Uwaga**: Łącznie można wykonać zadania za znacznie więcej niż dostępnych 4 punktów. Uzyskany wynik zostanie jednak obcięty do wartości maksymalnej.\n"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"## Zadanie 4.1 (2 punkty)\n",
"Celem tego zadania jest przedstawienie rozwiązania tylu *load balancer*.\n",
"\n",
"Zadanie polega na uruchomieniu prostego webserwisu w infrastrukturze chmurowej w wielu instancjach jednocześnie z zapewnieniem pojedynczego punktu dostępowego, który będzie dynamicznie delegował żądania do dostępnych instancji.\n",
"\n",
"Webserwis udostępnia jeden endpoint HTTP `/factors/<liczba>`, zwracający odpowiedź w formacie `JSON`, która zawiera listę czynników pierwszych liczby zawartej w żądaniu. Przesłana w żądaniu liczba musi być liczbą całkowitą, większą od 1, w przeciwnym razie serwis zwraca kod błędu 400. Nie ma ograniczenia na wielkość danych wejściowych. Dla dostatecznie dużej liczby czas oczekiwania na odpowiedź może być bardzo długi.\n",
"\n",
"Przykładowo dla zapytania\n",
"```bash\n",
"curl <adres_serwera>:<port>/factors/10\n",
"```\n",
"odpowiedź to\n",
"```json\n",
"[2, 5]\n",
"```\n",
"\n",
"Dany jest program w postaci binarnej (skompilowanej na architekturę `amd64`, jednowątkowy), realizujący ten webserwis na porcie 8080.\n",
"\n",
"### Sposób sprawdzania zadania\n",
"Zadanie będzie sprawdzane półautomatycznie. Do skryptu sprawdzającego należy podać adres URL webserwisu. Sprawdzarka będzie w kilku wątkach jednocześnie wysyłała żądania pod wskazany adres. Jeden wątek (t0) wysyłać będzie małe liczby, dla których rozkład będzie zajmował poniżej sekundy. W tym samym czasie kolejne wątki, dodawane w regularnych odstępach czasu, będą wysyłały bardzo duże liczby, dla których rozkład na czynniki pierwsze będzie wymagał przynajmniej kilku sekund. Zadanie zostanie zaliczone wtedy, gdy wątek wysyłający małe liczby (t0) będzie otrzymywać odpowiedzi z serwera szybko, bez oczekiwania na rozłożenie większych liczb.\n",
"\n",
"Poniżej przykładowe wykresy dla różnych konfiguracji:\n",
"\n",
"* brak równoważenia obciążenia (1 worker) \n",
"\n",
" ![brak równoważenia obciążenia (1 worker)](obrazy/Z01_1worker.png)\n",
"* równoważenie obciążenia bez skalowania (2 workery) \n",
"\n",
" ![równoważenie obciążenia bez skalowania (2 workery)](obrazy/Z01_2workers.png)\n",
"* równoważenie obciążenia (4 workery) \n",
"\n",
" ![równoważenie obciążenia (4 workery) ](obrazy/Z01_4workers.png)\n",
"* równoważenie obciążenia bez skalowania (5 workerów) \n",
"\n",
" ![równoważenie obciążenia bez skalowania (5 workerów)](obrazy/Z01_5workers.png)"
]
},
{
"cell_type": "code",
"execution_count": 5,
"metadata": {},
"outputs": [
{
"name": "stderr",
"output_type": "stream",
"text": [
"INFO:root:Thread: 0\treqs: 5\tmean time: 0.096s\tfast\t\n",
"INFO:root:Thread: 0\treqs: 5\tmean time: 0.096s\tfast\t\n",
"INFO:root:Thread: 1\treqs: 2\tmean time: 1.403s\t\n",
"INFO:root:Thread: 0\treqs: 5\tmean time: 0.098s\tfast\t\n",
"INFO:root:Thread: 0\treqs: 5\tmean time: 0.096s\tfast\t\n",
"INFO:root:Thread: 1\treqs: 2\tmean time: 1.539s\t\n",
"INFO:root:Thread: 2\treqs: 2\tmean time: 2.062s\t\n",
"INFO:root:Thread: 0\treqs: 4\tmean time: 0.194s\tfast\t\n",
"INFO:root:Thread: 1\treqs: 1\tmean time: 2.307s\t\n",
"INFO:root:Thread: 0\treqs: 4\tmean time: 0.149s\tfast\t\n",
"INFO:root:Thread: 2\treqs: 2\tmean time: 1.845s\t\n",
"INFO:root:Thread: 3\treqs: 1\tmean time: 2.299s\t\n",
"INFO:root:Thread: 0\treqs: 4\tmean time: 0.196s\tfast\t\n",
"INFO:root:Thread: 1\treqs: 2\tmean time: 2.098s\t\n",
"INFO:root:Thread: 3\treqs: 2\tmean time: 1.765s\t\n",
"INFO:root:Thread: 2\treqs: 1\tmean time: 2.092s\t\n",
"INFO:root:Thread: 0\treqs: 4\tmean time: 0.164s\tfast\t\n",
"INFO:root:Thread: 4\treqs: 1\tmean time: 2.503s\t\n",
"INFO:root:Thread: 1\treqs: 1\tmean time: 2.268s\t\n",
"INFO:root:Thread: 2\treqs: 1\tmean time: 2.200s\t\n",
"INFO:root:Thread: 3\treqs: 1\tmean time: 2.651s\t\n",
"INFO:root:Thread: 0\treqs: 4\tmean time: 0.183s\tfast\t\n",
"INFO:root:Thread: 1\treqs: 1\tmean time: 2.306s\t\n",
"INFO:root:Thread: 4\treqs: 1\tmean time: 2.493s\t\n",
"INFO:root:Thread: 2\treqs: 1\tmean time: 2.536s\t\n",
"INFO:root:Thread: 3\treqs: 1\tmean time: 2.698s\t\n",
"INFO:root:Thread: 0\treqs: 4\tmean time: 0.179s\tfast\t\n",
"INFO:root:Thread: 4\treqs: 2\tmean time: 1.972s\t\n",
"INFO:root:Thread: 2\treqs: 1\tmean time: 2.053s\t\n",
"INFO:root:Thread: 0\treqs: 4\tmean time: 0.140s\tfast\t\n",
"INFO:root:Thread: 3\treqs: 1\tmean time: 2.207s\t\n",
"INFO:root:Thread: 1\treqs: 1\tmean time: 2.321s\t\n",
"INFO:root:Thread: 3\treqs: 1\tmean time: 2.080s\t\n",
"INFO:root:Thread: 0\treqs: 5\tmean time: 0.101s\tfast\t\n",
"INFO:root:Thread: 2\treqs: 2\tmean time: 1.699s\t\n",
"INFO:root:Thread: 1\treqs: 2\tmean time: 1.651s\t\n",
"INFO:root:Thread: 1\treqs: 1\tmean time: 1.333s\t\n",
"INFO:root:Thread: 0\treqs: 5\tmean time: 0.104s\tfast\t\n",
"INFO:root:Thread: 0\treqs: 5\tmean time: 0.099s\tfast\t\n",
"INFO:root:Thread: 0\treqs: 5\tmean time: 0.098s\tfast\t\n",
"INFO:root:Thread: 0\treqs: 5\tmean time: 0.100s\tfast\t\n"
]
}
],
"source": [
"import requests\n",
"import random\n",
"import math\n",
"import time\n",
"import threading\n",
"import logging\n",
"logging.getLogger().setLevel(logging.INFO)\n",
"\n",
"\n",
"API_URL=\"http://localhost:8080\"\n",
"\n",
"\n",
"UNIT = 5.0 # secs\n",
"\n",
"# Pre generated primes\n",
"first_primes_list = [2, 3, 5, 7, 11, 13, 17, 19, 23, 29,\n",
" 31, 37, 41, 43, 47, 53, 59, 61, 67,\n",
" 71, 73, 79, 83, 89, 97, 101, 103,\n",
" 107, 109, 113, 127, 131, 137, 139,\n",
" 149, 151, 157, 163, 167, 173, 179,\n",
" 181, 191, 193, 197, 199, 211, 223,\n",
" 227, 229, 233, 239, 241, 251, 257,\n",
" 263, 269, 271, 277, 281, 283, 293,\n",
" 307, 311, 313, 317, 331, 337, 347, 349]\n",
"\n",
"\n",
"def nBitRandom(n):\n",
" return random.randrange(2**(n-1)+1, 2**n - 1)\n",
" \n",
"def getLowLevelPrime(n):\n",
" '''Generate a prime candidate divisible\n",
" by first primes'''\n",
" while True:\n",
" # Obtain a random number\n",
" pc = nBitRandom(n)\n",
" \n",
" # Test divisibility by pre-generated\n",
" # primes\n",
" for divisor in first_primes_list:\n",
" if pc % divisor == 0 and divisor**2 <= pc:\n",
" break\n",
" else: return pc\n",
" \n",
"def isMillerRabinPassed(mrc):\n",
" '''Run 20 iterations of Rabin Miller Primality test'''\n",
" maxDivisionsByTwo = 0\n",
" ec = mrc-1\n",
" while ec % 2 == 0:\n",
" ec >>= 1\n",
" maxDivisionsByTwo += 1\n",
" assert(2**maxDivisionsByTwo * ec == mrc-1)\n",
" \n",
" def trialComposite(round_tester):\n",
" if pow(round_tester, ec, mrc) == 1:\n",
" return False\n",
" for i in range(maxDivisionsByTwo):\n",
" if pow(round_tester, 2**i * ec, mrc) == mrc-1:\n",
" return False\n",
" return True\n",
" \n",
" # Set number of trials here\n",
" numberOfRabinTrials = 20\n",
" for i in range(numberOfRabinTrials):\n",
" round_tester = random.randrange(2, mrc)\n",
" if trialComposite(round_tester):\n",
" return False\n",
" return True\n",
" \n",
"def random_large_prime(bits):\n",
" while True:\n",
" prime_candidate = getLowLevelPrime(bits)\n",
" if not isMillerRabinPassed(prime_candidate):\n",
" continue\n",
" else:\n",
" return prime_candidate\n",
"\n",
"def thread_function(i, fast, timeout):\n",
" start = time.time()\n",
"\n",
" c = 5 # bits: 20: 200ms; 21: 350ms; 22: 700ms 23: 1.5s; 25: 6s; 26: 10s; 27: 24s\n",
" bits = 19 if fast else 23\n",
" last_report = time.time()\n",
" processing_time = 0.0\n",
" reqs = 0\n",
" while True:\n",
" iter_start = time.time()\n",
" if iter_start - start > timeout:\n",
" logging.info(\"Thread: %d\\treqs: %d\\tmean time: %.3fs\\t%s\"%(i, reqs, processing_time/reqs if reqs>0 else 0.0, \"fast\\t\" if fast else \"\"))\n",
" results[i][iter_start] = processing_time/reqs if reqs>0 else 0.0\n",
" return\n",
" if iter_start - last_report > UNIT/2:\n",
" if len(results[i])%2 == 0:\n",
" logging.info(\"Thread: %d\\treqs: %d\\tmean time: %.3fs\\t%s\"%(i, reqs, processing_time/reqs if reqs>0 else 0.0, \"fast\\t\" if fast else \"\"))\n",
" results[i][iter_start] = processing_time/reqs if reqs>0 else 0.0\n",
" processing_time = 0.0\n",
" reqs = 0\n",
" last_report=iter_start\n",
"\n",
" factors = [random_large_prime(bits) for i in range(c)]\n",
" factors.sort()\n",
" n=math.prod(factors)\n",
"\n",
" r = requests.get(API_URL+'/factors/%d'%(n))\n",
" if r.status_code != 200:\n",
" logging.error(\"wrong status code from webservice\")\n",
" else:\n",
" result = r.json()\n",
" if result != factors:\n",
" logging.error(\"Wrong factors\")\n",
"\n",
" processing_time+=time.time() - iter_start\n",
" reqs+=1\n",
" time.sleep(0.5)\n",
"\n",
"START = time.time()\n",
"slow_threads = 4\n",
"\n",
"results = [ {} for i in range(slow_threads+1)]\n",
"\n",
"t0 = threading.Thread(target=thread_function, args=(0, True, (5 + slow_threads*3) * UNIT))\n",
"t0.start()\n",
"time.sleep(2 * UNIT)\n",
"for i in range(slow_threads):\n",
" t = threading.Thread(target=thread_function, args=(i+1, False, (slow_threads-i) * 3 * UNIT))\n",
" t.start()\n",
" time.sleep(2 * UNIT)\n",
"\n",
"t0.join()"
]
},
{
"cell_type": "code",
"execution_count": 6,
"metadata": {},
"outputs": [
{
"data": {
"image/png": "",
"text/plain": [
"<Figure size 432x288 with 1 Axes>"
]
},
"metadata": {
"needs_background": "light"
},
"output_type": "display_data"
}
],
"source": [
"import numpy as np\n",
"import matplotlib.pyplot as plt\n",
"import scipy.stats as stats\n",
"mu = 0\n",
"std = 1\n",
"for i, result in enumerate(results):\n",
" x = [(x - START)/UNIT for x in result.keys()]\n",
" y = result.values()\n",
" plt.plot(x, y, label=\"t%d\"%(i,))\n",
"\n",
"plt.legend()\n",
"plt.show()"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"## Zadanie 4.2 (2 punkty + 2 punkty za 4.1)\n",
"\n",
"Zadanie polega na rozbudowaniu rozwiązania 4.1 o usługę automatycznego skalowania. Webserwis w wariancie początkowym powinien dysponować 2 instancjami (jak w zadaniu 4.1). Jednak w przypadku wzrostu ilości żądań powinien automatycznie przeskalować się poprzez dodanie nowych instancji (do maksymalnie 5).\n",
"\n",
"### Sposób sprawdzania zadania\n",
"Zadanie będzie sprawdzane półautomatycznie z wykorzystaniem skryptu z zadania poprzedniego.\n",
"\n",
"> **Wskazówka**: Mechaznim autoamtycznego skalowania potrzebuje trochę czasu aby zadziałać, konieczne może okazać się zwiększenie wartości zmiennej UNIT z 5 sekund do 30-60 sekund.\n",
"\n",
"## Zadanie 4.3 (2 punkty, wymaga zaliczenia zadania 4.1 lub 4.2)\n",
"Zautomatyzuj wykonanie zadania 4.1 lub 4.2 tak aby cała infrastruktura (łącznie z zasobami chmurowymi, konfiguracją maszyn i oprogramowania) wykonywana była przez odpowiedni skrypt za pośrednictwem jednej komendy w konsoli. Na koniec swojego działania komenda ma wyświetlać URL dostępowy do webserwisu.\n",
"\n",
"Sam skrypt oraz wszystkie niezbędne pliki (np. cloud-init, pliki konfiguracyjne, itp.) powinny znajdować się na repozytorium Git.\n",
"\n",
"> Uwaga: Pamiętaj aby przygotować stosowną dokumentację (w formacie Markdown w pliku README.md) opisującą konfigurację środowiska wymaganą przez ten skrypt (autoryzacja do platform chmury obliczeniowej, zmienne środowiskowe, itp.). Nie powinna ona jednak być zbyt skomplikowana i wykraczać znacznie poza autoryzację do chmury.\n",
"\n",
"> Wskazówka: Technologia w której przygotowany zostanie skrypt nie jest ograniczona, wymagane jest tylko umożliwienie uruchomienia jej na systemie Linux (np. Ubuntu/Debian) bez potrzeby nadmiernej rekonfiguracji systemu. W przypadku potrzeby skorzystania z niestandardowych narzędzi, zalecane jest skorzystanie z narzędzia Docker, zbudowanie specjalnego obrazu i wykonanie skryptu z jego poziomu.\n",
"\n",
"### Sposób sprawdzania zadania\n",
"Zadanie sprawdzane jest ręcznie poprzez sklonowanie repozytorium Git, wykonanie konfiguracji zgodnie z dokumentacją, wywołanie odpowiedniego skryptu i ręczne sprawdzenie czy system został zbudowany zgodnie ze specyfikacją. Skrypt będzie wykonywany w środowisku zapewnionym i skonfigurowanym przez prowadzącego zajęcia. Przykład sposobu wykonania skryptu przez prowadzącego:\n",
"\n",
"```bash\n",
"git clone git@git.wmi.amu.edu.pl:s<index>/<repo_name>.git\n",
"cd <repo_name>\n",
"./deploy.sh\n",
"```\n",
"\n",
"Po zakończeniu skryptu deploy, przeprowadzona zostanie procedura sprawdzania zadania 4.1 lub zadania 4.2."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"## Zadanie 4.4 (3 punkty)\n",
"Zadanie ma na celu uświadomienie różnic w cennikach różnych dostawców usług chmurowych.\n",
"\n",
"> **Wskazówka**: Zadanie można realizować we dwie osoby, obie otrzymują wtedy taką samą ilość punktów.\n",
"\n",
"Zadanie polega na przeanalizowaniu kosztów wdrożenia przykładowego systemu informatycznego u różnych dostawców chmury obliczeniowej. Rozwiązaniem zadania będzie raport przygotowany w formacie PDF porównujący koszt wdrożenia danego systemu w przynajmniej 4 wariantach u przynajmniej dwóch różnych dostawców. Oprócz łącznego kosztu (startowego i miesiecznego) należy porównać też koszt poszczególnych składowych, uwzględnić możliwe promocje (reserved, spot, itp). Zakładamy, że system będzie działał nieprzerwanie przez rok.\n",
"\n",
"**Specyfikacja systemu**\n",
"\n",
"> **Uwaga**: Opisywana specyfikacja dotyczy rzeczywistego systemu informatycznego będącego kopalnią kryptowalut.\n",
"\n",
"1. Główny węzłeł sieci kryptowalutowej. Wymagane przynajmniej 32GB RAM, 8vCPU, 600GB dysku twardego. Wymagania specjalne: bardzo duża wydajność dysku twardego, transfer sieciowy na poziomie 2-3TB/miesiąc.\n",
"1. Zapasowy węzeł sieci kryptowalutowej. Wymagane przynajmniej 8GB RAM, 3vCPU, 600GB dysku twardego. Wymagania specjalne: duża wydajność dysku twardego, transfer sieciowy na poziomie 2-3TB/miesiąc.\n",
"1. Baza danych Redis. Wymagane przynajmniej 2GB RAM, 2vCPU, 10GB dysku twardego. Wymagania specjalne: wysoka dostępność, brak dostępu do bazy danych uniemożliwia działania wszyskich innych modułów\n",
"1. Moduł kopania. Wymagane przynajmniej 4GB RAM, 8vCPU, 10GB dysku twardego. Wymagania specjalne: transfer sieciowy na poziomie 1TB/miesiąc, stały adres IP\n",
"1. Moduł API i WWW. Wymagane przynajmniej 4GB RAM, 2vCPU, 10GB dysku twardego.\n",
"1. Moduł wypłat. Wymagane przynajmniej 2GB RAM, 1vCPU, 10GB dysku twardego.\n",
"\n",
"Każdy moduł, baza danych oraz węzły powinny działać w odseparowanym środowisku z zachowaniem następująch połączeń:\n",
"* wszystkie moduły łączą sie z bazą danych\n",
"* moduł kopania łączy się z węzłem głównym i zapasowym\n",
"* moduł wypłat łączy się z węzłem zapasowym"
]
}
],
"metadata": {
"interpreter": {
"hash": "98b0a9b7b4eaaa670588a142fd0a9b87eaafe866f1db4228be72b4211d12040f"
},
"kernelspec": {
"display_name": "Python 3.9.5 64-bit ('base': conda)",
"name": "python3"
},
"language_info": {
"codemirror_mode": {
"name": "ipython",
"version": 3
},
"file_extension": ".py",
"mimetype": "text/x-python",
"name": "python",
"nbconvert_exporter": "python",
"pygments_lexer": "ipython3",
"version": "3.9.6"
},
"orig_nbformat": 4
},
"nbformat": 4,
"nbformat_minor": 2
}