Merge branch 'master' of https://git.wmi.amu.edu.pl/kubapok/2023-programowanie-w-pythonie

2023-11-25 11:57:13 +01:00 · 2023-11-25 11:57:13 +01:00 · c37b42a4f4
commit c37b42a4f4
parent 24f3ab5175 fc774f482e
11 changed files with 3799 additions and 146 deletions
--- a/README.md
+++ b/README.md
@ -54,3 +54,21 @@ Skala ocen

 W celu prezentacji projektu należy umowić sie z prowadzącym na prezentacje zdalną lub na wydziale (tylko w dni pracujące).
 Termin oddania zadań do koniec stycznia 2024. Dodatkowo można zgłosić prezentacje do końca 2023- wtedy prowadzący proponuje ocenę i zespół może albo ją przyjąć lub nie i spróbować jeszcze raz w styczniu.
+
+
+## Dodatkowe materiały
+### jupyter notebook
+- https://noteable.io/blog/jupyter-notebook-shortcuts-boost-productivity/
+
+### bash
+- https://www.earthdatascience.org/courses/intro-to-earth-data-science/open-reproducible-science/bash/
+- https://www.educative.io/blog/bash-shell-command-cheat-sheet
+
+### git
+- https://git.wmi.amu.edu.pl/
+- https://www.freecodecamp.org/news/learn-the-basics-of-git-in-under-10-minutes-da548267cc91/
+- https://git-scm.com/docs/gittutorial
+- https://git-scm.com/book/en/v2
+
+### pycharm tutorial:
+- https://www.jetbrains.com/guide/python/tutorials/getting-started-pycharm/
--- a/zajecia1/odpowiedzi.ipynb
+++ b/zajecia1/odpowiedzi.ipynb
@ -0,0 +1,655 @@
+{
+ "cells": [
+  {
+   "cell_type": "code",
+   "execution_count": 1,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "\"\"\"\n",
+    "Sprawdź czy tekst 'aAaAaA' znajduje się w tablicy passwords.\n",
+    "W zależności czy znajduje się czy też nie, wyświetl na ekranie odpowiedni komunikat.\n",
+    "\"\"\"\n",
+    "\n",
+    "passwords = ['aaAaa', 'aAAAaa', 'aaaaaaA', 'aaaAAAAA', 'aaAAAaa', 'aAaAaA', 'aAaAaAA']"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 2,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "napisaAaAaAznajduje sie w tablicy passwords\n"
+     ]
+    }
+   ],
+   "source": [
+    "if 'aAaAaA' in passwords:\n",
+    "    print('napis ' + 'aAaAaA' + ' znajduje sie w tablicy passwords')\n",
+    "else:\n",
+    "    print(' napis' + 'aAaAaA' + ' nie znajduje sie w tablicy passwords')"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 3,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "\"\"\"\n",
+    "Niech x oznacza liczbę uzyskanych punktów. Standardowa skala ocen jest następująca:\n",
+    "* x >= 90 -- 5.0\n",
+    "* 90 > x >= 80 -- 4.5\n",
+    "* 80 > x >= 70 -- 4.0\n",
+    "* 70 > x >= 60 -- 3.5\n",
+    "* 60 > x >= 50 -- 3.0\n",
+    "* x < 50 -- 2.0\n",
+    "\n",
+    "Zmienna `points` zawiera liczbę uzyskanych punktów przez studenta.\n",
+    "Napisz instrukcję warunką, która wyświetli ocenę studenta w zależności od liczby punktów.\n",
+    "\"\"\"\n",
+    "\n",
+    "points = 85\n"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 8,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "Twoja ocena to:  4.5\n",
+      "Twoja ocena to:  4.5\n"
+     ]
+    }
+   ],
+   "source": [
+    "def print_grade(grade):\n",
+    "    print('Twoja ocena to: ',grade)\n",
+    "    \n",
+    "    \n",
+    "# te rozwiązanie korzysta z ciekawej możliwości zawarcia dwóch warunków a<x<b w jednej lini\n",
+    "if points >= 90:\n",
+    "    print_grade(5.0)\n",
+    "elif 90 > points >= 80:\n",
+    "    print_grade(4.5)\n",
+    "elif 80 > points >= 70:\n",
+    "    print_grade(4.0)\n",
+    "elif 70 > points >= 60:\n",
+    "    print_grade(3.5)\n",
+    "elif 60 > points >= 50:\n",
+    "    print_grade(3.0)\n",
+    "else:\n",
+    "    print_grade(2.0)\n",
+    "    \n",
+    "# albo można tak:\n",
+    "if points >= 90:\n",
+    "    print_grade(5.0)\n",
+    "elif 90 > points:\n",
+    "    print_grade(4.5)\n",
+    "elif 80 > points:\n",
+    "    print_grade(4.0)\n",
+    "elif 70 > points:\n",
+    "    print_grade(3.5)\n",
+    "elif 60 > points:\n",
+    "    print_grade(3.0)\n",
+    "else:\n",
+    "    print_grade(2.0)\n",
+    "    "
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 9,
+   "metadata": {},
+   "outputs": [
+    {
+     "data": {
+      "text/plain": [
+       "230181"
+      ]
+     },
+     "execution_count": 9,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
+   "source": [
+    "\"\"\"\n",
+    "Oblicz sumę  liczb od 1 do 678.\n",
+    "\"\"\"\n",
+    "# te dodanie 1 jest ważne, bo python nie włącza końca przedziału\n",
+    "sum(list(range(1,678+1)))"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 11,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "\n",
+    "\"\"\"\n",
+    "Słownik `oceny` zawiera oceny kilku osób. Kluczami są imiona dzieci, a wartosciami -- ich oceny.\n",
+    "Uzupełnij słownik `rozklad`, którego kluczami są oceny, a wartosciami -- listy... \n",
+    "\"\"\"\n",
+    "\n",
+    "oceny = {\n",
+    "    'Albert': 4.5,\n",
+    "    'Beata': 5,\n",
+    "    'Cecylia': 4,\n",
+    "    'Dariusz': 4,\n",
+    "    'Eliza': 3,\n",
+    "    'Feliks': 5,\n",
+    "    'Grzegorz': 4.5,\n",
+    "    'Izabela': 4.5\n",
+    "}\n",
+    "\n",
+    "rozklad = {\n",
+    "    5: [],\n",
+    "    4.5: [],\n",
+    "    4: [],\n",
+    "    3: []\n",
+    "}"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 12,
+   "metadata": {},
+   "outputs": [
+    {
+     "data": {
+      "text/plain": [
+       "{5: ['Beata', 'Feliks'],\n",
+       " 4.5: ['Albert', 'Grzegorz', 'Izabela'],\n",
+       " 4: ['Cecylia', 'Dariusz'],\n",
+       " 3: ['Eliza']}"
+      ]
+     },
+     "execution_count": 12,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
+   "source": [
+    "for key, value in oceny.items():\n",
+    "    rozklad[value].append(key)\n",
+    "rozklad\n",
+    "        "
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 13,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "\n",
+    "\"\"\"\n",
+    "Poniżej znajdują się 2 słowniki z danymi o liczbie przejazdów rowerami miejskimi w Montrealu w 2018 z podziałem na miesiące (od kwietnia do listopada).\n",
+    "Pierwszy słownik zawiera informacje o przejazdach wykonanych przez posiadaczy abonamentu, a drugi przez ludzi, którzy\n",
+    "nie mają wykupionego abonamentu. Dane pochodzą ze strony https://montreal.bixi.com/en/open-data. \n",
+    "\n",
+    "a) Stwórz trzeci słownik `all_rides`, w którym zliczysz łączną liczbę przejazdów w każdym z podanych miesięcy.\n",
+    "b) Oblicz sumę zarejestrowanych przejazdów od kwietnia do listopada.\n",
+    "c) Wyswietl jaki procent wszystkich przejazdów odbyło się w sierpniu (August).\n",
+    "\n",
+    "\"\"\"\n",
+    "\n",
+    "members = {\n",
+    "    'April': 211819,\n",
+    "    'May': 682758,\n",
+    "    'June': 737011,\n",
+    "    'July': 779511,\n",
+    "    'August': 673790,\n",
+    "    'September': 673790,\n",
+    "    'October': 444177,\n",
+    "    'November': 136791,\n",
+    "}\n",
+    "\n",
+    "occasionals = {\n",
+    "    'April': 32058,\n",
+    "    'May': 147898,\n",
+    "    'June': 171494,\n",
+    "    'July': 194316,\n",
+    "    'August': 206809,\n",
+    "    'September': 140492,\n",
+    "    'October': 53596,\n",
+    "    'November': 10516,\n",
+    "}\n"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 24,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "{'April': 243877, 'May': 830656, 'June': 908505, 'July': 973827, 'August': 880599, 'September': 814282, 'October': 497773, 'November': 147307}\n",
+      "5296826\n",
+      "16.62503166990949 %\n",
+      "16.63 %\n"
+     ]
+    }
+   ],
+   "source": [
+    "all_rides = dict()\n",
+    "for key,value in members.items():\n",
+    "    all_rides[key] = value\n",
+    "\n",
+    "for key,value in occasionals.items():\n",
+    "    all_rides[key] += value\n",
+    "\n",
+    "print(all_rides)\n",
+    "# można też to zrobić szybciej korzystająć z list comprehensions, albo  np biblioteki copy\n",
+    "\n",
+    "print(sum(all_rides.values()))\n",
+    "\n",
+    "print(100 * all_rides['August'] / sum(all_rides.values()), '%')\n",
+    "print(round(100 * all_rides['August'] / sum(all_rides.values()),2), '%') # zaokrąglenie"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 25,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "\"\"\"\n",
+    "Napisz kod, który zwraci tzw. \"Big 'NO!'\" (zob. http://tvtropes.org/pmwiki/pmwiki.php/Main/BigNo)\n",
+    "dla zadanej liczby tj. napis typu \"NOOOOOOOOOOOOO!\", gdzie liczba 'O' ma być\n",
+    "równa wartości zmniennej `number_of_o`. Jeśli argument jest mniejszy niż 5, ma być zwracany napis \"It's not a Big 'No!'\".\n",
+    "Wyświetl ten napis na ekran.\n",
+    "\"\"\"\n",
+    "\n",
+    "number_of_o = 6"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 26,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "NOOOOOO!\n"
+     ]
+    }
+   ],
+   "source": [
+    "if number_of_o < 5:\n",
+    "    print(\"It's not a Big 'No!'\")\n",
+    "else:\n",
+    "    print(\"N\"+\"O\"*number_of_o+'!')"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 27,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "\"\"\"\n",
+    " * Podziel zmienną `text` na słowa, korzystając z metody split.\n",
+    " * Dodaj do listy `oov`, wszystkie słowa (bez powtórzeń), które nie są zawarte w liście `vocab`.\n",
+    "\"\"\"\n",
+    "\n",
+    "\n",
+    "text = \"this is a string , which i will use for string testing\"\n",
+    "vocab = [',', 'this', 'is', 'a', 'which', 'for', 'will', 'i']\n",
+    "\n",
+    "oov = []\n"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 31,
+   "metadata": {},
+   "outputs": [
+    {
+     "data": {
+      "text/plain": [
+       "['string', 'use', 'testing']"
+      ]
+     },
+     "execution_count": 31,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
+   "source": [
+    "text_splitted = text.split()\n",
+    "text_splitted_no_repeats = set(text_splitted)\n",
+    "\n",
+    "for item in text_splitted_no_repeats:\n",
+    "    if item not in vocab:\n",
+    "        oov.append(item)\n",
+    "        \n",
+    "oov"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 32,
+   "metadata": {},
+   "outputs": [
+    {
+     "data": {
+      "text/plain": [
+       "'\\n1. Napisz rekurencyjną funkcję, która zwróci n-ty wyraz ciągu Fibonacciego.\\n2. Napisz funkcję, która obliczy n-ty wyroz ciągu Fibonacciego nie korzystając z rekurencji.\\nNp. możesz wykorzystać listę do obliczania kolejnych wartości ciągu.\\n\\nCiąg Fibonacciego:\\na[0] = 1, a[1] = 1, a[n] = a[n-1] + a[n-2] dla n>=2\\n\\n'"
+      ]
+     },
+     "execution_count": 32,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
+   "source": [
+    "\"\"\"\n",
+    "1. Napisz rekurencyjną funkcję, która zwróci n-ty wyraz ciągu Fibonacciego.\n",
+    "2. Napisz funkcję, która obliczy n-ty wyroz ciągu Fibonacciego nie korzystając z rekurencji.\n",
+    "Np. możesz wykorzystać listę do obliczania kolejnych wartości ciągu.\n",
+    "\n",
+    "Ciąg Fibonacciego:\n",
+    "a[0] = 1, a[1] = 1, a[n] = a[n-1] + a[n-2] dla n>=2\n",
+    "\n",
+    "\"\"\""
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 34,
+   "metadata": {},
+   "outputs": [
+    {
+     "data": {
+      "text/plain": [
+       "89"
+      ]
+     },
+     "execution_count": 34,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
+   "source": [
+    "def fib(n):\n",
+    "    if n == 0:\n",
+    "        return 1\n",
+    "    elif n == 1:\n",
+    "        return 1\n",
+    "    else:\n",
+    "        return fib(n-1) + fib(n-2)\n",
+    "fib(10)"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "\n",
+    "\"\"\"\n",
+    "Napisz funkcję sum_div35(n), która zwraca sumę wszystkich liczb podzielnych\n",
+    "przez 3 lub 5 mniejszych niż n.\n",
+    "\"\"\"\n",
+    "\n",
+    "def sum_div35(n):\n",
+    "    pass\n",
+    "\n",
+    "input = 100\n",
+    "# dla n =100 poprawna odpowiedź to 2318\n"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 40,
+   "metadata": {},
+   "outputs": [
+    {
+     "data": {
+      "text/plain": [
+       "2318"
+      ]
+     },
+     "execution_count": 40,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
+   "source": [
+    "def sum_div35(n):\n",
+    "    all_numbers = []\n",
+    "    for i in range(n):\n",
+    "        if i % 3 == 0 or i % 5 == 0:\n",
+    "            all_numbers.append(i)\n",
+    "    return sum(all_numbers)\n",
+    "\n",
+    "sum_div35(100)\n",
+    "\n",
+    "# alternatywnie:\n",
+    "def sum_div35(n):\n",
+    "    return sum([i for i in range(n) if i % 3 == 0 or i % 5 == 0 ])\n",
+    "sum_div35(100)"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 41,
+   "metadata": {},
+   "outputs": [
+    {
+     "data": {
+      "text/plain": [
+       "'\\nOtwórz plik `zen_of_python.txt` i zlicz liczbę linii i słów w tym pliku. \\nNastępnie przerób kod na funkcję, która jako argument będzie przyjmować ściężkę do pliku i będzie zwracać \\nsłownik z dwoma kluczami: `liczba_linii` i `liczba_slow`.\\n'"
+      ]
+     },
+     "execution_count": 41,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
+   "source": [
+    "\"\"\"\n",
+    "Otwórz plik `zen_of_python.txt` i zlicz liczbę linii i słów w tym pliku. \n",
+    "Następnie przerób kod na funkcję, która jako argument będzie przyjmować ściężkę do pliku i będzie zwracać \n",
+    "słownik z dwoma kluczami: `liczba_linii` i `liczba_slow`.\n",
+    "\"\"\""
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 2,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "19\n"
+     ]
+    },
+    {
+     "data": {
+      "text/plain": [
+       "(19, 137)"
+      ]
+     },
+     "execution_count": 2,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
+   "source": [
+    "print(len(open('zen_of_python.txt').readlines()))\n",
+    "\n",
+    "def count_lines_and_words(path):\n",
+    "    lines = 0\n",
+    "    words = 0\n",
+    "    with open(path) as f:\n",
+    "        for line in f:\n",
+    "            lines += 1\n",
+    "            words += len(line.split())\n",
+    "    return lines, words\n",
+    "\n",
+    "count_lines_and_words('zen_of_python.txt')"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 3,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "\"\"\"\n",
+    "Zadania: Zaimportuj bibliotekę statistics, która zawiera funckje do obliczenia podstawych wielkości statystycznych (średnia, mediana, moda):\n",
+    "    statistics.mean -- obliczenie średniej\n",
+    "    statistics.median -- obliczenie mediany\n",
+    "    statistics.variance -- obliczenie wariancji\n",
+    "    statistics.stdev -- obliczenie odchylenia standardowego Oblicz te wielkości dla wartości z poniższego słownika.\n",
+    "Każda z tych funkcji przyjmuje jeden argument: listę wartości.\n",
+    "\"\"\"\n",
+    "\n",
+    "members = {\n",
+    "    'April': 211819,\n",
+    "    'May': 682758,\n",
+    "    'June': 737011,\n",
+    "    'July': 779511,\n",
+    "    'August': 673790,\n",
+    "    'September': 673790,\n",
+    "    'October': 444177,\n",
+    "    'November': 136791,\n",
+    "}"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 6,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "542455.875\n",
+      "673790.0\n",
+      "61681755885.83929\n",
+      "248358.12023334226\n"
+     ]
+    }
+   ],
+   "source": [
+    "import statistics\n",
+    "\n",
+    "values = members.values()\n",
+    "\n",
+    "print(statistics.mean(values))\n",
+    "print(statistics.median(values))\n",
+    "print(statistics.variance(values))\n",
+    "print(statistics.stdev(values))"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "\"\"\"\n",
+    "Biblioteka random posiada funkcję random, która zwraca losową licznę z przedziału [0, 1) (nie przyjmuje żadnych argumentów).\n",
+    "Biblioteka math posiada funkcję hypot, która oblicza odległość punktu od środka układu współrzędnych (punktu [0, 0]) i przyjmuje dwa argumenty: współrzędne punktu.\n",
+    "* Zaimportuj biblioteki random i math\n",
+    "* korzystając z funkcji random wylosuj dwie liczby i przypisz wyniki do zmniennych x i y.\n",
+    "* Korzystając z funkcji hypot oblicz odległość punktu o współrzednych (x,y).\n",
+    "* Dodaj pętlę, która będzie wykonywać te czynności n = 10 razy i będzie zliczać ile razy obliczona odległość jest mniejsza od 1.\n",
+    "* Oblicz stosunek liczby punktów, dla których odległość wynosiła mniej niż 1 do całkowitej liczby punktów. Pomnóż tę wartocść przez 4.\n",
+    "* Podstaw za n wartości 100, 1000, 1000000. Do jakiej wartości zbiegają wartości?\n",
+    "\"\"\""
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 20,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "1.023482041105784\n",
+      "785667\n",
+      "3.142668\n"
+     ]
+    }
+   ],
+   "source": [
+    "import random\n",
+    "import math\n",
+    "\n",
+    "x,y = random.random(), random.random()\n",
+    "print(math.hypot(x,y))\n",
+    "\n",
+    "n = 1000000\n",
+    "lower_than_1_number = 0\n",
+    "for i in range(n):\n",
+    "    x,y = random.random(), random.random()\n",
+    "    if math.hypot(x,y) < 1 :\n",
+    "        lower_than_1_number +=1\n",
+    "print(lower_than_1_number)\n",
+    "\n",
+    "print((lower_than_1_number / n )*4)\n",
+    "\n",
+    "# zmierza do stałej PI"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": []
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": []
+  }
+ ],
+ "metadata": {
+  "kernelspec": {
+   "display_name": "Python 3",
+   "language": "python",
+   "name": "python3"
+  },
+  "language_info": {
+   "codemirror_mode": {
+    "name": "ipython",
+    "version": 3
+   },
+   "file_extension": ".py",
+   "mimetype": "text/x-python",
+   "name": "python",
+   "nbconvert_exporter": "python",
+   "pygments_lexer": "ipython3",
+   "version": "3.8.3"
+  }
+ },
+ "nbformat": 4,
+ "nbformat_minor": 4
+}
--- a/zajecia2/zad_02.ipynb
+++ b/zajecia2/zad_02.ipynb
@ -25,119 +25,17 @@
  },
  {
   "cell_type": "code",
-   "execution_count": 3,
+   "execution_count": 1,
   "metadata": {},
-   "outputs": [
-    {
-     "data": {
-      "text/html": [
-       "<div>\n",
-       "<style scoped>\n",
-       "    .dataframe tbody tr th:only-of-type {\n",
-       "        vertical-align: middle;\n",
-       "    }\n",
-       "\n",
-       "    .dataframe tbody tr th {\n",
-       "        vertical-align: top;\n",
-       "    }\n",
-       "\n",
-       "    .dataframe thead th {\n",
-       "        text-align: right;\n",
-       "    }\n",
-       "</style>\n",
-       "<table border=\"1\" class=\"dataframe\">\n",
-       "  <thead>\n",
-       "    <tr style=\"text-align: right;\">\n",
-       "      <th></th>\n",
-       "      <th>Unnamed: 0</th>\n",
-       "      <th>Id</th>\n",
-       "      <th>Expected</th>\n",
-       "      <th>Rooms</th>\n",
-       "      <th>SqrMeters</th>\n",
-       "      <th>Floor</th>\n",
-       "      <th>Location</th>\n",
-       "    </tr>\n",
-       "  </thead>\n",
-       "  <tbody>\n",
-       "    <tr>\n",
-       "      <th>0</th>\n",
-       "      <td>0</td>\n",
-       "      <td>1</td>\n",
-       "      <td>269000</td>\n",
-       "      <td>3</td>\n",
-       "      <td>55.00</td>\n",
-       "      <td>1</td>\n",
-       "      <td>Poznań Zawady</td>\n",
-       "    </tr>\n",
-       "    <tr>\n",
-       "      <th>1</th>\n",
-       "      <td>1</td>\n",
-       "      <td>2</td>\n",
-       "      <td>320000</td>\n",
-       "      <td>3</td>\n",
-       "      <td>79.00</td>\n",
-       "      <td>10</td>\n",
-       "      <td>Poznań Rataje ul. Orła Bialego</td>\n",
-       "    </tr>\n",
-       "    <tr>\n",
-       "      <th>2</th>\n",
-       "      <td>2</td>\n",
-       "      <td>3</td>\n",
-       "      <td>146000</td>\n",
-       "      <td>1</td>\n",
-       "      <td>31.21</td>\n",
-       "      <td>1</td>\n",
-       "      <td>Poznań Nowe Miasto ul. Kawalerka W Nowym Bloku...</td>\n",
-       "    </tr>\n",
-       "    <tr>\n",
-       "      <th>3</th>\n",
-       "      <td>3</td>\n",
-       "      <td>4</td>\n",
-       "      <td>189000</td>\n",
-       "      <td>2</td>\n",
-       "      <td>44.00</td>\n",
-       "      <td>2</td>\n",
-       "      <td>Poznań Grunwald Ogrody Jeżyce Centrum Łazarz u...</td>\n",
-       "    </tr>\n",
-       "    <tr>\n",
-       "      <th>4</th>\n",
-       "      <td>4</td>\n",
-       "      <td>5</td>\n",
-       "      <td>480240</td>\n",
-       "      <td>2</td>\n",
-       "      <td>65.25</td>\n",
-       "      <td>1</td>\n",
-       "      <td>Poznań ul. Droga Dębińska 19</td>\n",
-       "    </tr>\n",
-       "  </tbody>\n",
-       "</table>\n",
-       "</div>"
-      ],
-      "text/plain": [
-       "   Unnamed: 0  Id  Expected  Rooms  SqrMeters  Floor  \\\n",
-       "0           0   1    269000      3      55.00      1   \n",
-       "1           1   2    320000      3      79.00     10   \n",
-       "2           2   3    146000      1      31.21      1   \n",
-       "3           3   4    189000      2      44.00      2   \n",
-       "4           4   5    480240      2      65.25      1   \n",
-       "\n",
-       "                                            Location  \n",
-       "0                                      Poznań Zawady  \n",
-       "1                     Poznań Rataje ul. Orła Bialego  \n",
-       "2  Poznań Nowe Miasto ul. Kawalerka W Nowym Bloku...  \n",
-       "3  Poznań Grunwald Ogrody Jeżyce Centrum Łazarz u...  \n",
-       "4                       Poznań ul. Droga Dębińska 19  "
-      ]
-     },
-     "execution_count": 3,
-     "metadata": {},
-     "output_type": "execute_result"
-    }
-   ],
+   "outputs": [],
   "source": [
-    "df = pd.read_csv(\"./mieszkania.csv\")\n",
+    "# ODPOWIEDZ:\n",
    "\n",
-    "df.head()"
+    "\n",
+    "\n",
+    "#df = pd.read_csv(\"./mieszkania.csv\")\n",
+    "\n",
+    "#df.head()"
   ]
  },
  {
@ -149,30 +47,16 @@
  },
  {
   "cell_type": "code",
-   "execution_count": 4,
+   "execution_count": 2,
   "metadata": {},
-   "outputs": [
-    {
-     "data": {
-      "text/plain": [
-       "2     2208\n",
-       "3     1553\n",
-       "1      620\n",
-       "4      523\n",
-       "5       81\n",
-       "6       13\n",
-       "10       1\n",
-       "7        1\n",
-       "Name: Rooms, dtype: int64"
-      ]
-     },
-     "execution_count": 4,
-     "metadata": {},
-     "output_type": "execute_result"
-    }
-   ],
+   "outputs": [],
   "source": [
-    "df['Rooms'].value_counts()"
+    "# ODPOWIEDZ:\n",
+    "\n",
+    "\n",
+    "\n",
+    "\n",
+    "#df['Rooms'].value_counts()"
   ]
  },
  {
@ -202,15 +86,19 @@
   "metadata": {},
   "outputs": [],
   "source": [
-    "def find_borough(desc):\n",
-    "    dzielnice = ['Stare Miasto',\n",
-    "                 'Wilda',\n",
-    "                 'Jeżyce',\n",
-    "                 'Rataje',\n",
-    "                 'Piątkowo',\n",
-    "                 'Winogrady',\n",
-    "                 'Miłostowo',\n",
-    "                 'Dębiec']"
+    "# ODPOWIEDZ:\n",
+    "\n",
+    "\n",
+    "\n",
+    "# def find_borough(desc):\n",
+    "#     dzielnice = ['Stare Miasto',\n",
+    "#                  'Wilda',\n",
+    "#                  'Jeżyce',\n",
+    "#                  'Rataje',\n",
+    "#                  'Piątkowo',\n",
+    "#                  'Winogrady',\n",
+    "#                  'Miłostowo',\n",
+    "#                  'Dębiec']"
   ]
  },
  {
@ -265,7 +153,10 @@
    }
   ],
   "source": [
-    "df[df['Rooms'] == 2]['Expected'].mean()"
+    "# ODPOWIEDZ:\n",
+    "\n",
+    "\n",
+    "#df[df['Rooms'] == 2]['Expected'].mean()"
   ]
  },
  {
@ -294,7 +185,11 @@
    }
   ],
   "source": [
-    "df.query('Floor == 13')['Location']"
+    "# ODPOWIEDZ:\n",
+    "\n",
+    "\n",
+    "\n",
+    "#df.query('Floor == 13')['Location']"
   ]
  },
  {
@ -314,7 +209,7 @@
 ],
 "metadata": {
  "kernelspec": {
-   "display_name": "Python 3 (ipykernel)",
+   "display_name": "Python 3",
   "language": "python",
   "name": "python3"
  },
@ -328,7 +223,7 @@
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
-   "version": "3.9.13"
+   "version": "3.8.3"
  }
 },
 "nbformat": 4,
--- a/zajecia3/KnnClassification.svg.png
+++ b/zajecia3/KnnClassification.svg.png
--- a/zajecia3/gapminder.csv
+++ b/zajecia3/gapminder.csv
@ -0,0 +1,176 @@
+Country,female_BMI,male_BMI,gdp,population,under5mortality,life_expectancy,fertility
+Afghanistan,21.07402,20.62058,1311.0,26528741.0,110.4,52.8,6.2
+Albania,25.65726,26.44657,8644.0,2968026.0,17.9,76.8,1.76
+Algeria,26.368409999999997,24.5962,12314.0,34811059.0,29.5,75.5,2.73
+Angola,23.48431,22.25083,7103.0,19842251.0,192.0,56.7,6.43
+Antigua and Barbuda,27.50545,25.76602,25736.0,85350.0,10.9,75.5,2.16
+Argentina,27.46523,27.5017,14646.0,40381860.0,15.4,75.4,2.24
+Armenia,27.1342,25.355420000000002,7383.0,2975029.0,20.0,72.3,1.4
+Australia,26.87777,27.56373,41312.0,21370348.0,5.2,81.6,1.96
+Austria,25.09414,26.467409999999997,43952.0,8331465.0,4.6,80.4,1.41
+Azerbaijan,27.50879,25.65117,14365.0,8868713.0,43.3,69.2,1.99
+Bahamas,29.13948,27.24594,24373.0,348587.0,14.5,72.2,1.89
+Bahrain,28.790940000000003,27.83721,42507.0,1115777.0,9.4,77.6,2.23
+Bangladesh,20.54531,20.39742,2265.0,148252473.0,55.9,68.3,2.38
+Barbados,29.221690000000002,26.384390000000003,16075.0,277315.0,15.4,75.3,1.83
+Belarus,26.641859999999998,26.16443,14488.0,9526453.0,7.2,70.0,1.42
+Belgium,25.1446,26.75915,41641.0,10779155.0,4.7,79.6,1.82
+Belize,29.81663,27.02255,8293.0,306165.0,20.1,70.7,2.91
+Benin,23.74026,22.41835,1646.0,8973525.0,116.3,59.7,5.27
+Bhutan,22.88243,22.8218,5663.0,694990.0,48.1,70.7,2.51
+Bolivia,26.8633,24.43335,5066.0,9599916.0,52.0,71.2,3.48
+Bosnia and Herzegovina,26.35874,26.611629999999998,9316.0,3839749.0,8.1,77.5,1.22
+Botswana,26.09156,22.129839999999998,13858.0,1967866.0,63.8,53.2,2.86
+Brazil,25.99113,25.78623,13906.0,194769696.0,18.6,73.2,1.9
+Brunei,22.892310000000002,24.18179,72351.0,380786.0,9.0,76.9,2.1
+Bulgaria,25.51574,26.542859999999997,15368.0,7513646.0,13.7,73.2,1.43
+Burkina Faso,21.63031,21.27157,1358.0,14709011.0,130.4,58.0,6.04
+Burundi,21.27927,21.50291,723.0,8821795.0,108.6,59.1,6.48
+Cambodia,21.69608,20.80496,2442.0,13933660.0,51.5,66.1,3.05
+Cameroon,24.9527,23.681729999999998,2571.0,19570418.0,113.8,56.6,5.17
+Canada,26.698290000000004,27.4521,41468.0,33363256.0,5.8,80.8,1.68
+Cape Verde,24.96136,23.515220000000003,6031.0,483824.0,28.4,70.4,2.57
+Chad,21.95424,21.485689999999998,1753.0,11139740.0,168.0,54.3,6.81
+Chile,27.92807,27.015420000000002,18698.0,16645940.0,8.9,78.5,1.89
+China,22.91041,22.92176,7880.0,1326690636.0,18.5,73.4,1.53
+Colombia,26.22529,24.94041,10489.0,44901660.0,19.7,76.2,2.43
+Comoros,22.444329999999997,22.06131,1440.0,665414.0,91.2,67.1,5.05
+"Congo, The Democratic Republic of the",21.6677,19.86692,607.0,61809278.0,124.5,57.5,6.45
+"Congo",23.10824,21.87134,5022.0,3832771.0,72.6,58.8,5.1
+Costa Rica,27.03497,26.47897,12219.0,4429506.0,10.3,79.8,1.91
+Ivory Coast,23.82088,22.56469,2854.0,19261647.0,116.9,55.4,4.91
+Croatia,25.17882,26.596290000000003,21873.0,4344151.0,5.9,76.2,1.43
+Cuba,26.576140000000002,25.06867,17765.0,11290239.0,6.3,77.6,1.5
+Cyprus,25.92587,27.41899,35828.0,1077010.0,4.2,80.0,1.49
+Denmark,25.106270000000002,26.13287,45017.0,5495302.0,4.3,78.9,1.89
+Djibouti,24.38177,23.38403,2502.0,809639.0,81.0,61.8,3.76
+Ecuador,27.062690000000003,25.58841,9244.0,14447600.0,26.8,74.7,2.73
+Egypt,30.099970000000003,26.732429999999997,9974.0,78976122.0,31.4,70.2,2.95
+El Salvador,27.84092,26.36751,7450.0,6004199.0,21.6,73.7,2.32
+Equatorial Guinea,24.528370000000002,23.7664,40143.0,686223.0,118.4,57.5,5.31
+Eritrea,21.082320000000003,20.885089999999998,1088.0,4500638.0,60.4,60.1,5.16
+Estonia,25.185979999999997,26.264459999999996,24743.0,1339941.0,5.5,74.2,1.62
+Ethiopia,20.71463,20.247,931.0,83079608.0,86.9,60.0,5.19
+Fiji,29.339409999999997,26.53078,7129.0,843206.0,24.0,64.9,2.74
+Finland,25.58418,26.733390000000004,42122.0,5314170.0,3.3,79.6,1.85
+France,24.82949,25.853289999999998,37505.0,62309529.0,4.3,81.1,1.97
+Gabon,25.95121,24.0762,15800.0,1473741.0,68.0,61.7,4.28
+Gambia,24.82101,21.65029,1566.0,1586749.0,87.4,65.7,5.8
+Georgia,26.45014,25.54942,5900.0,4343290.0,19.3,71.8,1.79
+Germany,25.73903,27.165090000000003,41199.0,80665906.0,4.4,80.0,1.37
+Ghana,24.33014,22.842470000000002,2907.0,23115919.0,79.9,62.0,4.19
+Greece,24.92026,26.33786,32197.0,11161755.0,4.9,80.2,1.46
+Grenada,27.31948,25.179879999999997,12116.0,103934.0,13.5,70.8,2.28
+Guatemala,26.84324,25.29947,6960.0,14106687.0,36.9,71.2,4.12
+Guinea,22.45206,22.52449,1230.0,10427356.0,121.0,57.1,5.34
+Guinea-Bissau,22.92809,21.64338,1326.0,1561293.0,127.6,53.6,5.25
+Guyana,26.470190000000002,23.68465,5208.0,748096.0,41.9,65.0,2.74
+Haiti,23.27785,23.66302,1600.0,9705130.0,83.3,61.0,3.5
+Honduras,26.73191,25.10872,4391.0,7259470.0,26.5,71.8,3.27
+"Hong Kong",23.71046,25.057470000000002,46635.0,6910384.0,3.06,82.49,1.04
+Hungary,25.97839,27.115679999999998,23334.0,10050699.0,7.2,73.9,1.33
+Iceland,26.02599,27.206870000000002,42294.0,310033.0,2.7,82.4,2.12
+India,21.31478,20.95956,3901.0,1197070109.0,65.6,64.7,2.64
+Indonesia,22.986929999999997,21.85576,7856.0,235360765.0,36.2,69.4,2.48
+Iran,27.236079999999998,25.310029999999998,15955.0,72530693.0,21.4,73.1,1.88
+Iraq,28.411170000000002,26.71017,11616.0,29163327.0,38.3,66.6,4.34
+Ireland,26.62176,27.65325,47713.0,4480145.0,4.5,80.1,2.0
+Israel,27.301920000000003,27.13151,28562.0,7093808.0,4.9,80.6,2.92
+Italy,24.79289,26.4802,37475.0,59319234.0,4.1,81.5,1.39
+Jamaica,27.22601,24.00421,8951.0,2717344.0,18.9,75.1,2.39
+Japan,21.87088,23.50004,34800.0,127317900.0,3.4,82.5,1.34
+Jordan,29.218009999999996,27.47362,10897.0,6010035.0,22.1,76.9,3.59
+Kazakhstan,26.65065,26.290779999999998,18797.0,15915966.0,25.9,67.1,2.51
+Kenya,23.06181,21.592579999999998,2358.0,38244442.0,71.0,60.8,4.76
+Kiribati,31.30769,29.2384,1803.0,98437.0,64.5,61.5,3.13
+Kuwait,31.161859999999997,29.172109999999996,91966.0,2705290.0,11.3,77.3,2.68
+Latvia,25.615129999999997,26.45693,20977.0,2144215.0,10.5,72.4,1.5
+Lebanon,27.70471,27.20117,14158.0,4109389.0,11.3,77.8,1.57
+Lesotho,26.780520000000003,21.90157,2041.0,1972194.0,114.2,44.5,3.34
+Liberia,23.21679,21.89537,588.0,3672782.0,100.9,59.9,5.19
+Libya,29.19874,26.54164,29853.0,6123022.0,18.8,75.6,2.64
+Lithuania,26.01424,26.86102,23223.0,3219802.0,8.2,72.1,1.42
+Luxembourg,26.09326,27.434040000000003,95001.0,485079.0,2.8,81.0,1.63
+Macao,24.895039999999998,25.713820000000002,80191.0,507274.0,6.72,79.32,0.94
+Macedonia,25.37646,26.34473,10872.0,2055266.0,11.8,74.5,1.47
+Madagascar,20.73501,21.403470000000002,1528.0,19926798.0,66.7,62.2,4.79
+Malawi,22.91455,22.034679999999998,674.0,13904671.0,101.1,52.4,5.78
+Malaysia,25.448320000000002,24.73069,19968.0,27197419.0,8.0,74.5,2.05
+Maldives,26.4132,23.219910000000002,12029.0,321026.0,16.0,78.5,2.38
+Mali,23.07655,21.78881,1602.0,14223403.0,148.3,58.5,6.82
+Malta,27.04993,27.683609999999998,27872.0,406392.0,6.6,80.7,1.38
+Mauritania,26.26476,22.62295,3356.0,3414552.0,103.0,67.9,4.94
+Mauritius,26.09824,25.15669,14615.0,1238013.0,15.8,72.9,1.58
+Mexico,28.737509999999997,27.42468,15826.0,114972821.0,17.9,75.4,2.35
+Micronesia,31.28402,28.10315,3197.0,104472.0,43.1,68.0,3.59
+Moldova,27.05617,24.2369,3890.0,4111168.0,17.6,70.4,1.49
+Mongolia,25.71375,24.88385,7563.0,2629666.0,34.8,64.8,2.37
+Montenegro,25.70186,26.55412,14183.0,619740.0,8.1,76.0,1.72
+Morocco,26.223090000000003,25.63182,6091.0,31350544.0,35.8,73.3,2.44
+Mozambique,23.317339999999998,21.93536,864.0,22994867.0,114.4,54.0,5.54
+Myanmar,22.47733,21.44932,2891.0,51030006.0,87.2,59.4,2.05
+Namibia,25.14988,22.65008,8169.0,2115703.0,62.2,59.1,3.36
+Nepal,20.72814,20.76344,1866.0,26325183.0,50.7,68.4,2.9
+Netherlands,25.47269,26.01541,47388.0,16519862.0,4.8,80.3,1.77
+New Zealand,27.36642,27.768929999999997,32122.0,4285380.0,6.4,80.3,2.12
+Nicaragua,27.57259,25.77291,4060.0,5594524.0,28.1,77.0,2.72
+Niger,21.95958,21.21958,843.0,15085130.0,141.3,58.0,7.59
+Nigeria,23.674020000000002,23.03322,4684.0,151115683.0,140.9,59.2,6.02
+Norway,25.73772,26.934240000000003,65216.0,4771633.0,3.6,80.8,1.96
+Oman,26.66535,26.241090000000003,47799.0,2652281.0,11.9,76.2,2.89
+Pakistan,23.44986,22.299139999999998,4187.0,163096985.0,95.5,64.1,3.58
+Panama,27.67758,26.26959,14033.0,3498679.0,21.0,77.3,2.61
+Papua New Guinea,25.77189,25.015060000000002,1982.0,6540267.0,69.7,58.6,4.07
+Paraguay,25.90523,25.54223,6684.0,6047131.0,25.7,74.0,3.06
+Peru,25.98511,24.770410000000002,9249.0,28642048.0,23.2,78.2,2.58
+Philippines,23.4671,22.872629999999997,5332.0,90297115.0,33.4,69.8,3.26
+Poland,25.918870000000002,26.6738,19996.0,38525752.0,6.7,75.4,1.33
+Portugal,26.183020000000003,26.68445,27747.0,10577458.0,4.1,79.4,1.36
+Puerto Rico,30.2212,28.378040000000002,35855.0,3728126.0,8.78,77.0,1.69
+Qatar,28.912509999999997,28.13138,126076.0,1388962.0,9.5,77.9,2.2
+Romania,25.22425,25.41069,18032.0,20741669.0,16.1,73.2,1.34
+Russia,27.21272,26.01131,22506.0,143123163.0,13.5,67.9,1.49
+Rwanda,22.07156,22.55453,1173.0,9750314.0,78.3,64.1,5.06
+Samoa,33.659079999999996,30.42475,5731.0,183440.0,18.8,72.3,4.43
+Sao Tome and Principe,24.88216,23.51233,2673.0,163595.0,61.0,66.0,4.41
+Saudi Arabia,29.598779999999998,27.884320000000002,44189.0,26742842.0,18.1,78.3,2.97
+Senegal,24.30968,21.927429999999998,2162.0,12229703.0,75.8,63.5,5.11
+Serbia,25.669970000000003,26.51495,12522.0,9109535.0,8.0,74.3,1.41
+Seychelles,27.973740000000003,25.56236,20065.0,91634.0,14.2,72.9,2.28
+Sierra Leone,23.93364,22.53139,1289.0,5521838.0,179.1,53.6,5.13
+Singapore,22.86642,23.83996,65991.0,4849641.0,2.8,80.6,1.28
+Slovak Republic,26.323729999999998,26.92717,24670.0,5396710.0,8.8,74.9,1.31
+Slovenia,26.582140000000003,27.43983,30816.0,2030599.0,3.7,78.7,1.43
+Solomon Islands,28.8762,27.159879999999998,1835.0,503410.0,33.1,62.3,4.36
+Somalia,22.66607,21.969170000000002,615.0,9132589.0,168.5,52.6,7.06
+South Africa,29.4803,26.85538,12263.0,50348811.0,66.1,53.4,2.54
+Spain,26.30554,27.49975,34676.0,45817016.0,5.0,81.1,1.42
+Sri Lanka,23.11717,21.96671,6907.0,19949553.0,11.7,74.0,2.32
+Sudan,23.16132,22.40484,3246.0,34470138.0,84.7,65.5,4.79
+Suriname,27.749859999999998,25.49887,13470.0,506657.0,26.4,70.2,2.41
+Swaziland,28.448859999999996,23.16969,5887.0,1153750.0,112.2,45.1,3.7
+Sweden,25.1466,26.37629,43421.0,9226333.0,3.2,81.1,1.92
+Switzerland,24.07242,26.20195,55020.0,7646542.0,4.7,82.0,1.47
+Syria,28.87418,26.919690000000003,6246.0,20097057.0,16.5,76.1,3.17
+Tajikistan,23.84799,23.77966,2001.0,7254072.0,56.2,69.6,3.7
+Tanzania,23.0843,22.47792,2030.0,42844744.0,72.4,60.4,5.54
+Thailand,24.38577,23.008029999999998,12216.0,66453255.0,15.6,73.9,1.48
+Togo,22.73858,21.87875,1219.0,6052937.0,96.4,57.5,4.88
+Tonga,34.25969,30.99563,4748.0,102816.0,17.0,70.3,4.01
+Trinidad and Tobago,28.27587,26.396690000000003,30875.0,1315372.0,24.9,71.7,1.8
+Tunisia,27.93706,25.15699,9938.0,10408091.0,19.4,76.8,2.04
+Turkey,28.247490000000003,26.703709999999997,16454.0,70344357.0,22.2,77.8,2.15
+Turkmenistan,24.66154,25.24796,8877.0,4917541.0,63.9,67.2,2.48
+Uganda,22.48126,22.35833,1437.0,31014427.0,89.3,56.0,6.34
+Ukraine,26.23317,25.42379,8762.0,46028476.0,12.9,67.8,1.38
+United Arab Emirates,29.614009999999997,28.053590000000003,73029.0,6900142.0,9.1,75.6,1.95
+United Kingdom,26.944490000000002,27.392490000000002,37739.0,61689620.0,5.6,79.7,1.87
+United States,28.343590000000003,28.456979999999998,50384.0,304473143.0,7.7,78.3,2.07
+Uruguay,26.593040000000002,26.39123,15317.0,3350832.0,13.0,76.0,2.11
+Uzbekistan,25.43432,25.32054,3733.0,26952719.0,49.2,69.6,2.46
+Vanuatu,28.458759999999998,26.78926,2944.0,225335.0,28.2,63.4,3.61
+Venezuela,28.134079999999997,27.445,17911.0,28116716.0,17.1,74.2,2.53
+Vietnam,21.065,20.9163,4085.0,86589342.0,26.2,74.1,1.86
+Palestine,29.026429999999998,26.5775,3564.0,3854667.0,24.7,74.1,4.38
+Zambia,23.05436,20.68321,3039.0,13114579.0,94.9,51.1,5.88
+Zimbabwe,24.645220000000002,22.0266,1286.0,13495462.0,98.3,47.3,3.85
--- a/zajecia3/iris.data
+++ b/zajecia3/iris.data
@ -0,0 +1,151 @@
+5.1,3.5,1.4,0.2,Iris-setosa
+4.9,3.0,1.4,0.2,Iris-setosa
+4.7,3.2,1.3,0.2,Iris-setosa
+4.6,3.1,1.5,0.2,Iris-setosa
+5.0,3.6,1.4,0.2,Iris-setosa
+5.4,3.9,1.7,0.4,Iris-setosa
+4.6,3.4,1.4,0.3,Iris-setosa
+5.0,3.4,1.5,0.2,Iris-setosa
+4.4,2.9,1.4,0.2,Iris-setosa
+4.9,3.1,1.5,0.1,Iris-setosa
+5.4,3.7,1.5,0.2,Iris-setosa
+4.8,3.4,1.6,0.2,Iris-setosa
+4.8,3.0,1.4,0.1,Iris-setosa
+4.3,3.0,1.1,0.1,Iris-setosa
+5.8,4.0,1.2,0.2,Iris-setosa
+5.7,4.4,1.5,0.4,Iris-setosa
+5.4,3.9,1.3,0.4,Iris-setosa
+5.1,3.5,1.4,0.3,Iris-setosa
+5.7,3.8,1.7,0.3,Iris-setosa
+5.1,3.8,1.5,0.3,Iris-setosa
+5.4,3.4,1.7,0.2,Iris-setosa
+5.1,3.7,1.5,0.4,Iris-setosa
+4.6,3.6,1.0,0.2,Iris-setosa
+5.1,3.3,1.7,0.5,Iris-setosa
+4.8,3.4,1.9,0.2,Iris-setosa
+5.0,3.0,1.6,0.2,Iris-setosa
+5.0,3.4,1.6,0.4,Iris-setosa
+5.2,3.5,1.5,0.2,Iris-setosa
+5.2,3.4,1.4,0.2,Iris-setosa
+4.7,3.2,1.6,0.2,Iris-setosa
+4.8,3.1,1.6,0.2,Iris-setosa
+5.4,3.4,1.5,0.4,Iris-setosa
+5.2,4.1,1.5,0.1,Iris-setosa
+5.5,4.2,1.4,0.2,Iris-setosa
+4.9,3.1,1.5,0.1,Iris-setosa
+5.0,3.2,1.2,0.2,Iris-setosa
+5.5,3.5,1.3,0.2,Iris-setosa
+4.9,3.1,1.5,0.1,Iris-setosa
+4.4,3.0,1.3,0.2,Iris-setosa
+5.1,3.4,1.5,0.2,Iris-setosa
+5.0,3.5,1.3,0.3,Iris-setosa
+4.5,2.3,1.3,0.3,Iris-setosa
+4.4,3.2,1.3,0.2,Iris-setosa
+5.0,3.5,1.6,0.6,Iris-setosa
+5.1,3.8,1.9,0.4,Iris-setosa
+4.8,3.0,1.4,0.3,Iris-setosa
+5.1,3.8,1.6,0.2,Iris-setosa
+4.6,3.2,1.4,0.2,Iris-setosa
+5.3,3.7,1.5,0.2,Iris-setosa
+5.0,3.3,1.4,0.2,Iris-setosa
+7.0,3.2,4.7,1.4,Iris-versicolor
+6.4,3.2,4.5,1.5,Iris-versicolor
+6.9,3.1,4.9,1.5,Iris-versicolor
+5.5,2.3,4.0,1.3,Iris-versicolor
+6.5,2.8,4.6,1.5,Iris-versicolor
+5.7,2.8,4.5,1.3,Iris-versicolor
+6.3,3.3,4.7,1.6,Iris-versicolor
+4.9,2.4,3.3,1.0,Iris-versicolor
+6.6,2.9,4.6,1.3,Iris-versicolor
+5.2,2.7,3.9,1.4,Iris-versicolor
+5.0,2.0,3.5,1.0,Iris-versicolor
+5.9,3.0,4.2,1.5,Iris-versicolor
+6.0,2.2,4.0,1.0,Iris-versicolor
+6.1,2.9,4.7,1.4,Iris-versicolor
+5.6,2.9,3.6,1.3,Iris-versicolor
+6.7,3.1,4.4,1.4,Iris-versicolor
+5.6,3.0,4.5,1.5,Iris-versicolor
+5.8,2.7,4.1,1.0,Iris-versicolor
+6.2,2.2,4.5,1.5,Iris-versicolor
+5.6,2.5,3.9,1.1,Iris-versicolor
+5.9,3.2,4.8,1.8,Iris-versicolor
+6.1,2.8,4.0,1.3,Iris-versicolor
+6.3,2.5,4.9,1.5,Iris-versicolor
+6.1,2.8,4.7,1.2,Iris-versicolor
+6.4,2.9,4.3,1.3,Iris-versicolor
+6.6,3.0,4.4,1.4,Iris-versicolor
+6.8,2.8,4.8,1.4,Iris-versicolor
+6.7,3.0,5.0,1.7,Iris-versicolor
+6.0,2.9,4.5,1.5,Iris-versicolor
+5.7,2.6,3.5,1.0,Iris-versicolor
+5.5,2.4,3.8,1.1,Iris-versicolor
+5.5,2.4,3.7,1.0,Iris-versicolor
+5.8,2.7,3.9,1.2,Iris-versicolor
+6.0,2.7,5.1,1.6,Iris-versicolor
+5.4,3.0,4.5,1.5,Iris-versicolor
+6.0,3.4,4.5,1.6,Iris-versicolor
+6.7,3.1,4.7,1.5,Iris-versicolor
+6.3,2.3,4.4,1.3,Iris-versicolor
+5.6,3.0,4.1,1.3,Iris-versicolor
+5.5,2.5,4.0,1.3,Iris-versicolor
+5.5,2.6,4.4,1.2,Iris-versicolor
+6.1,3.0,4.6,1.4,Iris-versicolor
+5.8,2.6,4.0,1.2,Iris-versicolor
+5.0,2.3,3.3,1.0,Iris-versicolor
+5.6,2.7,4.2,1.3,Iris-versicolor
+5.7,3.0,4.2,1.2,Iris-versicolor
+5.7,2.9,4.2,1.3,Iris-versicolor
+6.2,2.9,4.3,1.3,Iris-versicolor
+5.1,2.5,3.0,1.1,Iris-versicolor
+5.7,2.8,4.1,1.3,Iris-versicolor
+6.3,3.3,6.0,2.5,Iris-virginica
+5.8,2.7,5.1,1.9,Iris-virginica
+7.1,3.0,5.9,2.1,Iris-virginica
+6.3,2.9,5.6,1.8,Iris-virginica
+6.5,3.0,5.8,2.2,Iris-virginica
+7.6,3.0,6.6,2.1,Iris-virginica
+4.9,2.5,4.5,1.7,Iris-virginica
+7.3,2.9,6.3,1.8,Iris-virginica
+6.7,2.5,5.8,1.8,Iris-virginica
+7.2,3.6,6.1,2.5,Iris-virginica
+6.5,3.2,5.1,2.0,Iris-virginica
+6.4,2.7,5.3,1.9,Iris-virginica
+6.8,3.0,5.5,2.1,Iris-virginica
+5.7,2.5,5.0,2.0,Iris-virginica
+5.8,2.8,5.1,2.4,Iris-virginica
+6.4,3.2,5.3,2.3,Iris-virginica
+6.5,3.0,5.5,1.8,Iris-virginica
+7.7,3.8,6.7,2.2,Iris-virginica
+7.7,2.6,6.9,2.3,Iris-virginica
+6.0,2.2,5.0,1.5,Iris-virginica
+6.9,3.2,5.7,2.3,Iris-virginica
+5.6,2.8,4.9,2.0,Iris-virginica
+7.7,2.8,6.7,2.0,Iris-virginica
+6.3,2.7,4.9,1.8,Iris-virginica
+6.7,3.3,5.7,2.1,Iris-virginica
+7.2,3.2,6.0,1.8,Iris-virginica
+6.2,2.8,4.8,1.8,Iris-virginica
+6.1,3.0,4.9,1.8,Iris-virginica
+6.4,2.8,5.6,2.1,Iris-virginica
+7.2,3.0,5.8,1.6,Iris-virginica
+7.4,2.8,6.1,1.9,Iris-virginica
+7.9,3.8,6.4,2.0,Iris-virginica
+6.4,2.8,5.6,2.2,Iris-virginica
+6.3,2.8,5.1,1.5,Iris-virginica
+6.1,2.6,5.6,1.4,Iris-virginica
+7.7,3.0,6.1,2.3,Iris-virginica
+6.3,3.4,5.6,2.4,Iris-virginica
+6.4,3.1,5.5,1.8,Iris-virginica
+6.0,3.0,4.8,1.8,Iris-virginica
+6.9,3.1,5.4,2.1,Iris-virginica
+6.7,3.1,5.6,2.4,Iris-virginica
+6.9,3.1,5.1,2.3,Iris-virginica
+5.8,2.7,5.1,1.9,Iris-virginica
+6.8,3.2,5.9,2.3,Iris-virginica
+6.7,3.3,5.7,2.5,Iris-virginica
+6.7,3.0,5.2,2.3,Iris-virginica
+6.3,2.5,5.0,1.9,Iris-virginica
+6.5,3.0,5.2,2.0,Iris-virginica
+6.2,3.4,5.4,2.3,Iris-virginica
+5.9,3.0,5.1,1.8,Iris-virginica
+
--- a/zajecia3/logistic.png
+++ b/zajecia3/logistic.png
--- a/1-ODPOWIEDZI.ipynb
+++ b/1-ODPOWIEDZI.ipynb
--- a/zajecia3/sklearn
+++ b/zajecia3/sklearn
@ -0,0 +1,430 @@
+{
+ "cells": [
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "Kkolejna część zajęć będzie wprowadzeniem do drugiej, szeroko używanej biblioteki w Pythonie: `sklearn`. Zajęcia będą miały charaktere case-study poprzeplatane zadaniami do wykonania. Zacznijmy od załadowania odpowiednich bibliotek."
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {
+    "scrolled": true
+   },
+   "outputs": [],
+   "source": [
+    "# ! pip install matplotlib"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "import numpy as np\n",
+    "import pandas as pd\n",
+    "import matplotlib.pyplot as plt\n",
+    "\n",
+    "%matplotlib inline"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "Zacznijmy od załadowania danych. Na dzisiejszych zajęciach będziemy korzystać z danych z portalu [gapminder.org](https://www.gapminder.org/data/)."
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "df = pd.read_csv('gapminder.csv', index_col=0)"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "Dane zawierają różne informacje z większość państw świata (z roku 2008). Poniżej znajduje się opis kolumn:\n",
+    " * female_BMI - średnie BMI u kobiet\n",
+    " * male_BMI - średnie BMI u mężczyzn\n",
+    " * gdp - PKB na obywatela\n",
+    " * population - wielkość populacji\n",
+    " * under5mortality - wskaźnik śmiertelności dzieni pon. 5 roku życia (na 1000 urodzonych dzieci)\n",
+    " * life_expectancy - średnia długość życia\n",
+    " * fertility - wskaźnik dzietności"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "**zad. 1**\n",
+    "Na podstawie danych zawartych w `df` odpowiedz na następujące pytania:\n",
+    " * Jaki był współczynniki dzietności w Polsce w 2018?\n",
+    " * W którym kraju ludzie żyją najdłużej?\n",
+    " * Z ilu krajów zostały zebrane dane?"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": []
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "**zad. 2** Stwórz kolumnę `gdp_log`, która powstanie z kolumny `gdp` poprzez zastowanie funkcji `log` (logarytm). \n",
+    "\n",
+    "Hint 1: Wykorzystaj funkcję `apply` (https://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.apply.html#pandas.Series.apply).\n",
+    "\n",
+    "Hint 2: Wykorzystaj fukcję `log` z pakietu `np`."
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": []
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "Naszym zadaniem będzie oszacowanie długości życia (kolumna `life_expectancy`) na podstawie pozostałych zmiennych. Na samym początku, zastosujemy regresje jednowymiarową na `fertility`."
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "y = df['life_expectancy'].values\n",
+    "X = df['fertility'].values\n",
+    "\n",
+    "print(\"Y shape:\", y.shape)\n",
+    "print(\"X shape:\", X.shape)"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "Będziemy korzystać z gotowej implementacji regreji liniowej z pakietu sklearn. Żeby móc wykorzystać, musimy napierw zmienić shape na dwuwymiarowy."
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "y = y.reshape(-1, 1)\n",
+    "X = X.reshape(-1, 1)\n",
+    "\n",
+    "print(\"Y shape:\", y.shape)\n",
+    "print(\"X shape:\", X.shape)"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "Jeszcze przed właściwą analizą, narysujmy wykres i zobaczny czy istnieje \"wizualny\" związek pomiędzy kolumnami."
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "df.plot.scatter('fertility', 'life_expectancy')"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "**zad. 3** Zaimportuj `LinearRegression` z pakietu `sklearn.linear_model`."
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "Tworzymy obiekt modelu regresji liniowej."
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "model = LinearRegression()"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "Trening modelu ogranicza się do wywołania metodu `fit`, która przyjmuje dwa argumenty:"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "model.fit(X, y)"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "Współczynniki modelu:"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "print(\"Wyraz wolny (bias):\", model.intercept_)\n",
+    "print(\"Współczynniki cech:\", model.coef_)"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "**zad. 4** Wytrenuj nowy model `model2`, który będzie jako X przyjmie kolumnę `gdp_log`. Wyświetl parametry nowego modelu."
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": []
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "Mając wytrenowany model możemy wykorzystać go do predykcji. Wystarczy wywołać metodę `predict`."
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "X_test = X[:5,:]\n",
+    "y_test = y[:5,:]\n",
+    "output = model.predict(X_test)\n",
+    "\n",
+    "for i in range(5):\n",
+    "    print(\"input: {}\\t predicted: {}\\t expected: {}\".format(X_test[i,0], output[i,0], y_test[i,0]))"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "## Sprawdzenie jakości modelu - metryki: $MSE$"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "Istnieją 3 metryki, które określają jak dobry jest nasz model:\n",
+    " * $MSE$: [błąd średnio-kwadratowy](https://pl.wikipedia.org/wiki/B%C5%82%C4%85d_%C5%9Bredniokwadratowy) \n",
+    " * $RMSE = \\sqrt{MSE}$"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "from sklearn.metrics import mean_squared_error\n",
+    "\n",
+    "rmse = np.sqrt(mean_squared_error(y, model.predict(X)))\n",
+    "print(\"Root Mean Squared Error: {}\".format(rmse))"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "# Import necessary modules\n",
+    "from sklearn.linear_model import LinearRegression\n",
+    "from sklearn.metrics import mean_squared_error\n",
+    "from sklearn.model_selection import train_test_split\n",
+    "\n",
+    "# Create training and test sets\n",
+    "X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.30, random_state=42)\n",
+    "\n",
+    "# Create the regressor: reg_all\n",
+    "reg_all = LinearRegression()\n",
+    "\n",
+    "# Fit the regressor to the training data\n",
+    "reg_all.fit(X_train, y_train)\n",
+    "\n",
+    "# Predict on the test data: y_pred\n",
+    "y_pred = reg_all.predict(X_test)\n",
+    "\n",
+    "# Compute and print R^2 and RMSE\n",
+    "print(\"R^2: {}\".format(reg_all.score(X_test, y_test)))\n",
+    "rmse = np.sqrt(mean_squared_error(y_test, y_pred))\n",
+    "print(\"Root Mean Squared Error: {}\".format(rmse))\n"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "## Regresja wielu zmiennych"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "Model regresji liniowej wielu zmiennych nie różni się istotnie od modelu jednej zmiennej. Np. chcąc zbudować model oparty o dwie kolumny: `fertility` i `gdp` wystarczy zmienić X (cechy wejściowe):"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "X = df[['fertility', 'gdp']]\n",
+    "X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.30, random_state=42)\n",
+    "\n",
+    "print(X.shape)\n",
+    "\n",
+    "model_mv = LinearRegression()\n",
+    "model_mv.fit(X_train, y_train)\n",
+    "\n",
+    "print(\"Wyraz wolny (bias):\", model_mv.intercept_)\n",
+    "print(\"Współczynniki cech:\", model_mv.coef_)\n",
+    "\n",
+    "y_pred = model_mv.predict(X_test)\n",
+    "\n",
+    "rmse = np.sqrt(mean_squared_error(y_test, y_pred))\n",
+    "print(\"Root Mean Squared Error: {}\".format(rmse))"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "**zad. 7** \n",
+    " * Zbuduj model regresji liniowej, która oszacuje wartność kolumny `life_expectancy` na podstawie pozostałych kolumn.\n",
+    " * Wyświetl współczynniki modelu.\n",
+    " * Oblicz wartości metryki rmse na zbiorze trenującym.\n",
+    " "
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": []
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "**zad. 6**\n"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    " Zaimplementuj metrykę  $RMSE$  jako fukcję rmse (szablon poniżej). Fukcja rmse przyjmuje dwa parametry typu list i ma zwrócić wartość metryki  $RMSE$ ."
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "def rmse(expected, predicted):\n",
+    "    \"\"\"\n",
+    "    argumenty:\n",
+    "    expected (type: list): poprawne wartości\n",
+    "    predicted (type: list): oszacowanie z modelu\n",
+    "    \"\"\"\n",
+    "    pass\n",
+    "    \n",
+    "\n",
+    "y = df['life_expectancy'].values\n",
+    "X = df[['fertility', 'gdp']].values\n",
+    "\n",
+    "test_model = LinearRegression()\n",
+    "test_model.fit(X, y)\n",
+    "\n",
+    "predicted = list(test_model.predict(X))\n",
+    "expected = list(y)\n",
+    "\n",
+    "print(rmse(predicted,expected))\n",
+    "print(np.sqrt(mean_squared_error(predicted, expected)))"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": []
+  }
+ ],
+ "metadata": {
+  "kernelspec": {
+   "display_name": "Python 3 (ipykernel)",
+   "language": "python",
+   "name": "python3"
+  },
+  "language_info": {
+   "codemirror_mode": {
+    "name": "ipython",
+    "version": 3
+   },
+   "file_extension": ".py",
+   "mimetype": "text/x-python",
+   "name": "python",
+   "nbconvert_exporter": "python",
+   "pygments_lexer": "ipython3",
+   "version": "3.11.5"
+  }
+ },
+ "nbformat": 4,
+ "nbformat_minor": 2
+}
--- a/2-ODPOWIEDZI.ipynb
+++ b/2-ODPOWIEDZI.ipynb
--- a/zajecia3/sklearn
+++ b/zajecia3/sklearn
@ -0,0 +1,568 @@
+{
+ "cells": [
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "# Klasyfikacja w Pythonie"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "**zad. 1** Które z poniższych problemów jest problemem regresji, a które klasyfikacji?\n",
+    " 1. Sprawdzenie, czy wiadomość jest spamem.\n",
+    " 1. Przewidzenie oceny (od 1 do 5 gwiazdek) na podstawie komentarza.\n",
+    " 1. OCR cyfr: rozpoznanie cyfry z obrazka.\n",
+    " \n",
+    " Jeżeli problem jest klasyfikacyjny, to jakie mamy klasy?"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": []
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "## Miary dla klasyfikacji"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "Istnieje wieje miar (metryk), na podstawie których możemy ocenić jakość modelu. Podobnie jak w przypadku regresji liniowej potrzebne są dwie listy: lista poprawnych klas i lista predykcji z modelu. Najpopularniejszą z metryk jest trafność, którą definiuje się w następujący sposób:\n",
+    " $$ACC = \\frac{k}{N}$$ \n",
+    " \n",
+    " gdzie: \n",
+    "  * $k$  to liczba poprawnie zaklasyfikowanych przypadków,\n",
+    "  * $N$ liczebność zbioru testującego."
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "**zadanie** Napisz funkcję, która jako parametry przyjmnie dwie listy (lista poprawnych klas i wyjście z klasyfikatora) i zwróci trafność."
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "def accuracy_measure(true, predicted):\n",
+    "    pass\n",
+    "\n",
+    "true_label = [1, 1, 1, 0, 0]\n",
+    "predicted = [0, 1, 0, 1, 0]\n",
+    "print(\"ACC:\", accuracy_measure(true_label, predicted))"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "## Klasyfikator $k$ najbliższych sąsiadów *(ang. k-nearest neighbors, KNN)*"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "Klasyfikator [KNN](https://en.wikipedia.org/wiki/K-nearest_neighbors_algorithm), który został wprowadzony na ostatnim wykładzie, jest bardzo intuicyjny. Pomysł, który stoi za tym klasyfikatorem jest bardzo prosty: Jeżeli mamy nowy obiekt do zaklasyfikowania, to szukamy wśród danych trenujących $k$ najbardziej podobnych do niego przykładów i na ich podstawie decydujemy (np. biorąc większość) do jakie klasy powinien należeć dany obiekt."
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "** Przykład 1** Mamy za zadanie przydzielenie obiektów do dwóch klas: trójkątów lub kwadratów. Rozpatrywany obiekt jest zaznaczony zielonym kółkiem. Przyjmując $k=3$, mamy wśród sąsiadów 2 trójkąty i 1 kwadrat. Stąd obiekt powinienm zostać zaklasyfikowany jako trójkąt. Jak zmienia się sytuacja, gdy przyjmiemy $k=5$?\n",
+    "\n",
+    "![Przykład 1](./KnnClassification.svg.png)\n",
+    "\n",
+    "( Grafika pochodzi z https://pl.wikipedia.org/wiki/K_najbli%C5%BCszych_s%C4%85siad%C3%B3w )"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "## Herbal Iris"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "*Herbal Iris* jest klasycznym zbiorem danych w uczeniu maszynowym, który powstał w 1936 roku. Zawiera on informacje na 150 egzemplarzy roślin, które należą do jednej z 3 odmian."
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "**zad. 2** Wczytaj do zmiennej ``data`` zbiór *Herbal Iris*, który znajduje się w pliku ``iris.data``. Jest to plik csv.\n",
+    "\n",
+    "Kolumny są następujące:\n",
+    "\n",
+    "1. sepal length in cm\n",
+    "2. sepal width in cm\n",
+    "3. petal length in cm\n",
+    "4. petal width in cm\n",
+    "5. class: \n",
+    "  * Iris Setosa\n",
+    "  * Iris Versicolour\n",
+    "  * Iris Virginica"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": []
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "**zad. 3** Odpowiedz na poniższe pytania:\n",
+    " 1. Które atrybuty są wejściowe, a w której kolumnie znajduje się klasa wyjściowa?\n",
+    " 1. Ile jest różnych klas? Wypisz je ekran.\n",
+    " 1. Jaka jest średnia wartość w kolumnie ``sepal_length``? Jak zachowuje się średnia, jeżeli policzymy ją dla każdej z klas osobno?"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": []
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "Wytrenujmy klasyfikator *KNN*, ale najpierw przygotujmy dane. Fukcja ``train_test_split`` dzieli zadany zbiór danych na dwie części. My wykorzystamy ją do podziału na zbiór treningowy (66%) i testowy (33%), służy do tego parametr ``test_size``."
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "from sklearn.model_selection import train_test_split\n",
+    "\n",
+    "X = data.loc[:, 'sepal_length':'petal_width']\n",
+    "Y = data['class']\n",
+    "\n",
+    "(train_X, test_X, train_Y, test_Y) = train_test_split(X, Y, test_size=0.33, random_state=42)\n"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "Trenowanie klasyfikatora wygląda bardzo podobnie do treningi modelu regresji liniowej:"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "from sklearn.neighbors import KNeighborsClassifier\n",
+    "\n",
+    "model = KNeighborsClassifier(n_neighbors=3)\n",
+    "model.fit(train_X, train_Y)\n"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "Mając wytrenowany model możemy wykorzystać go do predykcji na zbiorze testowym."
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "predicted = model.predict(test_X)\n",
+    "\n",
+    "for i in range(10):\n",
+    "    print(\"Zaklasyfikowane: {}, Orginalne: {}\".format(predicted[i], test_Y.reset_index()['class'][i]))\n"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "Możemy obliczyć *accuracy*:"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "from sklearn.metrics import accuracy_score\n",
+    "\n",
+    "print(accuracy_score(test_Y, predicted))"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "**zad. 4** Wytrenuj nowy model ``model_2`` zmieniając liczbę sąsiadów na 20. Czy zmieniły się wyniki?"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": []
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "**zad. 5**   Wytrenuj model z $k=1$. Przeprowadź walidację na zbiorze trenującym zamiast na zbiorze testowym? Jakie wyniki otrzymałeś? Czy jest to wyjątek? Dlaczego tak się dzieje?"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": []
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "## Walidacja krzyżowa"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "Zbiór *herbal Iris* jest bardzo małym zbiorem. Wydzielenie z niego zbioru testowego jest obciążone dużą wariancją wyników, tj. w zależności od sposoby wyboru zbioru testowego wyniki mogą się bardzo różnic. Żeby temu zaradzić, stosuje się algorytm [walidacji krzyżowej](https://en.wikipedia.org/wiki/Cross-validation_(statistics). Algorytm wygląda następująco:\n",
+    " 1. Podziel zbiór danych na $n$ części (losowo).\n",
+    " 1. Dla każdego i od 1 do $n$ wykonaj:\n",
+    "  1. Weź $i$-tą część jako zbiór testowy, pozostałe dane jako zbiór trenujący.\n",
+    "  1. Wytrenuj model na zbiorze trenującym.\n",
+    "  1. Uruchom model na danych testowych i zapisz wyniki.\n",
+    " 1. Ostateczne wyniki to średnia z $n$ wyników częściowych. \n",
+    " \n",
+    " W Pythonie służy do tego funkcja ``cross_val_score``, która przyjmuje jako parametry (kolejno) model, zbiór X, zbiór Y. Możemy ustawić parametr ``cv``, który określa na ile części mamy podzielić zbiór danych oraz parametr ``scoring`` określający miarę.\n",
+    " \n",
+    " W poniższym przykładzie dzielimy zbiór danych na 10 części (10-krotna walidacja krzyżowa) i jako miarę ustawiany celność (ang. accuracy)."
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "from sklearn.model_selection import cross_val_score\n",
+    "\n",
+    "knn = KNeighborsClassifier(n_neighbors=k)\n",
+    "scores = cross_val_score(knn, X, Y, cv=10, scoring='accuracy')\n",
+    "print(\"Wynik walidacji krzyżowej:\", scores.mean())"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "**zad. 6** Klasyfikator $k$ najbliższych sąsiadów posiada jeden parametr: $k$, który określa liczbę sąsiadów podczas klasyfikacji. Jak widzieliśmy, wybór $k$ może mieć duże znaczenie dla jakości klasyfikatora. Wykonaj:\n",
+    " 1. Stwórz listę ``neighbors`` wszystkich liczb nieparzystych od 1 do 50.\n",
+    " 1. Dla każdego elementu ``i`` z listy ``neighbors`` zbuduj klasyfikator *KNN* o liczbie sąsiadów równej ``i``. Nastepnie przeprowadz walidację krzyżową (parametry takie same jak powyżej) i zapisz wyniki do tablicy ``cv_scores``.\n",
+    " 1. Znajdź ``k``, dla którego klasyfikator osiąga najwyższy wynik."
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": []
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "Wykres przedstawiający precent błedów w zależnosci od liczby sąsiadów."
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "import matplotlib.pyplot as plt\n",
+    "# changing to misclassification error\n",
+    "MSE = [1 - x for x in cv_scores]\n",
+    "\n",
+    "# plot misclassification error vs k\n",
+    "plt.plot(neighbors, MSE)\n",
+    "plt.xlabel('Liczba sąsiadów')\n",
+    "plt.ylabel('Procent błędów')\n",
+    "plt.show()"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "## TF IDF Vectorizer\n",
+    "\n",
+    "Czasami, żeby wytrenować model nie da się zastosować bezpośrednio danego typu danych, ponieważ najczęściej wejściem do algorytmu ML jest wektor, macierz lub tensor.\n",
+    "Dane tekstowe musimy również przekształcić do wektorów. Przydatny w tym przypadku jest TF IDF Vectorizer.\n",
+    "Oto przyład z dokumentacji jak można z niego skorzystać (https://scikit-learn.org/stable/modules/generated/sklearn.feature_extraction.text.TfidfVectorizer.html)\n",
+    "\n"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 2,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "(4, 9)\n"
+     ]
+    }
+   ],
+   "source": [
+    "from sklearn.feature_extraction.text import TfidfVectorizer\n",
+    "corpus = [\n",
+    "    'This is the first document.',\n",
+    "    'This document is the second document.',\n",
+    "    'And this is the third one.',\n",
+    "    'Is this the first document?',\n",
+    "]\n",
+    "vectorizer = TfidfVectorizer()\n",
+    "X = vectorizer.fit_transform(corpus)\n",
+    "vectorizer.get_feature_names_out()\n",
+    "print(X.shape)\n"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 3,
+   "metadata": {},
+   "outputs": [
+    {
+     "data": {
+      "text/plain": [
+       "array(['and', 'document', 'first', 'is', 'one', 'second', 'the', 'third',\n",
+       "       'this'], dtype=object)"
+      ]
+     },
+     "execution_count": 3,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
+   "source": [
+    "vectorizer.get_feature_names_out()\n"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 4,
+   "metadata": {},
+   "outputs": [
+    {
+     "data": {
+      "text/plain": [
+       "<4x9 sparse matrix of type '<class 'numpy.float64'>'\n",
+       "\twith 21 stored elements in Compressed Sparse Row format>"
+      ]
+     },
+     "execution_count": 4,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
+   "source": [
+    "X"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 5,
+   "metadata": {},
+   "outputs": [
+    {
+     "data": {
+      "text/plain": [
+       "matrix([[0.        , 0.46979139, 0.58028582, 0.38408524, 0.        ,\n",
+       "         0.        , 0.38408524, 0.        , 0.38408524],\n",
+       "        [0.        , 0.6876236 , 0.        , 0.28108867, 0.        ,\n",
+       "         0.53864762, 0.28108867, 0.        , 0.28108867],\n",
+       "        [0.51184851, 0.        , 0.        , 0.26710379, 0.51184851,\n",
+       "         0.        , 0.26710379, 0.51184851, 0.26710379],\n",
+       "        [0.        , 0.46979139, 0.58028582, 0.38408524, 0.        ,\n",
+       "         0.        , 0.38408524, 0.        , 0.38408524]])"
+      ]
+     },
+     "execution_count": 5,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
+   "source": [
+    "X.todense()"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "Na podstawie tych danych możemy wytrenowąc model regresji logistycznej. Jest to model regresji liniowej z dodatkową nałożoną funkcją logistyczną:\n",
+    "    ( https://en.wikipedia.org/wiki/Logistic_function )\n",
+    "    \n",
+    "    \n",
+    "![Przykład 1](./logistic.png)\n",
+    "\n",
+    "\n",
+    "Dzięki wyjściu modelu zawsze pomiędzy 0, a 1 można traktować wynik jako prawdopodobieństwo\n"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 7,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "from sklearn.linear_model import LogisticRegression"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 8,
+   "metadata": {},
+   "outputs": [
+    {
+     "data": {
+      "text/plain": [
+       "array([0, 0, 1, 0])"
+      ]
+     },
+     "execution_count": 8,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
+   "source": [
+    "y = [0,0,1,1]\n",
+    "model = LogisticRegression()\n",
+    "model.fit(X, y)\n",
+    "model.predict(X)"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 9,
+   "metadata": {},
+   "outputs": [
+    {
+     "data": {
+      "text/plain": [
+       "array([[0.51514316, 0.48485684],\n",
+       "       [0.56428483, 0.43571517],\n",
+       "       [0.40543928, 0.59456072],\n",
+       "       [0.51514316, 0.48485684]])"
+      ]
+     },
+     "execution_count": 9,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
+   "source": [
+    "model.predict_proba(X)"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "## Sieci neuronowe\n",
+    "\n",
+    "Warto zauważyć, że sieci neuronowe w najprostszym wariancie to tak naprawdę złożenie wielu funkcji regresji logistycznej ze sobą, gdzie wejściem jednego modelu regresji logistycznej jest wyjście poprzedniej. W przypadku danych tekstowych zazwyczaj jest wybierana wtedy inna reprezentacja danych niż TF IDF, ponieważ TF IDF nie uwzględnia kolejności słów"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "## Standard Scaler\n",
+    "\n",
+    "**Zadanie 7**\n",
+    "\n",
+    "\n",
+    "Sprawdź dokumentację https://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.StandardScaler.html\n",
+    "\n",
+    "KNN jest wrażliwy na liniowe skalowanie danych (w przeciwieństwie do modeli bazujących na regresji, gdyż współczynniki liniowe rekompensują skalowanie liniowe).\n",
+    "\n",
+    "Wytrenuj dowolny model KNN na cechach pozyskanych ze StandardScaler. Pamiętaj, żeby wyskalować zarówno dane ze zbioru test jak i train.\n",
+    "\n",
+    "\n",
+    "\n",
+    "Zauważ, że scaler ma podobne API (fit, transform) jak TF IDF Vectorier"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": []
+  }
+ ],
+ "metadata": {
+  "kernelspec": {
+   "display_name": "Python 3 (ipykernel)",
+   "language": "python",
+   "name": "python3"
+  },
+  "language_info": {
+   "codemirror_mode": {
+    "name": "ipython",
+    "version": 3
+   },
+   "file_extension": ".py",
+   "mimetype": "text/x-python",
+   "name": "python",
+   "nbconvert_exporter": "python",
+   "pygments_lexer": "ipython3",
+   "version": "3.11.5"
+  }
+ },
+ "nbformat": 4,
+ "nbformat_minor": 2
+}