2.4 KiB
2.4 KiB
Uczenie maszynowe 2019/2020 – laboratoria
23/24 marca 2020
3. Regresja liniowa – zadanie
Zadanie 3
Część podstawowa (4 punkty)
Plik fires_thefts.csv
zawiera rzeczywiste dane zebrane przez _U.S. Commission on Civil Rights, przedstawiające liczbę pożarów w danej dzielnicy na tysiąc gospodarstw domowych (pierwsza kolumna) oraz liczbę włamań w tej samej dzielnicy na tysiąc mieszkańców (druga kolumna).
Stwórz model (regresja liniowa) przewidujący liczbę włamań na podstawie liczby pożarów:
- Oblicz parametry $\theta$ krzywej regresyjnej za pomocą metody gradientu prostego (_gradient descent). Możesz wybrać wersję iteracyjną lub macierzową algorytmu.
- Wykorzystując uzyskaną krzywą regresyjną przepowiedz liczbę włamań na tysiąc mieszkańców dla dzielnicy, w której występuje średnio 50, 100, 200 pożarów na tysiąc gospodarstw domowych.
Część zaawansowana (2 punkty)
Dla różnych wartości długości kroku $\alpha \in \{ 0.001, 0.01 , 0.1 \}$ stwórz wykres, który zilustruje progresję wartości $J(\theta)$ dla pierwszych 200 króków algorytmu gradientu prostego:
- Oś $x$ wykresu to kolejne kroki algorytmu – od 0 do 200.
- Oś $y$ wykresu to wartosci $J(\theta)$.
- Wykres powinien skłądać się z trzech krzywych:
- dla $\alpha = 0.001$
- dla $\alpha = 0.01$
- dla $\alpha = 0.1$