diff --git a/podsumowanie/README.md b/podsumowanie/README.md index f81419c..6177f1b 100644 --- a/podsumowanie/README.md +++ b/podsumowanie/README.md @@ -542,14 +542,92 @@ Wykonując później test ANOVA - analiza wariancji możemy zobaczyć czy porów --- ## LAB 8 Zagadnienia: - - + - regresja liniowa + + - wykład 9 na stronie - pierwsza część ### R +```r +# regresja liniowa +model <- lm(liczba_przypadkow ~ rok, data = data_set) +model$coefficients +plot(data_set, main = "Wykres rozrzutu", pch = 16) +abline(model, col = "red", lwd = 2) +coef(model) +confint(model) + +# bez wyrazu wolnego +model <- lm(distance ~ speed - 1, data = braking) + +# szczegóły +summary(model) +fitted(model) +residuals(model) +summary(model_1_3)$adj.r.squared # dopasowanie modelu + +# przedziały ufności (jakbym usunął to +- 10 to nic się nie zmienia właściwie) +temp_rok <- data.frame(rok = seq(min(data_set$rok) - 10, + max(data_set$rok) + 10, + length = 100)) +pred <- stats::predict(model, temp_rok, interval = "prediction") +plot(data_set, main = "Wykres rozrzutu", pch = 16) +abline(model, col = "red", lwd = 2) +lines(temp_rok$rok, pred[, 2], lty = 2, col = "red") +lines(temp_rok$rok, pred[, 3], lty = 2, col = "red") + +# predykcja +new_rok <- data.frame(rok = 2003:2007) +(pred_2003_2007 <- stats::predict(model, new_rok, interval = 'prediction')) +plot(data_set, main = "Wykres rozrzutu z predykcją na lata 2003-2007", pch = 16, + xlim = c(1995, 2007), ylim = c(10, 40)) +abline(model, col = "red", lwd = 2) +points(2003:2007, pred_2003_2007[, 1], col = "blue", pch = 16) +temp_rok <- data.frame(rok = seq(1994, 2008, length = 100)) +pred <- stats::predict(model, temp_rok, interval = "prediction") +lines(temp_rok$rok, pred[, 2], lty = 2, col = "red") +lines(temp_rok$rok, pred[, 3], lty = 2, col = "red") +``` + + + +### Regresja +Główną ideą regresji jest przewidywanie, prognozowanie danych dla pewnej zmiennej na podstawie innych zmiennych. Innymi słowy, jaką wartość przyjmie dana zmienna gdy będziemy znali wartość innej zmiennej. Oczywiście, aby móc "poszukiwać" wartości jednej zmiennej na podstawie innej zmiennej musimy za pomocą analizy regresji skonstruować model regresyjny, model, który będzie z założonym błędem statystycznym przewidywał wartość, poziom danej cechy. +Założenia analizy regresji: +- Niezależność obserwacji dla poszczególnych jednostek eksperymentalnych. + +- Brak błędu systematycznego. + +- Jednakowa i stała wariancja błędów. + +- Brak korelacji błędów. + +- W procedurach testowych oraz w przypadku wykorzystywania przedziału predykcji, potrzebne jest dodatkowe założenie normalności błędów. Powoduje ono, że brak korelacji błędów oznacza ich niezależność.
+ +![regresja](lab8/regresja.png) + +

+ +- Estymacja funkcji regresji
+![estymacja](lab8/estymacja.png) + + ### Zagadnienia +- Regresja liniowa - jest najprostszym wariantem regresji w statystyce. Zakłada ona, że zależność pomiędzy zmienną objaśnianą a objaśniająca jest zależnością liniową.
+![liniowa](lab8/liniowa.png) + +- Poziom ufoności - jak często mamy rację. Wyrażane w procentach. + +- Reszty - o ile różni się wynik zmierzony od przewidzianego. + +- Czasem można usunąć wyraz wolny. Analogicznie jest ze współczynnikiem kierunkowym (wtedy zmienne są niezależne) - wzór na stronie
+![wolny](lab8/wolny.png) + +- Dopasowanie modelu
+![dopasowanie](lab8/dopasowanie.png) diff --git a/podsumowanie/lab8/dopasowanie.png b/podsumowanie/lab8/dopasowanie.png new file mode 100644 index 0000000..35ecf1f Binary files /dev/null and b/podsumowanie/lab8/dopasowanie.png differ diff --git a/podsumowanie/lab8/estymacja.png b/podsumowanie/lab8/estymacja.png new file mode 100644 index 0000000..1c2b59a Binary files /dev/null and b/podsumowanie/lab8/estymacja.png differ diff --git a/podsumowanie/lab8/liniowa.png b/podsumowanie/lab8/liniowa.png new file mode 100644 index 0000000..8521f50 Binary files /dev/null and b/podsumowanie/lab8/liniowa.png differ diff --git a/podsumowanie/lab8/regresja.png b/podsumowanie/lab8/regresja.png new file mode 100644 index 0000000..ebfb8db Binary files /dev/null and b/podsumowanie/lab8/regresja.png differ diff --git a/podsumowanie/lab8/wolny.png b/podsumowanie/lab8/wolny.png new file mode 100644 index 0000000..6b76bec Binary files /dev/null and b/podsumowanie/lab8/wolny.png differ