This commit is contained in:
Jakub Adamski 2021-06-19 18:18:31 +02:00
parent 408c3f0010
commit b67c4e6ecf
6 changed files with 79 additions and 1 deletions

View File

@ -542,14 +542,92 @@ Wykonując później test ANOVA - analiza wariancji możemy zobaczyć czy porów
--- ---
## LAB 8 ## LAB 8
Zagadnienia: Zagadnienia:
- - regresja liniowa
- wykład 9 na stronie - pierwsza część
### R ### R
```r
# regresja liniowa
model <- lm(liczba_przypadkow ~ rok, data = data_set)
model$coefficients
plot(data_set, main = "Wykres rozrzutu", pch = 16)
abline(model, col = "red", lwd = 2)
coef(model)
confint(model)
# bez wyrazu wolnego
model <- lm(distance ~ speed - 1, data = braking)
# szczegóły
summary(model)
fitted(model)
residuals(model)
summary(model_1_3)$adj.r.squared # dopasowanie modelu
# przedziały ufności (jakbym usunął to +- 10 to nic się nie zmienia właściwie)
temp_rok <- data.frame(rok = seq(min(data_set$rok) - 10,
max(data_set$rok) + 10,
length = 100))
pred <- stats::predict(model, temp_rok, interval = "prediction")
plot(data_set, main = "Wykres rozrzutu", pch = 16)
abline(model, col = "red", lwd = 2)
lines(temp_rok$rok, pred[, 2], lty = 2, col = "red")
lines(temp_rok$rok, pred[, 3], lty = 2, col = "red")
# predykcja
new_rok <- data.frame(rok = 2003:2007)
(pred_2003_2007 <- stats::predict(model, new_rok, interval = 'prediction'))
plot(data_set, main = "Wykres rozrzutu z predykcją na lata 2003-2007", pch = 16,
xlim = c(1995, 2007), ylim = c(10, 40))
abline(model, col = "red", lwd = 2)
points(2003:2007, pred_2003_2007[, 1], col = "blue", pch = 16)
temp_rok <- data.frame(rok = seq(1994, 2008, length = 100))
pred <- stats::predict(model, temp_rok, interval = "prediction")
lines(temp_rok$rok, pred[, 2], lty = 2, col = "red")
lines(temp_rok$rok, pred[, 3], lty = 2, col = "red")
```
### Regresja
Główną ideą regresji jest przewidywanie, prognozowanie danych dla pewnej zmiennej na podstawie innych zmiennych. Innymi słowy, jaką wartość przyjmie dana zmienna gdy będziemy znali wartość innej zmiennej. Oczywiście, aby móc "poszukiwać" wartości jednej zmiennej na podstawie innej zmiennej musimy za pomocą analizy regresji skonstruować model regresyjny, model, który będzie z założonym błędem statystycznym przewidywał wartość, poziom danej cechy.
Założenia analizy regresji:
- Niezależność obserwacji dla poszczególnych jednostek eksperymentalnych.
- Brak błędu systematycznego.
- Jednakowa i stała wariancja błędów.
- Brak korelacji błędów.
- W procedurach testowych oraz w przypadku wykorzystywania przedziału predykcji, potrzebne jest dodatkowe założenie normalności błędów. Powoduje ono, że brak korelacji błędów oznacza ich niezależność.<br/>
![regresja](lab8/regresja.png)
<br/><br/>
- Estymacja funkcji regresji<br/>
![estymacja](lab8/estymacja.png)
### Zagadnienia ### Zagadnienia
- Regresja liniowa - jest najprostszym wariantem regresji w statystyce. Zakłada ona, że zależność pomiędzy zmienną objaśnianą a objaśniająca jest zależnością liniową.<br/>
![liniowa](lab8/liniowa.png)
- Poziom ufoności - jak często mamy rację. Wyrażane w procentach.
- Reszty - o ile różni się wynik zmierzony od przewidzianego.
- Czasem można usunąć wyraz wolny. Analogicznie jest ze współczynnikiem kierunkowym (wtedy zmienne są niezależne) - wzór na stronie<br/>
![wolny](lab8/wolny.png)
- Dopasowanie modelu<br/>
![dopasowanie](lab8/dopasowanie.png)

Binary file not shown.

After

Width:  |  Height:  |  Size: 36 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 53 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 77 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 25 KiB

BIN
podsumowanie/lab8/wolny.png Normal file

Binary file not shown.

After

Width:  |  Height:  |  Size: 47 KiB