pomiar_1<-c(5.4,21.2,6.4,12.5,26.4,33.3,26.4,26.6,21.0,16.8,15.6,40.0,46.6,19.8,28.4,20.0,37.2) pomiar_2<-c(16.8,34.0,5.3,33.0,26.4,22.5,13.5,11.0,12.5,8.0,14.6,42.4,55.5,25.8,23.0,25.5,24.5) pomiar_3<-c(6.8,30.0,21.7,10.8,23.0,27.7,8.8,16.4,12.5,7.5,11.4,31.4,34.5,23.0,25.4,20.1,28.8) pomiar_4<-c(22.5,18.0,4.3,16.8,20.0,40.0,15.5,27.0,10.2,6.5,14.4,36.6,25.5,18.4,10.0,17.2,15.5) par(mfrow=c(2,2)) hist(pomiar_1) hist(pomiar_2) hist(pomiar_3) hist(pomiar_4) pomiary<-c(pomiar_1,pomiar_2,pomiar_3,pomiar_4) dane<-matrix(pomiary,nrow = 17) d1 <- data.frame(pomiar_1,pomiar_1, pomiar_2, pomiar_2) plot(d1, main = "Wykres rozrzutu", pch = 16) # zależne czy nie pairs(data.frame(pomiar_1,pomiar_2,pomiar_3,pomiar_4)) # czy z rozkładu normalnego shapiro.test(pomiar_1) shapiro.test(pomiar_2) shapiro.test(pomiar_3) shapiro.test(pomiar_4) qqnorm(pomiar_1) qqline(pomiar_1) g <- factor(rep(1:4, c(17, 17, 17, 17))) require(graphics) boxplot(as.vector(dane) ~ g) # weryfikacja hipotezy o jednakowych średnich wartościach badanej cechy bartlett.test(as.vector(dane) ~ g, data = dane)$p.value #ANOVA fligner.test(as.vector(dane) ~ g, data = dane)$p.value summary(aov(as.vector(dane) ~ g, data = data.frame(pomiar_1,pomiar_2,pomiar_3,pomiar_4))) #nie ma różnic między grupami #porównania wielokrotne miedzy grupami pairwise.t.test(as.vector(dane),g,data = data.frame(pomiar_1,pomiar_2,pomiar_3,pomiar_4)) #brak różnic #Czy odrzucamy postawioną hipotezę badawczą #nie ma podstaw # PROBLEM 2 install.packages("BSDA") require(BSDA) # kodowanie plec <-ifelse(Dyslexia$gender=="female",0,1) reka <-ifelse(Dyslexia$handed=="right",1,0) dane<-subset(Dyslexia,select=c(age,weight,height,words)) pairs(dane) # wybieramy do analizy model1<-lm(words~age+weight+height,data=dane) summary(model1) #nieistotne zmienne step(model1) #najlepiej dopasowany model dla zależności liczby czytanych słów model2<-lm(words~weight+height,data=dane) summary(model2) step(model2) #nieistotne zmienne # najlepiej dopasowaną prostą regresji dla zależności zmiennej weight od height # zmiana modelu model3 <- lm(weight ~ height, data = dane) summary(model3) temp_height <- data.frame(height = seq(min(dane$height) - 10, max(dane$height) + 10, length = 100)) pred <- stats::predict(model3, temp_height, interval = "prediction") plot(dane$height,dane$weight, main = "Wykres rozrzutu", pch = 16) abline(model3, col = "red", lwd = 2) nowa_wys<-data.frame(height=67) predict(model3,nowa_wys,interval="prediction") pred_67<-predict(model3,nowa_wys,interval="prediction") points(67, pred_67[, 1], col = "blue", pch = 16) # ZAD3 x1<-rexp(30,5) x2<-rnorm(30,2,2) x3<-rnorm(30,10,1) gen<-c(x1,x2,x3) # wykresy gęstości jądrowych przy różnych szerokościach okna par(mfrow=c(2,2)) plot(density(gen,bw=0.1)) plot(density(gen,bw=0.5)) plot(density(gen,bw=3)) plot(density(gen,bw=5)) #na trzecim