ZAD6

2021-05-06 11:41:27 +02:00 · 2021-05-06 11:41:27 +02:00 · 6e10bcea52
commit 6e10bcea52
parent 4825e4ba00
8 changed files with 269 additions and 0 deletions
--- a/zajecia6/.RData
+++ b/zajecia6/.RData
--- a/zajecia6/.Rhistory
+++ b/zajecia6/.Rhistory
@ -0,0 +1,104 @@
 x <- c(862, 870, 876, 866, 871, 865, 861, 873, 871, 872)
 shapiro.test(x)$p.value
 qqnorm(x)
 qqline(x)
 mean(x)
 t.test(x, mu = 870, alternative = "less")$p.value
 x <- c(78.2, 78.5, 75.6, 78.5, 78.5, 77.4, 76.6)
 y <- c(76.1, 75.2, 75.8, 77.3, 77.3, 77.0, 74.4, 76.2, 73.5, 77.4)
 boxplot(x, y)
 shapiro.test(x)$p.value
 qqnorm(x)
 qqline(x)
 shapiro.test(y)$p.value
 qqnorm(y)
 qqline(y)
 var(x)
 var(y)
 var.test(x, y, alternative = "less")$p.value
 mean(x)
 mean(y)
 t.test(x, y, var.equal = TRUE, alternative = 'greater')$p.value
 x <- c(78.2, 78.5, 75.6, 78.5, 78.5, 77.4, 76.6)
 y <- c(76.1, 75.2, 75.8, 77.3, 77.3, 77.0, 74.4, 76.2, 73.5, 77.4)
 boxplot(x, y)
 mean(x)
 mean(y)
 t.test(x, y, var.equal = TRUE, alternative = 'greater')$p.value
 x <- c(88.2, 88.5, 85.6, 88.5, 88.5, 87.4, 86.6)
 y <- c(76.1, 75.2, 75.8, 77.3, 77.3, 77.0, 74.4, 76.2, 73.5, 77.4)
 boxplot(x, y)
 mean(x)
 mean(y)
 t.test(x, y, var.equal = TRUE, alternative = 'greater')$p.value
 shapiro.test(x)$p.value
 shapiro.test(y)$p.value
 var(x)
 var(y)
 var.test(x, y, alternative = "less")$p.value
 x <- c(78.2, 78.5, 75.6, 78.5, 78.5, 77.4, 76.6)
 y <- c(76.1, 75.2, 75.8, 77.3, 77.3, 77.0, 74.4, 76.2, 73.5, 77.4)
 t.test(x, y, var.equal = TRUE, alternative = 'greater')$p.value
 x <- c(78.2, 78.5, 75.6, 78.5, 78.5, 77.4, 76.6)
 y <- c(86.1, 85.2, 85.8, 87.3, 87.3, 87.0, 84.4, 86.2, 83.5, 87.4)
 t.test(x, y, var.equal = TRUE, alternative = 'greater')$p.value
 x <- c(78.2, 78.5, 75.6, 78.5, 78.5, 77.4, 76.6)
 y <- c(76.1, 75.2, 75.8, 77.3, 77.3, 77.0, 74.4, 76.2, 73.5, 77.4)
 t.test(x, y, var.equal = TRUE, alternative = 'greater')$p.value
 x <- c(84, 87, 87, 90, 90, 90, 90, 93, 93, 96)
 y <- c(89, 92, 98, 95, 95, 92, 95, 92, 98, 101)
 boxplot(x, y)
 shapiro.test(x)$p.value
 qqnorm(x)
 qqline(x)
 shapiro.test(y)$p.value
 qqnorm(y)
 qqline(y)
 mean(x)
 mean(y)
 t.test(x, y, paired = TRUE, alternative = 'less')$p.value
 x <- c(171, 176, 179, 189, 176, 182, 173, 179, 184, 186, 189, 167, 177)
 y <- c(161, 162, 163, 162, 166, 164, 168, 165, 168, 157, 161, 172)
 boxplot(x, y)
 shapiro.test(x)$p.value
 qqnorm(x)
 qqline(x)
 shapiro.test(y)$p.value
 qqnorm(y)
 qqline(y)
 var(x)
 var(y)
 var.test(x, y, alternative = "greater")$p.value
 mean(x)
 mean(y)
 t.test(x, y, alternative = 'greater')$p.value
 w_test <- function(x, lambda_zero, alternative = c('two.sided', 'less', 'greater')) {
 statistic <- 2 * length(x) * lambda_zero * mean(x)
 d <- 2 * length(x)
 alternative <- match.arg(alternative)
 p_value <-  pchisq(statistic, d)
 p_value <-  switch(alternative,
 'two.sided' = 2 * min(p_value, 1 - p_value),
 'greater' = p_value,
 'less' = 1 - p_value)
 names(statistic) <- 'T'
 names(d) <- 'num df'
 result <- list(statistic = statistic,
 parameter = d,
 p.value = p_value,
 alternative = alternative,
 method = 'Test chi-kwadrat w modelu wyk<79>adniczym',
 data.name = deparse(substitute(x)))
 class(result) <- 'htest'
 return(result)
 }
 awarie <- read.table("http://ls.home.amu.edu.pl/data_sets/awarie.txt")
 View(awarie)
 1 / mean(awarie$V1)
 w_test(awarie$V1, 0.001, 'less')
 x <- c(171, 176, 179, 189, 176, 182, 173, 179, 184, 186, 189, 167, 177)
 y <- c(161, 162, 163, 162, 166, 164, 168, 165, 168, 157, 161, 172)
 boxplot(x, y)
 shapiro.test(x)$p.value
 qqnorm(x)
 qqline(x)
--- a/zajecia6/README.md
+++ b/zajecia6/README.md
@ -0,0 +1,40 @@
 # Zajęcia 6
 Testowanie hipotez statystycznych.
 ## Test t-Studenta
 Test t Studenta jest metodą statystyczną służącą do porównania dwóch średnich między sobą jeśli znamy liczbę badanych osób, średnią arytmetyczną oraz wartość odchylenia standardowego lub wariancji.
 Jest to jeden z mniej skomplikowanych i bardzo często wykorzystywanych testów statystycznych używanych do weryfikacji hipotez. Dzięki niemu możemy dowiedzieć się czy dwie różne średnie są różne niechcący (w wyniku przypadku) czy są różne istotnie statystycznie (np. z uwagi na naszą manipulację eksperymentalna).
 Są gotowe wzory do których podstawiamy wartości w zalezności od rodzaju próby.
 ## P-wartość
 P-wartość (p-value) to graniczny poziom istotności - najmniejszy, przy którym zaobserwowana wartość statystyki testowej prowadzi do odrzucenia hipotezy zerowej. Im p-wartość jest większa, tym bardziej hipoteza H0 jest prawdziwa. Im mniejsza tym niej prawdopodobna jest hipoteza H0
 Wartość p, p-wartość, prawdopodobieństwo testowe.
 ## Wykres Q-Q
 Ten wykres (kwantyl - kwantyl) słuzy do porównania wartości estymowanej - linia z prawdziwymi zmierzonymi wartościami - kropki.
 W tych ćwiczeniach ta wartość przewidziana to po prostu najlepiej pasująca linia do punktów.
 <br/><br/>
 ![QQ](q-q.png)
 ## Test Shapiro-Wilka
 Hipotezy:
 - H0 : Próba pochodzi z populacji o rozkładzie normalnym
 - H1 : Próba nie pochodzi z populacji o rozkładzie normalnym.
 # Var.test
 Wariancja - Intuicyjnie utożsamiana ze zróżnicowaniem zbiorowości. Wg dokumentacji jest to test pozwalający porównać wariancje z dwóch rozkładów normalnych.
--- a/zajecia6/Zajęcia6.pdf
+++ b/zajecia6/Zajęcia6.pdf
--- a/zajecia6/q-q.png
+++ b/zajecia6/q-q.png
--- a/zajecia6/test_t_dla
+++ b/zajecia6/test_t_dla
--- a/zajecia6/zadania.R
+++ b/zajecia6/zadania.R
@ -0,0 +1,112 @@
 # Zad 1
 x <- c(862, 870, 876, 866, 871, 865, 861, 873, 871, 872)
 shapiro.test(x)$p.value
 qqnorm(x)
 qqline(x)
 mean(x)
 t.test(x, mu = 870, alternative = "less")$p.value
 # Zad 2
 x <- c(78.2, 78.5, 75.6, 78.5, 78.5, 77.4, 76.6)
 y <- c(76.1, 75.2, 75.8, 77.3, 77.3, 77.0, 74.4, 76.2, 73.5, 77.4)
 boxplot(x, y)
 shapiro.test(x)$p.value
 qqnorm(x)
 qqline(x)
 shapiro.test(y)$p.value
 qqnorm(y)
 qqline(y)
 var(x)
 var(y)
 var.test(x, y, alternative = "less")$p.value
 mean(x)
 mean(y)
 t.test(x, y, var.equal = TRUE, alternative = 'greater')$p.value
 #teraz jest mała wartość - 0.01 czyli hipoteza że y jest większe niż x jest malo prawdopodobne
 # gdybym zwiększył w y każdą wartość o 10 to p wartość = 1 czyli y jest większe niż x
 # ZAD 3
 x <- c(84, 87, 87, 90, 90, 90, 90, 93, 93, 96)
 y <- c(89, 92, 98, 95, 95, 92, 95, 92, 98, 101)
 boxplot(x, y)
 shapiro.test(x)$p.value
 qqnorm(x)
 qqline(x)
 shapiro.test(y)$p.value
 qqnorm(y)
 qqline(y)
 mean(x)
 mean(y)
 t.test(x, y, paired = TRUE, alternative = 'less')$p.value
 # Mała p-wartość czyli hipoteza że y jest mniejsze niż x jest mało prawdopodobna
 # ZAD 4
 x <- c(171, 176, 179, 189, 176, 182, 173, 179, 184, 186, 189, 167, 177)
 y <- c(161, 162, 163, 162, 166, 164, 168, 165, 168, 157, 161, 172)
 boxplot(x, y)
 shapiro.test(x)$p.value
 qqnorm(x)
 qqline(x)
 # duża p-wartość czyli hipoteza że wartości pochadzą z rozkładu normalnego jest duża
 shapiro.test(y)$p.value
 qqnorm(y)
 qqline(y)
 var(x)
 var(y)
 var.test(x, y, alternative = "greater")$p.value
 mean(x)
 mean(y)
 t.test(x, y, alternative = 'greater')$p.value
 # Mała p-wartość czyli hipoteza że kobiety są wyższe niż mężczyźni jest bardzo mało prawdopodobna
 # ZAD5
 w_test <- function(x, lambda_zero, alternative = c('two.sided', 'less', 'greater')) {
  statistic <- 2 * length(x) * lambda_zero * mean(x)
  d <- 2 * length(x)
  alternative <- match.arg(alternative)
  p_value <-  pchisq(statistic, d)
  p_value <-  switch(alternative, 
                     'two.sided' = 2 * min(p_value, 1 - p_value), 
                     'greater' = p_value, 
                     'less' = 1 - p_value)
  names(statistic) <- 'T'
  names(d) <- 'num df'
  result <- list(statistic = statistic, 
                 parameter = d, 
                 p.value = p_value, 
                 alternative = alternative, 
                 method = 'Test chi-kwadrat w modelu wyk<79>adniczym', 
                 data.name = deparse(substitute(x)))
  class(result) <- 'htest'
  return(result)
 }
 awarie <- read.table("http://ls.home.amu.edu.pl/data_sets/awarie.txt")
 1 / mean(awarie$V1)
 w_test(awarie$V1, 0.001, 'less')
--- a/zajecia6/zajecia6.Rproj
+++ b/zajecia6/zajecia6.Rproj
@ -0,0 +1,13 @@
 Version: 1.0
 RestoreWorkspace: Default
 SaveWorkspace: Default
 AlwaysSaveHistory: Default
 EnableCodeIndexing: Yes
 UseSpacesForTab: Yes
 NumSpacesForTab: 2
 Encoding: UTF-8
 RnwWeave: Sweave
 LaTeX: pdfLaTeX