140 lines
4.7 KiB
Markdown
140 lines
4.7 KiB
Markdown
# Podsumowanie
|
||
Podsumowanie zajęć
|
||
|
||
---
|
||
## LAB 1
|
||
Zakres:
|
||
- wstęp do języka R
|
||
|
||
- wykład 1 na stronie
|
||
|
||
|
||
|
||
### R
|
||
Lista:
|
||
```r
|
||
# wektory
|
||
rep(TRUE, 3)
|
||
seq(1, 20, by=1)
|
||
order(zad6, decreasing = TRUE)]
|
||
|
||
# pętle
|
||
for(i in 1:length(zad5)){}
|
||
while (licznik <= length(x)){}
|
||
repeat {
|
||
if (licznik > length(x)) {
|
||
break
|
||
}
|
||
}
|
||
|
||
# funkcja, pakiety
|
||
minmax <- function(x){}
|
||
install.packages("schoolmath")
|
||
library(schoolmath)
|
||
```
|
||
|
||
### Zagadnienia
|
||
![operatory](lab1/operatory.png)
|
||
|
||
![logiczne](lab1/logiczne.png)
|
||
|
||
|
||
---
|
||
## LAB 2
|
||
Zagadnienia:
|
||
- ciąg dalszy wprowadzenie do R
|
||
|
||
- wykład 1 na stronie
|
||
|
||
|
||
|
||
### R
|
||
Lista:
|
||
```r
|
||
# ładowanie danych
|
||
dane <- read.table("dane1.csv", header = TRUE, sep = ";")
|
||
ankieta <- read.table("http://ls.home.amu.edu.pl/data_sets/ankieta.txt", header = TRUE)
|
||
computers <- read.csv("http://pp98647.home.amu.edu.pl/wp-content/uploads/2021/06/computers.csv")
|
||
```
|
||
|
||
|
||
### Zagadnienia
|
||
Lista:
|
||
- **Wektor** musi zawierać takie same typy, **lista** może różne.
|
||
|
||
- **Macierze**, ogólniej to są **tablice** reprezentowane przez wektor atomowy
|
||
|
||
- **Czynniki**: dla ("f", "p", "f") zwraca "f", "p"
|
||
|
||
- **Ramki danych** to jak w excelu arkusze
|
||
|
||
|
||
---
|
||
## LAB 3
|
||
Zagadnienia:
|
||
- **Statystka opisowa** - zaprezentowanie cechy X na próbce za pomocą tabeli, wykresu
|
||
|
||
- Wykład 2 na stronie
|
||
|
||
|
||
### R
|
||
```r
|
||
# rozkład empiryczny
|
||
ankieta <- read.table("http://ls.home.amu.edu.pl/data_sets/ankieta.txt", header = TRUE)
|
||
empiryczny <- data.frame(cbind(liczebnosc = table(ankieta$wynik),
|
||
procent = prop.table(table(ankieta$wynik))))
|
||
|
||
# wykres ramkowy
|
||
barplot(table(ankieta$wynik),
|
||
xlab = "Odpowiedzi", ylab = "Odpowiedzi",
|
||
main = "Rozkład empiryczny zmiennej wynik")
|
||
|
||
# inne
|
||
install.packages("e1071")
|
||
library(e1071)
|
||
skewness(x)
|
||
kurtosis(x)
|
||
```
|
||
|
||
|
||
### Zagadnienia
|
||
Lista:
|
||
- **Miara asymetrii rozkładu** - w którą stronę - prawo/lewo, zmienna się rozkłada.
|
||
- zero to symetryczny
|
||
- dodatnie to prawostronnie asymetryczny - lewa część jest większa
|
||
- ujemna to lewostronnie asymetryczna - prawa część jest większa
|
||
![asymetria](lab3/asymetria.png)
|
||
|
||
- **Kurtoza** - miara skupienia wartości wokół średniej. Porównuje rozkład empiryczny z rozkładem normalnym.
|
||
- Większa niż 0, im większa wartość tym bardziej wartości skupione wokół średniej
|
||
- Dla rozkładu normalnego = 0
|
||
- Dla ujemnych (min -2) wykres jest bardziej spłaszczony niż rozkłąd normalny
|
||
![kurtoza](lab3/kurtoza.png)
|
||
|
||
- **Rozkład empiryczny** - za pomocą szeregu rozdzielczego to np podanie liczebności i udziału procentowego danej zmiennej.
|
||
|
||
- **Odchylenie standardowe** - intuicyjnie rzecz ujmując, odchylenie standardowe mówi, jak szeroko wartości jakiejś wielkości (na przykład wieku, inflacji, kursu walutowego) są rozrzucone wokół jej średniej.
|
||
Im mniejsza wartość odchylenia tym obserwacje są bardziej skupione wokół średniej.
|
||
|
||
- **Współczynnik zmienności** - podaje się w procentach, jest to relacja odchylenia standardowego ze średnią. Mówi nam jak bardzo wartości odbiegają od siebie. Dzięki temu ze jest w procentach mozemy porównywać rózne rozkłady.
|
||
- [Przykład](https://pl.wikipedia.org/wiki/Współczynnik_zmienności)
|
||
|
||
- **Funkcja gęstości** - nieujemna funkcja rzeczywista, określona dla rozkładu prawdopodobieństwa, taka że całka z tej funkcji, obliczona w odpowiednich granicach, jest równa prawdopodobieństwu wystąpienia danego zdarzenia losowego.
|
||
|
||
- **Histogram** – składa się z szeregu prostokątów umieszczonych na osi współrzędnych. Prostokąty te są z jednej strony wyznaczone przez przedziały klasowe wartości cechy, natomiast ich wysokość jest określona przez liczebności (lub częstości, ewentualnie gęstość prawdopodobieństwa) elementów wpadających do określonego przedziału klasowego.
|
||
|
||
- **Kwantyl** rzędu p to taka zmienna dla której prawdopodobieństwo wystąpienia od 0 do tej zmiennej jest równe p.
|
||
Kwantyl rzędu 1/2 to inaczej mediana. Kwantyle rzędu 1/4, 2/4, 3/4 są inaczej nazywane kwartylami.
|
||
- pierwszy kwartyl (notacja: Q1) = dolny kwartyl = kwantyl rzędu 1/4 = 25% obserwacji jest położonych poniżej
|
||
- drugi kwartyl (notacja: Q2) = mediana = kwantyl rzędu 1/2 = dzieli zbiór obserwacji na połowę
|
||
- trzeci kwartyl (notacja: Q3) = górny kwartyl = kwantyl rzędu 3/4 = dzieli zbiór obserwacji na dwie części odpowiednio po 75% położonych poniżej tego kwartyla i 25% położonych powyżej
|
||
![kwanty](lab3/kwantyl.png)
|
||
|
||
- **Wykres ramkowy**
|
||
![ramkowy1](lab3/ramkowy1.png)
|
||
![ramkowy2](lab3/ramkowy2.png)
|
||
|
||
- **Rozkład empiryczny** – uzyskany na podstawie badania statystycznego opis wartości przyjmowanych przez cechę statystyczną w próbie przy pomocy częstości ich występowania.
|
||
|
||
- Statystki opisowe:
|
||
![dodatek](lab3/dodatek.png) |