init commit

This commit is contained in:
Cezary Pukownik 2020-04-11 14:19:04 +02:00
commit a011846a02

150
Kurs_R.R Normal file
View File

@ -0,0 +1,150 @@
library(tidyverse)
# 2.3.1
# Zadanie 1
airquality %>%
select(Ozone, Solar.R, Wind, Temp) %>%
filter(Ozone>80)
# Zadanie 2
install.packages('weathermetrics')
library(weathermetrics)
airquality %>%
mutate(TempC=fahrenheit.to.celsius(Temp))
# 2.4.1
# Zadanie 1
as_tibble(airquality)
# Zadanie 2
tibble(litery=letters[6:11],
miesiace=month.name[1:6])
# 3.2.4
# Zadanie 1
ggplot(data=mpg)
# Co widzisz?
# Szare. puste pole
# Zadanie 2
as_tibble(mtcars)
# liczba wierszy: 32
# Zadanie 3
?mpg
# drv
# f = front-wheel drive, r = rear wheel drive, 4 = 4wd
# Zadanie 4
ggplot(aes(x=hwy, y=cyl), data=as_tibble(mpg)) + geom_point()
# Zadanie 5
ggplot(aes(x=class, y=drv), data=as_tibble(mpg)) + geom_point()
# Dlaczego wykres jest bezuzyteczny?
# Wykres nie pokazuje żadnych liczbowych informacji na temat danych
# Zostały wykorzystane dwie cechy typu categorical
# Jedyną informacją jest to, czy dana kombinacja drv i class istanieje.
# 3.3.1
# Zadanie 1
# ustalenie parametru color wewnątrz funckcji aes
# powinno być nazwą kolumny z categoriami, po których
# punkty zostaną pogrupowane, a nie istanieje kolumna "blue"
# w zbriorze danych
# parametr color powinien zostać ustalony wewnątrz
# funkcji geom_point. Poprawiony kod poniżej.
ggplot(data = mpg) +
geom_point(mapping = aes(x = displ, y = hwy), color = "blue")
# Zadanie 2
mpg
# kolumny z danymi kategorialnymi to:
# manufacturer, model, trans, frv, fl, class
# można zwrócić uwagę na typ danych w kolumnie
# jeśli typ to <chr>, to najprawdopodobniej jest to dana kategorialna
# Zadanie 3
ggplot(data = mpg) +
geom_point(mapping = aes(x=displ, y=hwy, color=displ, size=displ))
# zmienna ciągła jest interpolowania między dwoma kolorami tworząc gradient
# tak jak samo z rozmiarem, rozmiar jest skalowany
# w przypadku shape powoduje to błąd. Gdyby podać dane kategorialne
# podział byłby dyskretny, na różne kolory, wielkości, kształty
# Zadanie 4
# Przykład w punkcie wyżej
# Ta sama zmienna bedzie przedstawiona różnymi metodami
# Zadanie 5
# stroke wpływa na grubuść konturu, obrysu, mozna sposować z punktami i liniami
?geom_point
# Zadanie 6
ggplot(data = mpg) +
geom_point(mapping = aes(x=displ, y=hwy, color=displ < 5))
mpg %>%
filter(displ < 5) %>%
mutate(is_less_than_5=displ < 5)
# Przypisanie displ < 5 podzieliło data set na dwie grupy
# TRUE oraz FALSE, w zalezności od tego czy warunek był spełniony
# czy nie.
# 3.5.1
# Zadanie 1
ggplot(data = mpg) +
geom_point(mapping = aes(x = displ, y = hwy)) +
facet_grid(drv ~ displ)
# ggplot potraktuje ją jako zmienną kategorialną,
# tworząc siatkę dla kazdej unikatowej wartości zmiennej ciagłęj
# Zadanie 2
ggplot(data = mpg) +
geom_point(mapping = aes(x = drv, y = cyl))
ggplot(data = mpg) +
geom_point(mapping = aes(x = drv, y = cyl)) +
facet_grid(cyl~drv)
# puste komórki oznacznaczają brak danych
# Zadanie 3
ggplot(data = mpg) +
geom_point(mapping = aes(x = displ, y = hwy)) +
facet_grid(drv ~ .)
ggplot(data = mpg) +
geom_point(mapping = aes(x = displ, y = hwy)) +
facet_grid(. ~ cyl)
# kropka traktowana jest jako puste pole,
# wtedy jedna z osi, nie bedzie kategoryzowana
# Zadanie 4
ggplot(data = mpg) +
geom_point(mapping = aes(x = displ, y = hwy)) +
facet_wrap(~ class, nrow = 2)