{ "cells": [ { "cell_type": "markdown", "metadata": {}, "source": [ "Kkolejna część zajęć będzie wprowadzeniem do szeroko używanej biblioteki w Pythonie: `sklearn`. Zajęcia będą miały charaktere case-study poprzeplatane zadaniami do wykonania. Zacznijmy od załadowania odpowiednich bibliotek." ] }, { "cell_type": "code", "execution_count": 1, "metadata": { "scrolled": true }, "outputs": [], "source": [ "# ! pip install matplotlib" ] }, { "cell_type": "code", "execution_count": 2, "metadata": {}, "outputs": [], "source": [ "import numpy as np\n", "import pandas as pd\n", "import matplotlib.pyplot as plt\n", "\n", "%matplotlib inline" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Zacznijmy od załadowania danych. Na dzisiejszych zajęciach będziemy korzystać z danych z portalu [gapminder.org](https://www.gapminder.org/data/)." ] }, { "cell_type": "code", "execution_count": 3, "metadata": {}, "outputs": [], "source": [ "df = pd.read_csv('gapminder.csv', index_col=0)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Dane zawierają różne informacje z większość państw świata (z roku 2008). Poniżej znajduje się opis kolumn:\n", " * female_BMI - średnie BMI u kobiet\n", " * male_BMI - średnie BMI u mężczyzn\n", " * gdp - PKB na obywatela\n", " * population - wielkość populacji\n", " * under5mortality - wskaźnik śmiertelności dzieni pon. 5 roku życia (na 1000 urodzonych dzieci)\n", " * life_expectancy - średnia długość życia\n", " * fertility - wskaźnik dzietności" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**zad. 1**\n", "Na podstawie danych zawartych w `df` odpowiedz na następujące pytania:\n", " * Jaki był współczynniki dzietności w Polsce w 2018?\n", " * W którym kraju ludzie żyją najdłużej?\n", " * Z ilu krajów zostały zebrane dane?" ] }, { "cell_type": "code", "execution_count": 4, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "1.33" ] }, "execution_count": 4, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df.loc['Poland', 'fertility']" ] }, { "cell_type": "code", "execution_count": 5, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", " | female_BMI | \n", "male_BMI | \n", "gdp | \n", "population | \n", "under5mortality | \n", "life_expectancy | \n", "fertility | \n", "
---|---|---|---|---|---|---|---|
Country | \n", "\n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " |
Japan | \n", "21.87088 | \n", "23.50004 | \n", "34800.0 | \n", "127317900.0 | \n", "3.4 | \n", "82.5 | \n", "1.34 | \n", "