{ "cells": [ { "cell_type": "markdown", "id": "4814259a-4af7-4839-a1dd-7f0e02837c3f", "metadata": {}, "source": [ "# Regresja liniowa" ] }, { "cell_type": "markdown", "id": "62ab7b17-f761-4723-8992-9620630fdaa6", "metadata": {}, "source": [ "Na dzisiejszych zajęciach omówimy problem predykcji informacji i jego rozwiązanie poprzez wykorzystanie regresji liniowej." ] }, { "cell_type": "markdown", "id": "b01eb137-5b7d-4f09-abac-0410366df4a9", "metadata": {}, "source": [ "Zadaniem regresji liniowej jest po prostu dopasowanie prostej linii do danych. Warto podkreślić, że regresja liniowa przyjmuje założenie, że związek między cechami a zmienną objaśnianą jest mniej więcej liniowy. Regresja liniowa nie jest jedynym rodzajem regresji aczkolwiek jest to najprostsza wersja." ] }, { "cell_type": "markdown", "id": "5dd39b3d-1a4b-44e5-9300-5ad796f7bb4c", "metadata": {}, "source": [ "Regresja może nam pomóc w predykcji (przewidzeniu) wartości jakiejś zmiennej objaśnianej (zależnej) na podstawie jakiś cech (zmiennych niezależnych)." ] }, { "cell_type": "markdown", "id": "3e618a4a-4088-4c3c-8f98-64c8a3ae0b57", "metadata": {}, "source": [ "## Rozgrzewka" ] }, { "cell_type": "markdown", "id": "c4a323d0-e71f-48a9-bda0-17ca379b71da", "metadata": {}, "source": [ "Przeanalizuj poniższy wykres:" ] }, { "cell_type": "markdown", "id": "1c26ec9b-3e87-4cbc-810a-78d61936f28d", "metadata": {}, "source": [ "![](reglin.png)" ] }, { "cell_type": "markdown", "id": "f38c977c-490c-49d8-8853-8c24c8d7cc43", "metadata": {}, "source": [ "1. Dlaczego możemy zastosować regresję liniową do przewidywania informacji o danych?\n", "\n", "2. Co musimy znaleźć, aby móc dokonywać predykcji informacji? Co musimy mieć na uwadze, aby to znaleźć?" ] }, { "cell_type": "markdown", "id": "8f70342d-6503-4810-ba02-e0f4a6208bfc", "metadata": {}, "source": [ "## Przykład" ] }, { "cell_type": "markdown", "id": "ebe61c55-c441-433d-8ba9-ec657ff5cc51", "metadata": {}, "source": [ "Załóżmy, że mamy uczniów, którzy pracują w kursie e-learningowym i ciekawi nas, czy zakończą pracę w tym kursie z sukcesem, tzn. zdobędą jak najlepszy wynik w końcowym teście zaliczeniowym. Aktualne informacje, które posiadamy, to czas spędzony w tym kursie, liczba rozwiązanych ćwiczeń, liczba elementów, których uczeń jeszcze nie odwiedził. Wiemy też, kiedy uczeń zaczął się uczyć i ile razy wchodził do kursu. Każdy uczeń ma też świadomość, że mają określony termin, do kiedy muszą podejść do końcowego testu zaliczeniowego." ] }, { "cell_type": "markdown", "id": "e29d4510-b276-4697-bc68-2b9f497bbc9e", "metadata": {}, "source": [ "Powiedzmy, że na początek przyjrzymy się jednej z informacji - liczbie rozwiązanych ćwiczeń. Załóżmy, że w kursie jest 20 ćwiczeń do rozwiązania a wynik w końcowym teście zaliczeniowym badamy w procentach. Rok temu mieliśmy innych uczniów, którzy też pracowali z tym kursem e-learningowym i mamy informację o ich wynikach:" ] }, { "cell_type": "code", "execution_count": null, "id": "de0afb23-6f48-439b-9377-480a0c82fe65", "metadata": {}, "outputs": [], "source": [] } ], "metadata": { "kernelspec": { "display_name": "Python 3 (ipykernel)", "language": "python", "name": "python3" }, "language_info": { "codemirror_mode": { "name": "ipython", "version": 3 }, "file_extension": ".py", "mimetype": "text/x-python", "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", "version": "3.9.2" } }, "nbformat": 4, "nbformat_minor": 5 }