{ "cells": [ { "cell_type": "code", "execution_count": 1, "metadata": {}, "outputs": [], "source": [ "import pandas as pd\n", "from sklearn.model_selection import train_test_split\n", "from sklearn.metrics import mean_squared_error\n", "import matplotlib.pyplot as plt\n", "import numpy as np" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Cel: rozpoznanie średniej oceny użytkowników dla danego filmu na bazie:\n", "- roku wydania\n", "- gatunku\n", "- czasu trwania filmu\n", "- ilości głosów\n", "- oceny krytyków (metascore)\n", "- przychodu" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "# 0. Preprocessing" ] }, { "cell_type": "code", "execution_count": 2, "metadata": { "scrolled": true }, "outputs": [ { "data": { "text/html": [ "
\n", " | year | \n", "duration | \n", "avg_vote | \n", "votes | \n", "worlwide_gross_income | \n", "metascore | \n", "Action | \n", "Adventure | \n", "Animation | \n", "Biography | \n", "... | \n", "Horror | \n", "Music | \n", "Musical | \n", "Mystery | \n", "Romance | \n", "Sci-Fi | \n", "Sport | \n", "Thriller | \n", "War | \n", "Western | \n", "
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
506 | \n", "1927 | \n", "153 | \n", "8.3 | \n", "156076 | \n", "1349711.0 | \n", "98.0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "... | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "
628 | \n", "1928 | \n", "72 | \n", "8.1 | \n", "27414 | \n", "26916.0 | \n", "90.0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "... | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "
856 | \n", "1930 | \n", "104 | \n", "7.7 | \n", "13311 | \n", "4410.0 | \n", "88.0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "... | \n", "0 | \n", "1 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "
1048 | \n", "1931 | \n", "87 | \n", "8.5 | \n", "162668 | \n", "46008.0 | \n", "99.0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "... | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "
1086 | \n", "1931 | \n", "70 | \n", "7.8 | \n", "63315 | \n", "1626.0 | \n", "91.0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "... | \n", "1 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "
5 rows × 27 columns
\n", "\n", " | Nazwa | \n", "Mean squared error (train) | \n", "Mean squared error (test) | \n", "
---|---|---|---|
0 | \n", "Regresja liniowa | \n", "0.003602 | \n", "0.003376 | \n", "
1 | \n", "Regresja wielomianowa (stopień 3) | \n", "0.002472 | \n", "0.086475 | \n", "
2 | \n", "Regresja wielomianowa z funkcją skokową Heavis... | \n", "0.002472 | \n", "0.007655 | \n", "
3 | \n", "Regresja wielomianowa z regularyzjacją (stopie... | \n", "0.003318 | \n", "0.003350 | \n", "
4 | \n", "Sieć neuronowa | \n", "0.003625 | \n", "0.003486 | \n", "