Merge pull request 'shapiro_wilk' (#4) from shapiro_wilk into main

Reviewed-on: #4
This commit is contained in:
Marcin Kostrzewski 2022-05-17 21:39:14 +02:00
commit 75e15abde2
2 changed files with 544 additions and 517 deletions

View File

@ -46,7 +46,7 @@
}, },
{ {
"cell_type": "code", "cell_type": "code",
"execution_count": 49, "execution_count": 86,
"metadata": {}, "metadata": {},
"outputs": [], "outputs": [],
"source": [ "source": [
@ -147,30 +147,55 @@
}, },
{ {
"cell_type": "code", "cell_type": "code",
"execution_count": 69, "execution_count": 87,
"metadata": {}, "metadata": {},
"outputs": [ "outputs": [
{ {
"name": "stdout", "name": "stdout",
"output_type": "stream", "output_type": "stream",
"text": [ "text": [
"0.9606528878211975\n", "Female height: Dane mają rozkład normalny.\n",
"2.666284970587185e-10\n", "Male height: Dane mają rozkład normalny.\n",
"Dane nie mają rozkładu normalnego.\n" "Weight before: Dane mają rozkład normalny.\n",
"Weight after: Dane mają rozkład normalny.\n"
] ]
} }
], ],
"source": [ "source": [
"# TODO: Test Shapiro Wilka sprawdzający czy nasze dane mają rozkład normalny\n", "ALPHA = 0.05\n",
"x = dataset['Height'].to_numpy()\n", "female_heights = dataset['Female height'].to_numpy()\n",
"shapiro_test = stats.shapiro(x)\n", "shapiro_test = stats.shapiro(female_heights)\n",
"print(shapiro_test.statistic)\n",
"print(shapiro_test.pvalue)\n",
"\n", "\n",
"if shapiro_test.pvalue > shapiro_test.statistic:\n", "if shapiro_test.pvalue > ALPHA:\n",
" print(\"Dane mają rozkład normalny.\")\n", " print(\"Female height: Dane mają rozkład normalny.\")\n",
"else:\n", "else:\n",
" print(\"Dane nie mają rozkładu normalnego.\")" " print(\"Female height: Dane nie mają rozkładu normalnego.\")\n",
"\n",
"male_heights = dataset['Male height'].to_numpy()\n",
"shapiro_test = stats.shapiro(male_heights)\n",
"\n",
"if shapiro_test.pvalue > ALPHA:\n",
" print(\"Male height: Dane mają rozkład normalny.\")\n",
"else:\n",
" print(\"Male height: Dane nie mają rozkładu normalnego.\")\n",
"\n",
"weights_before = dataset['Weight before'].to_numpy()\n",
"shapiro_test = stats.shapiro(weights_before)\n",
"\n",
"if shapiro_test.pvalue > ALPHA:\n",
" print(\"Weight before: Dane mają rozkład normalny.\")\n",
"else:\n",
" print(\"Weight before: Dane nie mają rozkładu normalnego.\")\n",
"\n",
"weights_after = dataset['Weight after'].to_numpy()\n",
"shapiro_test = stats.shapiro(weights_after)\n",
"\n",
"if shapiro_test.pvalue > ALPHA:\n",
" print(\"Weight after: Dane mają rozkład normalny.\")\n",
"else:\n",
" print(\"Weight after: Dane nie mają rozkładu normalnego.\")\n",
"\n",
"\n"
] ]
}, },
{ {
@ -369,10 +394,12 @@
] ]
}, },
{ {
"cell_type": "markdown", "cell_type": "code",
"execution_count": null,
"metadata": {}, "metadata": {},
"outputs": [],
"source": [ "source": [
"# TODO: Wyciągnąć wysokości kobiet i mężczyzn oraz poprawić kod aby można było podawać kolumny\n", "#TODO: Wyciągnąć wysokości kobiet i mężczyzn oraz poprawić kod aby można było podawać kolumny\n",
"t_stat, df, cv, p, _ = bootstrap_independent(dataset, dataset)\n", "t_stat, df, cv, p, _ = bootstrap_independent(dataset, dataset)\n",
"pretty_print_full_stats(t_stat, df, cv, p)" "pretty_print_full_stats(t_stat, df, cv, p)"
] ]
@ -626,4 +653,4 @@
}, },
"nbformat": 4, "nbformat": 4,
"nbformat_minor": 2 "nbformat_minor": 2
} }

File diff suppressed because it is too large Load Diff