Merge pull request 'shapiro_wilk' (#4) from shapiro_wilk into main

Reviewed-on: #4
This commit is contained in:
Marcin Kostrzewski 2022-05-17 21:39:14 +02:00
commit 75e15abde2
2 changed files with 544 additions and 517 deletions

View File

@ -46,7 +46,7 @@
},
{
"cell_type": "code",
"execution_count": 49,
"execution_count": 86,
"metadata": {},
"outputs": [],
"source": [
@ -147,30 +147,55 @@
},
{
"cell_type": "code",
"execution_count": 69,
"execution_count": 87,
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"0.9606528878211975\n",
"2.666284970587185e-10\n",
"Dane nie mają rozkładu normalnego.\n"
"Female height: Dane mają rozkład normalny.\n",
"Male height: Dane mają rozkład normalny.\n",
"Weight before: Dane mają rozkład normalny.\n",
"Weight after: Dane mają rozkład normalny.\n"
]
}
],
"source": [
"# TODO: Test Shapiro Wilka sprawdzający czy nasze dane mają rozkład normalny\n",
"x = dataset['Height'].to_numpy()\n",
"shapiro_test = stats.shapiro(x)\n",
"print(shapiro_test.statistic)\n",
"print(shapiro_test.pvalue)\n",
"ALPHA = 0.05\n",
"female_heights = dataset['Female height'].to_numpy()\n",
"shapiro_test = stats.shapiro(female_heights)\n",
"\n",
"if shapiro_test.pvalue > shapiro_test.statistic:\n",
" print(\"Dane mają rozkład normalny.\")\n",
"if shapiro_test.pvalue > ALPHA:\n",
" print(\"Female height: Dane mają rozkład normalny.\")\n",
"else:\n",
" print(\"Dane nie mają rozkładu normalnego.\")"
" print(\"Female height: Dane nie mają rozkładu normalnego.\")\n",
"\n",
"male_heights = dataset['Male height'].to_numpy()\n",
"shapiro_test = stats.shapiro(male_heights)\n",
"\n",
"if shapiro_test.pvalue > ALPHA:\n",
" print(\"Male height: Dane mają rozkład normalny.\")\n",
"else:\n",
" print(\"Male height: Dane nie mają rozkładu normalnego.\")\n",
"\n",
"weights_before = dataset['Weight before'].to_numpy()\n",
"shapiro_test = stats.shapiro(weights_before)\n",
"\n",
"if shapiro_test.pvalue > ALPHA:\n",
" print(\"Weight before: Dane mają rozkład normalny.\")\n",
"else:\n",
" print(\"Weight before: Dane nie mają rozkładu normalnego.\")\n",
"\n",
"weights_after = dataset['Weight after'].to_numpy()\n",
"shapiro_test = stats.shapiro(weights_after)\n",
"\n",
"if shapiro_test.pvalue > ALPHA:\n",
" print(\"Weight after: Dane mają rozkład normalny.\")\n",
"else:\n",
" print(\"Weight after: Dane nie mają rozkładu normalnego.\")\n",
"\n",
"\n"
]
},
{
@ -369,10 +394,12 @@
]
},
{
"cell_type": "markdown",
"cell_type": "code",
"execution_count": null,
"metadata": {},
"outputs": [],
"source": [
"# TODO: Wyciągnąć wysokości kobiet i mężczyzn oraz poprawić kod aby można było podawać kolumny\n",
"#TODO: Wyciągnąć wysokości kobiet i mężczyzn oraz poprawić kod aby można było podawać kolumny\n",
"t_stat, df, cv, p, _ = bootstrap_independent(dataset, dataset)\n",
"pretty_print_full_stats(t_stat, df, cv, p)"
]

File diff suppressed because it is too large Load Diff