Bootstrapowa wersja testu t.
Implementacja powinna obejmować test dla jednej próby, dla dwóch prób niezależnych oraz dla dwóch prób zależnych.
W każdej sytuacji oczekiwanym wejście jest zbiór danych w odpowiednim formacie, a wyjściem p-wartość oraz ostateczna decyzja.
Dodatkowo powinien być rysowany odpowiedni rozkład statystyki testowej.

Zbiór danych - ???
Hipoteza zerowa - ???
Hipoteza alternatywna - ???

Dla każdego z 3 testów inne
https://www.jmp.com/en_ch/statistics-knowledge-portal/t-test.html

In [155]:
# TODO: Poprzestawiać kolejność definicji funkcji?

In [156]:
import numpy as np
import pandas as pd
from math import sqrt
from scipy.stats import sem
from scipy.stats import t
import matplotlib.pyplot as plt
from statistics import mean, stdev
from scipy.stats import ttest_ind, ttest_1samp, ttest_rel

In [157]:
def generate_bootstraps(data, n_bootstraps=100):
 data_size = data.shape[0]
 for _ in range(n_bootstraps):
 indices = np.random.choice(len(data), size=data_size)
 yield data.iloc[indices, :]

In [158]:
def t_stat_single(sample, population_mean):
 """Funkcja oblicza wartość statystyki testowej dla jednej próbki"""
 if sample.empty:
 raise Exception("Empty sample")
 sample = sample[0].values.tolist()
 sample_size = len(sample)
 return (mean(sample) - population_mean) / (stdev(sample) / sqrt(sample_size))

In [159]:
def t_stat_ind(sample_1, sample_2):
 """Funkcja oblicza wartość statystyki testowej dla dwóch próbek niezależnych"""
 if sample_1.empty or sample_2.empty:
 raise Exception("Empty sample")
 sample_1 = sample_1[0].values.tolist()
 sample_2 = sample_2[0].values.tolist()
 sed = sqrt(sem(sample_1)**2 + sem(sample_2)**2)
 return (mean(sample_1) - mean(sample_2)) / sed

In [160]:
def t_stat_dep(sample_1, sample_2, mu=0):
 """Funkcja oblicza wartość statystyki testowej dla dwóch próbek zależnych"""
 if sample_1.empty or sample_2.empty:
 raise Exception("Empty sample")
 sample_1 = sample_1[0].values.tolist()
 sample_2 = sample_2[0].values.tolist()
 differences = [x_1 - x_2 for x_1, x_2 in zip(sample_1, sample_2)]
 sample_size = len(sample_1)
 return (mean(differences) - mu) / (stdev(differences) / sqrt(sample_size))

In [161]:
def df_dep(sample_1, sample_2):
 """Funkcja oblicza stopnie swobody dla dwóch próbek zależnych"""
 l1, l2 = len(sample_1), len(sample_2)
 if l1 != l2:
 raise Exception("Samples aren't of equal length")
 return l1

In [162]:
def df_ind(sample_1, sample_2):
 """Funkcja oblicza stopnie swobody dla dwóch próbek niezależnych"""
 return len(sample_1) + len(sample_2) - 2

In [163]:
def df_single(sample_1):
 """Funkcja oblicza stopnie swobody dla jednej próbki"""
 # TODO: I have no clue what to return from here
 return len(sample_1)

In [164]:
def calculate_p(t_stat, df):
 """Funkcja oblicza wartość *p* na podstawie statystyki testowej i stopni swobody"""
 return (1.0 - t.cdf(abs(t_stat), df)) * 2.0

In [165]:
def calculate_cv(df, alpha=0.05):
 """Funkcja oblicza wartość krytyczną (critical value)"""
 return t.ppf(1.0 - alpha, df)

In [166]:
def bootstrap_one_sample(sample, population_mean):
 return t_test(
 sample_1=sample,
 df_fn=df_single,
 t_stat_fn=t_stat_single,
 population_mean=population_mean
 )

In [167]:
def bootstrap_independent(sample_1, sample_2):
 return t_test(
 sample_1=sample_1,
 sample_2=sample_2,
 df_fn=df_ind,
 t_stat_fn=t_stat_ind
 )

In [168]:
def bootstrap_dependent(sample_1, sample_2):
 return t_test(
 sample_1=sample_1,
 sample_2=sample_2,
 df_fn=df_dep,
 t_stat_fn=t_stat_dep
 )

In [169]:
def get_t_stats(sample_1, sample_2=None, t_stat_fn=t_stat_single, population_mean=None):
 """Funkcja oblicza listę statystyk testowych dla każdej próbki bootstrapowej wybranej na podstawie danych sample_1 i sample_2"""
 t_stat_list = []

 # One sample test
 if t_stat_fn==t_stat_single:
 if not population_mean:
 raise Exception("population_mean not provided")
 for bootstrap in generate_bootstraps(sample_1):
 stat = t_stat_fn(bootstrap, population_mean)
 t_stat_list.append(stat)
 return t_stat_list

 # Two sample test
 for bootstrap_1, bootstrap_2 in zip(generate_bootstraps(sample_1), generate_bootstraps(sample_2)):
 stat = t_stat_fn(bootstrap_1, bootstrap_2)
 t_stat_list.append(stat)
 return t_stat_list

In [170]:
def t_test(sample_1, sample_2=None, df_fn=df_single, t_stat_fn=t_stat_single, population_mean=None, alpha=0.05):
 """
 Funkcja przeprowadza test T-studenta dla dwóch zmiennych.
 liczba kolumn wynosi 1, test jest przeprowadzany dla jednej zmiennej.
 @param df_fn - funkcja obliczająca stopnie swobody
 @param t_stat_fn - funkcja obliczająca statystykę T
 """
 t_stat_list = get_t_stats(sample_1, sample_2, t_stat_fn, population_mean=population_mean)
 t_stat_sum = sum(t_stat_list)

 data_size = sample_1.shape[0]

 t_stat = t_stat_sum / data_size
 # TODO: dolna i górna opcja dają inne wyniki z jakiegoś powodu (???)
 t_stat = mean(t_stat_list)

 if sample_2 is None:
 df = df_fn(sample_1)
 else:
 df = df_fn(sample_1, sample_2)
 cv = calculate_cv(df, alpha)
 p = calculate_p(t_stat, df)
 return t_stat, df, cv, p, t_stat_list

In [171]:
def draw_distribution(stats):
 """
 Funkcja rysuje rozkład statystyki testowej
 @param stats: lista statystyk testowych
 """
 plt.hist(stats)
 plt.xlabel('Test statistic value')
 plt.ylabel('Frequency')
 plt.show()

In [172]:
# Testy dla samych statystyk testowych
def pretty_print_stats(t_stat_selfmade, t_stat_lib, suffix):
 print(f'Statystyka testowa dla {suffix}:')
 print(t_stat_selfmade, '- z naszej funkcji')
 print(t_stat_lib, '- z gotowej biblioteki')
 print()
 
dummy = pd.DataFrame([1, 2, 3, 4, 5])
dummy2 = pd.DataFrame([4, 5, 6, 7, 8])
dummy3 = pd.DataFrame([1, 3 , 3, 4, 6])

t_stat_selfmade = t_stat_single(dummy, 2)
t_stat_lib, _ = ttest_1samp(dummy, 2)
pretty_print_stats(t_stat_selfmade, t_stat_lib, 'jednej próby')

t_stat_selfmade = t_stat_ind(dummy, dummy2)
t_stat_lib, _ = ttest_ind(dummy, dummy2)
pretty_print_stats(t_stat_selfmade, t_stat_lib, 'dwóch prób niezależnych')

t_stat_selfmade = t_stat_dep(dummy, dummy3)
t_stat_lib, _ = ttest_rel(dummy, dummy3)
pretty_print_stats(t_stat_selfmade, t_stat_lib, 'dwóch prób zależnych')

Statystyka testowa dla jednej próby:
1.414213562373095 - z naszej funkcji
[1.41421356] - z gotowej biblioteki

Statystyka testowa dla dwóch prób niezależnych:
-3.0 - z naszej funkcji
[-3.] - z gotowej biblioteki

Statystyka testowa dla dwóch prób zależnych:
-1.6329931618554525 - z naszej funkcji
[-1.63299316] - z gotowej biblioteki



In [173]:
# Testy z bootstrappowaniem

def pretty_print_full_stats(t_stat, df, cv, p):
 print(f't: {t_stat}, df: {df}, cv: {cv}, p: {p}\n')

print('Statystyki dla jednej próby:')
t_stat, df, cv, p, _ = bootstrap_one_sample(dummy, 2)
pretty_print_full_stats(t_stat, df, cv, p)

print('Statystyki dla dwóch prób zależnych:')
t_stat, df, cv, p, _ = bootstrap_dependent(dummy2, dummy3)
pretty_print_full_stats(t_stat, df, cv, p)

print('Statystyki dla dwóch prób niezależnych:')
t_stat, df, cv, p, _ = bootstrap_independent(dummy2, dummy3)
pretty_print_full_stats(t_stat, df, cv, p)

Statystyki dla jednej próby:
t: 1.8524997668616348, df: 5, cv: 2.015048372669157, p: 0.12315232406912302

Statystyki dla dwóch prób zależnych:
t: 3.166992562129946, df: 5, cv: 2.015048372669157, p: 0.02489883191814224

Statystyki dla dwóch prób niezależnych:
t: 3.0429202631473986, df: 8, cv: 1.8595480375228421, p: 0.015992147409949586



In [174]:
dataset = pd.read_csv('experiment_data.csv')
#make_decision(dataset, ['Weight', 'Age'])