testy POST HOC

Testy POST HOC (po fakcie) wykonuje się jako kolejny krok analizy wariancji. Znane są również pod nazwą porównań wielokrotnych. Sama analiza wariancji mówi nam o tym czy różnice w porównywanych średnich występują czy nie. Nie wiemy jednak między którymi grupami zachodzą te różnice. Istotny współczynnik F wskazuje jedynie na słuszność (lub brak słuszności) odrzucenia hipotezy zerowej. Jeśli ją odrzucimy musimy dowiedzieć się czy wszystkie średnie różnią się między sobą czy tylko niektóre. Stąd też nazwa „po fakcie” – wykonujemy je dopiero po sprawdzeniu czy wynik F jest istotny statystycznie. Jeśli nie jest, nie musimy wykonywać testów POST HOC.

Testów POST HOC mamy całkiem sporo i tylko od nas zależy, który z nich wybierzemy. Należy jednak mieć pełną świadomość słabych i mocnych stron każdego z testów dlatego poniżej pokrótce opiszemy kilka z nich. Po pierwsze jednak chcielibyśmy zapoznać Was z podstawowym ich podziałem. Mianowicie, dzielą się one na dwie duże grupy – testów dla równych wariancji oraz testów dla nierównych wariancji. Te dwie grupy dzielą się z kolei na jeszcze dwie grupy – testów konserwatywnych i testów liberalnych. Warto wyjaśnić w tym miejscu, że pojęcie „testy konserwatywne” rozumiane jest jako testy, w których trudniej jest uzyskać wynik istotny statystycznie, a „testy liberalne” to testy, w których łatwiej jest uzyskać istotne różnice w średnich.

 

RÓWNE WARIANCJE

– TEST NIR – Jest to najstarszy test wielokrotnych porównań, zaproponowany w 1949 przez samego Ronalda Fishera.  Skrót NIR rozwija się jako Najmniejszych Istotnych Różnic. Wszyscy ludzie eksperymentujący z narkotykami z wielką łatwością zapamiętują jego anglojęzyczny skrót LSD (Least Significant Difference). Niestety ryzyko popełnienia błędu polegającego na wskazaniu istotnych różnic w przypadku gdy są one nieistotne jest bardzo duże. Spowodowane jest to tym, że test NIR robi dla nas po prostu szereg testów t Studenta (dla każdej porównywanej pary średnich). Przekłamuje on prawdopodobieństwo nie biorąc poprawki właśnie na wspomnianą ilość porównań. Jeśli w ramach odpowiedzi na jedną hipotezę porównujemy grupę A z B, A z C, B z C a później jeszcze to samo w „drugą stronę” czyli test B z A, C z A i C z B to kumuluje nam się prawdopodobieństwo popełnienia błędu I rodzaju. Dlatego też test ten można wykonywać tylko kiedy wariancje w porównywanych grupach są jednorodne, grupy są równoliczne, a i tak najczęściej używa się go tylko do potwierdzenia wyników innych testów POST HOC.

TEST BONFERRONIEGO – Test ten znany jest głównie pod nazwą „poprawka Bonferroniego”. Wyliczany jest on „tak samo” jak test NIR, ale bierze poprawkę na ilość wykonywanych porównań. Jeśli mamy 3 porównania w przypadku potwierdzania jednej hipotezy to poziom istotności 0,05 dzieli na 3 (=0,0167). Zatem dopiero wynik istotności w przybliżeniu mniejszy od 0,017 będzie uznawany za istotny statystycznie a nie tak jak do tej pory mniejszy od 0,05. Bardzo dobrze spisuje się w przypadku małej liczby porównań. Na wymiarze konserwatywny-liberalny umieścilibyśmy go raczej po stronie konserwatywnych testów.

– TEST SIDAKA – Ten test z kolei jest bardzo podobny do powyższego. W trochę inny sposób dokonuje on jednak korekcji poziomu istotności (alfa). Jeśli naszą granicę ustawiamy na poziomie 0,05 to test SIDAKA ma trochę większą moc niż test Bonferroniego (łatwiej otrzymać istotne różnice jeśli faktycznie takowe występują). Jeśli jednak za poziom istotności przyjmujemy 0,01 to praktycznie nie ma różnicy, który z tych testów wybierzemy.

TEST DUNCANA – Test Duncana klasyfikowany jest w literaturze jako bardziej liberalny od poprawki Bonferroniego.  Oparty jest on na tak zwanym studentyzowanym rozstępie. Przyjade się szczególnie gdy chcemy porównać jedną grupę (np. grupę kontrolną) do kilku innych grup (np. paru grup eksperymentalnych).Warto również wspomnieć, że w jego przypadku im bardziej średnie są od siebie oddalone, tym łatwiej uzyskać wynik istotny statystycznie.

TEST SCHEFFE – Jest to najbardziej konserwatywny test. Jego stosowanie będzie zatem skutkowało najmniejszą ilością istotnych różnic między średnimi. Jeśli ogólny wynik wynik analizy wariancji F będzie nieistotny to na pewno nie będzie żadnej istotnej różnicy między średnimi (co np. często zdarza się w przypadku stosowania testu NIR). Jeśli porównujemy 3 średnie to test Bonferroniego dzieli poziom 0,05 na 3 natomiast test Scheffe dzieli istotność na 6! Zatem wynik różnicy między średnimi mniejszy od 0,0083 będzie pokazany jako istotny statystycznie.

TEST TUKEYA – Jest to test chyba najbardziej polecany do porównywania par średnich. Jest bardziej liberalny od testu Scheffe i jednocześnie bardziej konserwatywny niż test NIR.

TEST GT2 HOCHBERGA – Ten test jest zalecany gdy nasze grupy są nierównoliczne.

 

NIERÓWNE WARIANCJE

TEST GAMESA-HOWELLA – Bierze on poprawkę na nierówne wariancje w porównywanych grupach jak również na różnice w ich liczebnościach. Jest to stosunkowo liberalny test.

– TEST T2 TAMHANE’A – Jest to konserwatywny (na pewno bardziej niż Gamesa-Howella) test oparty na rozkładzie t Studenta. Do wyznaczenia poziomu istotności wykorzystuje taką samą procedurę jak test Sidaka.