fbpx

Słownik

START | EDUKACJA | SŁOWNIK | Homoskedastyczność

Homoskedastyczność

Homoskedastyczność (ang. Homoscedasticity) – sytuacja, w której wariancje błędów losowych (czyli reszt) są stałe wzdłuż wartości przewidywanych przez model, innymi słowy – rozrzut wartości reszt wokół linii regresji jest stały na wszystkich poziomach niezależnej zmiennej.

Występowanie homoskedastyczności jest podstawowym założeniem, które powinno być spełnione podczas wykonywania analizy regresji oraz analizy wariancji. Jeśli jest ono złamane, mamy do czynienia z tzw. heteroskedastycznością. Heteroskedastyczność może prowadzić do błędnych wniosków na temat istotności i nieobciążonych estymatorów, dlatego jej wykrycie i ewentualna korekta są ważne w analizie regresji.

Różnicę pomiędzy homoskedastycznością i heteroskedastycznością zobrazowano na rysunku 1.

Rysunek 1

Przykład spełnienia (rysunek po lewej) i niespełnienia (rysunek po prawej) założenia o homoskedastyczności

Jeśli założenie o homoskedastyczności jest spełnione (grafika po lewej na rysunku 1), oznacza to, że model regresji lub model ANOVA jest stabilny i niezawodny, co pozwala na poprawne oszacowanie parametrów modelu i interpretację wyników. Jednak jeśli to założenie nie jest spełnione (grafika po prawej), może to prowadzić do błędnych wniosków, złych prognoz i zniekształconych wyników statystycznych, chociażby w dopasowaniu modelu do danych reprezentowanych współczynnikiem R2.

Jak ocenić homoskedastyczność?

Istnieją testy statystyczne do oceny homoskedastyczności, jak test White’a, test Goldfelda-Quandta lub test Breuscha-Pagana, jednak nie są one ogólnodostępne w większości programów z graficznym interfejsem. Można je znaleźć w innych programach, takich jak R. Istnieje jednak nieco prostszy sposób oceny homoskedastyczności, który polega na graficznej ocenie wykresu rozrzutu. Oto w jaki sposób wykonać tę analizę w programie SPSS:

  • Zapisz wartości reszt w modelu regresji – niemal każda analiza posiada zakładkę „zapisz”, znajdują się tam różne wartości jakie zawsze są obliczane w ramach danej analizy i możliwe do zapisania w celu ich oceny. Tutaj interesuje nas opcja „reszty niestandaryzowane”. Po obliczeniu modelu, powstanie nam nowa zmienna, zwykle o nazwie „RES_[numer]”.
  • Tworzenie wykresu – następnie należy wejść w kreator wykresu i wybrać wykres rozrzutu, zmienną na osi X jest zawsze zmienna niezależna (predyktor), natomiast zmienną Y są zawsze nasze reszty, które zwykle mają nazwę z przedrostkiem RES. Warto także zaznaczyć opcję „linia dopasowania ogółem”, aby utworzona została linia regresji na wykresie.
  • Ocena wizualna – indywidualnie oceniamy, czy rozproszenie danych wokół linii regresji przypomina raczej grafikę po lewej lub prawej (rysunek 1). Na tej podstawie możemy stwierdzić, czy występuje homo- lub heteroskedastyczność w naszej zmiennej.

W przypadku i wystąpienia heteroscedastyczności (brak spełnienia założenia o homoskedastyczności), można rozważyć przeprowadzenie analizy regresji nieliniowej, która będzie wykazywała lepsze dopasowanie do uzyskanego rozkładu reszt. Można także podjąć próbę transformacji zmiennej zależnej, poprzez jej logarytmowanie. Wybór odpowiedniej strategii zależy od charakterystyki danych i konkretnej analizy. W przypadku bardziej skomplikowanych przypadków, konsultacja z ekspertem ds. analizy danych lub statystykiem może być pomocna.

COFNIJ

wróć do spisu wszystkich pojęć

Podziel się wiedzą

z innymi

Opinie Klientów

Co o nas sądzą?

Współpracowaliśmy

między innymi z:

Nasi partnerzy