fbpx

Słownik

START | EDUKACJA | SŁOWNIK | Współliniowość

Współliniowość

Współliniowość – inaczej nazywana też koliearnością – pojęcie określające siłę związku między predyktorami w modelu analizy regresji liniowej.

Założeniem regresji liniowej jest brak występowania współliniowości predyktorów, ponieważ silne ich skorelowanie może prowadzić do trudności w rozróżnieniu tego, który z nich ma istotne znaczenie dla wyjaśniania zmiennej zależnej. Współliniowość najczęściej szacowana jest przez dwa parametry: wskaźnik tolerancji i współczynnik VIF.

Przykładowo, załóżmy, że chcemy przewidywać nasilenie odczuwanego stresu na podstawie wieku oraz stażu pracy. Okazało się, że istotnym statystycznie predyktorem jest wiek, ale już staż pracy nie. Czy to oznacza, że rzeczywiście tylko wiek ma znaczenie? Otóż niekoniecznie. Może okazać się, że wiek jest silnie skorelowany ze stażem pracy (występuje zatem współliniowość), przez co w analizie regresji istotny okazał się tylko jeden z tych predyktorów. Jest tak dlatego, że ocena istotności predyktora w analizie regresji jest oparta o korelację semicząstkową między predyktorem a zmienną zależną, a występowanie silnej korelacji (współliniowości) predyktorów, powoduje umniejszenie siły związku danego predyktora ze zmienną objaśnianą.

Na rysunku 1 zaprezentowano wizualny przykład współliniowości.

 

Rysunek 1

Wizualizacja założenia o braku wspóliniowości predyktorów

Adnotacja. ZZ – zmienna zależna (objaśniana); ZN – zmienna niezależna (predyktor).

 

Jak sobie radzić ze wspóliniowością?

  • Optymalny dobór predyktorów – staraj się dobierać do modelu predyktory, które są od siebie względnie niezależne, a jednocześnie istotnie korelują ze zmienną objaśnianą. Można to sprawdzić poprzez wykonanie macierzy korelacji Pearsona.
  • Redukcja liczby predyktorów – rozważ usunięcie mniej ważnych z punktu widzenia teoretycznego predyktorów lub tych, które słabiej korelują ze zmienną objaśnianą.

Usuwanie zmiennych powinno być ostatecznością, zarezerwowaną dla sytuacji w której pewni jesteśmy, że współliniowość jest problemem (wynikającym np. z doboru zmiennych odnoszących się do analogicznego konstruktu). Czasami bowiem współliniowość występuje wtedy gdy zmienna silnie korelująca z predyktorem i zmienną zależną jest mediatorem. W takiej sytuacji optymalnym rozwiązaniem byłaby nie zmiana istniejącego modelu, a stworzenie nowego, który uwzględni charakter tych zależności. Najważniejsze jest odpowiednie zrozumienie  przez badacza danych i zależności między badanymi zmiennymi, zarówno od strony teoretycznej, jak i specyfiki badanej próby.

Podsumowując, dbanie o brak współliniowości jest ważne dla otrzymania poprawnych wyników analizy regresji liniowej.  Jednakże wystąpienie jej, może nas skłonić do rozważenia innych bardziej zaawansowanych metod, jak np. modelowanie strukturalne lub mediacja.

COFNIJ

wróć do spisu wszystkich pojęć

Podziel się wiedzą

z innymi

Opinie Klientów

Co o nas sądzą?

Współpracowaliśmy

między innymi z:

Nasi partnerzy