Słownik

START | EDUKACJA | SŁOWNIK | VIF (współczynnik VIF)

VIF (współczynnik VIF)

Współczynnik VIF – inaczej określany jako współczynnik wariancji inflacji (Variance Inflation Factor) to wskaźnik, który pozwala określić czy między badanymi predyktorami występuje współliniowość. Występowanie współliniowości prowadzi do trudności w interpretacji modelu statystycznego, wynikających z problemów z precyzyjnym określeniem charakteru relacji między poszczególnymi predyktorami a zmienną zależną. Brak współliniowości jest jednym z najważniejszych założeń analizy regresji liniowej.

Współczynnik VIF mierzy jak bardzo wariancja współczynnika regresji danego predyktora jest zwiększana przez inne predyktory w modelu. Im wyższy VIF, tym większa współliniowość i tym trudniej dokonać właściwej interpretacji otrzymanych wyników. Warto podkreślić, że VIF nie jest wskaźnikiem dotyczącym całego modelu, obliczany jest on dla każdego predyktora z osobna.

Obliczając współczynnik VIF, możemy otrzymać wartości od zera wzwyż. W literaturze przyjmowane są różne progi dla jego interpretacji, oto jeden z nich (Daoud, 2017):

  • VIF < 1 – względny brak współliniowości predyktorów, co jest sytuacją idealną dla modelu, gdyż każda zmienna „gra na własny rachunek”.
  • VIF między 1 a 5 – umiarkowana współliniowość, którą uznać możemy za akceptowalną, a ewentualna zmiana w modelu opcjonalna i zależy od innych przesłanek, np. znaczenia teoretycznego poszczególnych predyktorów.
  • VIF > 5 – wysoka współliniowość, która wskazuje na konieczność zmiany modelu, zwykle odrzucenia danego predyktora z uwagi na zbyt silną współliniowość z innymi zmiennymi niezależnymi w modelu.

Należy jednak pamiętać, że granice interpretacji VIF są umowne. Uzyskany wynik należy zawsze odnosić wyniki do kontekstu samej analizy, wykorzystanych predyktorów i samego celu danego badania. Przykładowo, możemy rozważyć dwie sytuacje:

1. Wpływ cech osobowości na zachowania prospołeczne.
2. Wpływ zarobków i samooceny na zadowolenie pracownika.

W sytuacji pierwszej, można uznać, że cechy osobowości mogą być ze sobą silniej związane z uwagi na fakt, że wchodzą w skład jednego konstruktu teoretycznego. Drugi przykład dotyczy predyktorów, które można określić jako bardziej niezależne od siebie. Zatem w tej drugiej sytuacji warto przyjąć niższy próg VIF dla określenia poziomu krytycznego współliniowości, podczas gdy w pierwszej możemy być bardziej liberalni w tej kwestii.

Jakie możemy podjąć kroki w przypadku uzyskania wysokiej wartości VIF, wskazującej na współliniowość predyktorów? Możliwości jest kilka:

  • Usunięcie predyktorów – najpopularniejsze podejście to usuwanie predyktora, który cechuje najwyższa wartość VIF. Rozwiązanie to można uznać za poprawne, jednak jest problematyczne, gdy dotyczy zmiennej istotnej z punktu widzenia teoretycznego.
  • Kombinacja zmiennych – kolejna możliwość to podjęcie próby utworzenia bardziej ogólnego czynnika dla skorelowanych predyktorów np. ekstrawersja i intelekt są czynnikami które tworzą ogólną cechę sprawczości. Jednym ze sposobów na stworzenie takiej nowej zmiennej jest przeprowadzenie analizy czynnikowej metodą głównych składowych.
  • Zebranie większej próby – nie jest sekretem, że zebranie większej liczby próby jest lekarstwem na wszelkie problemy z analizą statystyczną i również w tym przypadku nie jest inaczej. Rozwiązanie to jest użyteczne przede wszystkim w sytuacji niewielkiej jej liczebności, która prowadzi do niespełnienia wymogów związanych z mocą testu.

Podsumowując, współczynnik VIF pozwala wykryć występowanie współliniowości w modelu regresji, poprzez sprawdzenie stopnia skorelowania danego predyktora z innymi predyktorami. Wysoka wartość VIF wskazuje na występowanie współliniowości co prowadzi do trudności w interpretacji danego modelu statystycznego i wiąże się z koniecznością jego modyfikacji. Często polega to na usunięciu danego predyktora, jednak nie jest to jedyne rozwiązanie. W tej kwestii warto opierać się nie tylko na uzyskanych wynikach statystycznych, ale też na teoretycznym sensie testowanego modelu.

Literatura:
Daoud, J. I. (2017). Multicollinearity and regression analysis. Journal of Physics: Conference Series (Vol. 949, No. 1, p. 012009). IOP Publishing.

COFNIJ

wróć do spisu wszystkich pojęć

Podziel się wiedzą

z innymi

Opinie Klientów

Co o nas sądzą?

Współpracowaliśmy

między innymi z:

Nasi partnerzy