Współczynnik VIF – inaczej określany jako współczynnik wariancji inflacji (Variance Inflation Factor) to wskaźnik, który pozwala określić czy między badanymi predyktorami występuje współliniowość. Występowanie współliniowości prowadzi do trudności w interpretacji modelu statystycznego, wynikających z problemów z precyzyjnym określeniem charakteru relacji między poszczególnymi predyktorami a zmienną zależną. Brak współliniowości jest jednym z najważniejszych założeń analizy regresji liniowej.
Współczynnik VIF mierzy jak bardzo wariancja współczynnika regresji danego predyktora jest zwiększana przez inne predyktory w modelu. Im wyższy VIF, tym większa współliniowość i tym trudniej dokonać właściwej interpretacji otrzymanych wyników. Warto podkreślić, że VIF nie jest wskaźnikiem dotyczącym całego modelu, obliczany jest on dla każdego predyktora z osobna.
Obliczając współczynnik VIF, możemy otrzymać wartości od zera wzwyż. W literaturze przyjmowane są różne progi dla jego interpretacji, oto jeden z nich (Daoud, 2017):
Należy jednak pamiętać, że granice interpretacji VIF są umowne. Uzyskany wynik należy zawsze odnosić wyniki do kontekstu samej analizy, wykorzystanych predyktorów i samego celu danego badania. Przykładowo, możemy rozważyć dwie sytuacje:
1. Wpływ cech osobowości na zachowania prospołeczne.
2. Wpływ zarobków i samooceny na zadowolenie pracownika.
W sytuacji pierwszej, można uznać, że cechy osobowości mogą być ze sobą silniej związane z uwagi na fakt, że wchodzą w skład jednego konstruktu teoretycznego. Drugi przykład dotyczy predyktorów, które można określić jako bardziej niezależne od siebie. Zatem w tej drugiej sytuacji warto przyjąć niższy próg VIF dla określenia poziomu krytycznego współliniowości, podczas gdy w pierwszej możemy być bardziej liberalni w tej kwestii.
Jakie możemy podjąć kroki w przypadku uzyskania wysokiej wartości VIF, wskazującej na współliniowość predyktorów? Możliwości jest kilka:
Podsumowując, współczynnik VIF pozwala wykryć występowanie współliniowości w modelu regresji, poprzez sprawdzenie stopnia skorelowania danego predyktora z innymi predyktorami. Wysoka wartość VIF wskazuje na występowanie współliniowości co prowadzi do trudności w interpretacji danego modelu statystycznego i wiąże się z koniecznością jego modyfikacji. Często polega to na usunięciu danego predyktora, jednak nie jest to jedyne rozwiązanie. W tej kwestii warto opierać się nie tylko na uzyskanych wynikach statystycznych, ale też na teoretycznym sensie testowanego modelu.
Literatura:
Daoud, J. I. (2017). Multicollinearity and regression analysis. Journal of Physics: Conference Series (Vol. 949, No. 1, p. 012009). IOP Publishing.