Trafność w psychometrii – stopień w jakim test psychometryczny mierzy rzeczywiście to co ma mierzyć. Wraz z rzetelnością jest to to kluczowa cech testów psychologicznych (tutaj znajdziesz nasze omówienie definicji rzetelności i trafności w formie video).
Test trafny to taki który skutecznie mierzy daną cechę, zgodnie z założeniami teoretycznymi. Innymi słowy, wyniki testu trafnego naprawdę oddają to, co test miał za zadanie zbadać.
Trafność może przyjmować różne formy:
- Trafność treściowa – odnosi się do zakresu, w jakim test obejmuje wszystkie aspekty badanego zjawiska, czyli tego czy stworzone pozycje testowe dobrze odzwierciedlają przyjętą definicję zmiennej ukrytej. Przeważnie w analizie tego rodzaju trafności stosujemy tzw. analizę zgodności ocen sędziów kompetentnych.
- „Trafność” fasadowa – nie jest to oficjalny rodzaj trafności. Odnosi się ona do spójności treściowej tego, co kwestionariusz mierzy według osób badanych czyli przykładowo tego czy poszczególne itemy kwestionariusza samooceny ich zdaniem mierzą “to samo” (choć nie ma znaczenia, czy domyślają się że mierzona jest samoocena).
- Trafność kryterialna (zewnętrzna) – odnosi się do stopnia, w jakim wyniki testu są powiązane z wynikami innych wskaźników zewnętrznych mierzonego konstruktu. Przykładowo, mierząc towarzyskość jako zmienną ukrytą, możemy dodatkowo dokonać obserwacji każdej osoby badanej, aby oszacować z iloma znajomymi ma przeciętnie kontakt w ciągu tygodnia. Takie dwie zmienne potem ze sobą zestawiamy, zwykle wykorzystując analizy korelacji lub test t Studenta (jeśli w tej procedurze stosujemy schemat eksperymentalny). Wyróżniamy dwa rodzaje trafności kryterialnej:
- Trafność diagnostyczna – odnosi się ona do możliwości oceny aktualnego stanu osoby badanej np. w zakresie nasilenia jakiej cechy lub schorzenia.
- Trafność prognostyczna – odnosi się ona do oceny możliwości danego narzędzia w przewidywaniu (czyli właśnie prognozowaniu), np. oceny predyspozycji zawodowych lub ryzyka depresji.
- Trafność teoretyczna – dotyczy stopnia, w jakim test rzeczywiście mierzy teoretyczny konstrukt, który ma mierzyć, i nie jest zanieczyszczony przez inne zmienne. Jest to zatem trafność która najściślej związana jest z ogólną definicją trafności. Oceniamy ją poprzez analizę czynnikową i takie wskaźniki jak wykres osypiska, kryterium Kaisera i kryterium wyjaśnionej wariancji. Ten rodzaj trafności jest najbardziej złożony i dzieli się na kilka podtypów:
- Trafność zbieżna (konwergencyjna) – jest to rodzaj trafności odnoszący się do dwóch kryteriów: a) wewnętrznego, czyli trafność pomiaru w ramach czynnika np. za pomocą wskaźnika AVE; b) zewnętrznego, czyli zbieżność pomiaru z podobnym konstruktem teoretycznym, np. gdy nasza autorska skala do pomiaru sumienności okazuje się silnie i dodatnio korelować z sumiennością z modelu Wielkiej Piątki cech osobowości mierzonej np. NEO-FFI czy IPIP.
- Trafność różnicowa (dywergencyjna) – odnosi się do oceny różnicy między różnymi konstruktami, ponownie może być oceniana w dwóch kryteriach: a) wewnętrznym, czyli w ocenie czy struktura dwóch cech mierzonych tym samym kwestionariuszem nie nachodzi się na siebie np. poprzez porównanie AVE do kowariancji czynników; b) zewnętrznego, czyli braku podobieństwa do zmiennych mierzących co innego np. tworząc kwestionariusz do pomiaru sumienności możemy wykazać brak powiązania jego wyników do np. neurotyczności mierzonej innym narzędziem.
- Trafność teoretyczna jest dowodzona wielokrotnie w trakcie tworzenia kwestionariusza i jest to proces, którego nie można skrócić i wymaga on minimalnie dwóch różnych prób (czyli dwukrotnego wykonania badania):
- W pierwszej kolejności potwierdza ją eksploracyjna analiza czynnikowa (EFA), dowodząc że struktura cech, które chcemy mierzyć jest nieprzypadkowa z uwzględnieniem rotacji ortogonalnej lub ukośnej, macierzy korelacji wielu pozycji (test Bartletta), a także wcześniej wspomniane wykres osypiska czy kryterium Kaisera.
- W drugim etapie na innej próbie potwierdzamy uzyskaną strukturę z wykorzystaniem konfirmacyjnej analizy czynnikowej (CFA), w której potwierdzamy ogólne dopasowanie modelu z użyciem np. CMIN, SRMR, RMSEA wewnętrzną trafność zbieżną i różnicową z użyciem AVE i kowariancji czynników.
- Po potwierdzeniu struktury CFA, jeżeli odpowiednio zaplanowaliśmy badania, możemy przetestować trafność zbieżną i różnicową dla kryterium zewnętrznego, czyli wykonać korelacje Pearsona pomiędzy narzędziami mierzącymi podobne (zbieżne) i odmienne (różne) konstrukty w porównaniu do naszego kwestionariusza. Na tym etapie możemy także przetestować trafność kryterialną, najczęściej diagnostyczną.
Podsumowując, trafność jest niezwykle złożonym zagadnieniem w przypadku oceny dobroci testu psychometrycznego a jednocześnie kluczowym dla wykazania dobrych właściwości takiego testu. Zaletą jest to, że raz udowodniona trafność dla danego narzędzia przez wiele lat nie będzie kwestionowana, na dane narzędzie będzie mogło przez ten czas być wykorzystywane w wielu badaniach naukowych.