LINIA PROSTA CZY MOŻE KRZYWA?
No właśnie! Jaki model jest lepszym odzwierciedleniem zależności między zmienną X a zmienną Y? Dzięki poniższemu tutorialowi dowiesz się jak sprawdzić czy krzywa jest lepiej dopasowana do danych niż linia prosta. W ciągu 12 lat naszej działalności chyba tylko 1 klient miał postawioną hipotezę, która mówiła o tym, że między zmiennymi zachodzi krzywoliniowa relacja, wiedział on, że da się taką zależność przetestować i świadomie nas o to poprosił. Dlaczego tylko 1? Na pewno nie dlatego, że relacja między dwiema zmiennymi w 99,99% badań jest prosto a nie krzywoliniowa
Najczęściej hipotezy i swoje oczekiwania co do analizy danych budujecie na podstawie swojej (niestety) niewielkiej wiedzy z zakresu statystyki. Nie raz słyszałem, że “musi być ANOVA” bo moja promotor zna taką nazwę i w ogóle wszyscy na wydziale mają anovę więc u mnie też musi być…. albo – “musi być analiza mediacji choć wcale nie wiem dlaczego nie moderacji, recenzent ponoć mówił, że to teraz modne”.
Celem Pogotowia Statystycznego jest przede wszystkim dydaktyka i taki właśnie edukacyjny charakter ma ten wpis oraz poniższy film. Miej świadomość, że bardzo ważnym założeniem tak dobrze znanej Ci analizy korelacji ze współczynnikiem r Pearsona lub analizy regresji jest liniowa (prostoliniowa) zależność między jedną a drugą zmienną. Widziałem “milion” razy bazy danych, w których niektóre związki między zmiennymi były krzywoliniowe (i w teorii, i “na oko”, i wynikało to również z analiz eksploracyjnych) a mimo wszystko badacz liczył “zwykłe” korelacje lub analizy regresji. Tyle go nauczono, tyle potrafił, tyle mógł świadomie policzyć i opisać ze zrozumieniem. Błędnie.
NIE – JESZCZE NIE JESTEŚ STATYSTYKIEM STULECIA
Nawet mimo tego, że za chwilę dowiesz się jak testować związki krzywoliniowe między dwiema zmiennymi. Dwa sposoby, które pokazujemy na tym tutorialu są i tak, bądź co bądź, banalnie proste, nawet trochę infantylne a w skrajnych ocenach błędne (choć jak wszystko w naszych działaniach – oparte na statystycznej literaturze). Analiza nieliniowych relacji między zmiennymi to bardzo rozbudowany temat i szczerze informuję, że tutaj otrzymujesz od nas tylko pewną zajawkę. Mimo wszystko na pewno wystarczy ona nawet na spore podciągnięcie oceny swojej pracy magisterskiej. Wielu promotorów będzie w niebo wziętych jeśli w poniższy sposób udowodnisz, że między dwiema zmiennymi zachodzi krzywoliniowa relacja. Przykłady takich relacji mógłbym mnożyć i mnożyć … ale mi się nie chce 🙂
Jestem jednak pewien, że Twoja analiza statystyczna do pracy magisterskiej lub doktoratu będzie bogatsza jeśli dodasz do niej analizę związków krzywoliniowych. Oczywiście jeśli będą ku temu przesłanki płynące z teorii i przeglądu dotychczasowych badań innych autorów. Nie traktuj analizy, którą tutaj pokazujemy jako eksplorację i podejście “poklikajmy i zobaczymy co wyjdzie”. Powinieneś mieć jakieś podwaliny by móc przypuszczać i testować krzywoliniową relację między zmiennymi.
Wszystkich dociekliwych odsyłam między innymi do fajnej książki Davida Garsona z North Carolina State University, który opublikował ogrom świetnych e-booków o statystyce pod nazwą Blue Book Series.
Klikając na spinacz po prawej możesz ściągnąć przykładowy, wzorcowy opis wyników pochodzących z estymacji krzywej i testowania hipotezy mówiącej o tym, że model liniowy jest tak samo dobrze dopasowany do danych jak model kwadratowy (hipoteza zerowa). Opis ten został przygotowany w formie nadającej się w szczególności do pracy dyplomowej. W artykule naukowym wyniki powinny być zaraportowane w sposób znacznie bardziej skondensowany. Pamiętaj – ilu jest badaczy, tyle jest pomysłów na opis wyników. Sugeruj się naszym, ale nie jest to jedyne, doskonałe wyjście. Jeśli znajdziesz lepszy sposób to koniecznie się nim z nami podziel!
Tutaj masz bazę danych, na której pracowaliśmy w tym tutorialu