ANALIZA STATYSTYCZNA GOTOWA – TERAZ OPIS – 3…2…1… START! ups… falstart

Niestety. Ulubionym startem większości studentów jest falstart. Przynajmniej jeśli chodzi o opis rezultatów przeprowadzanej analizy statystycznej do pracy magisterskiej lub doktoratu. Liczysz testy t Studenta, trochę korelacji, dwie podsumowujące regresje i może na dokładkę ANOVA w schemacie międzyobiektowym. WOW! Co za wyniki. Hipotezy potwierdzone. Trzeba o tym jak najszybciej napisać! Hola hola. Powolutku :) Wiem, że ekscytacja sięga zenitu, ale zanim odniesiesz się do postawionych hipotez i napiszesz o tym “co wyszło” warto byłoby skonstruować jakieś skromne wprowadzenie :) To jedna możliwość. Druga jest taka, że ekscytacji wcale nie ma, nie za bardzo wiesz jak teraz ugryźć te wszystkie surowe tabelki z SPSSa i w ogóle … jak zacząć.

“Kiedy nie wiesz, jak zacząć, zacznij od TU LEŻY KASZTAN, a potem się zobaczy, co będzie dalej.”

– Mały Poradnik Kubusia Puchatka, Alan Alexander Milne

WTF człowieku, gdzie Ty mi z kasztanami jak ja mam pracę do napisania. No dobra. Sorry :) Choć to mało naukowa pozycja literaturowa to jednak polecam ją gorąco. Już przechodzę do konkretów. Przyznasz jednak, że w wielu sferach życia i przy okazji różnych zadań najtrudnie jest po prostu … zacząć.

WPROWADZENIE DO OPISU WYNIKÓW ANALIZY STATYSTYCZNEJ

Zanim przejdziesz do testowania swoich hipotez, udzielania odpowiedzi na postawione pytania badawcze i po prostu do tzw. zasadniczej analizy statystycznej należy przygotować krótki wstęp. Dobrą praktyką podczas pisania prac dyplomowych jest wzorowanie się na artykułach naukowych. Rozdział z wynikami dobrej magisterki lub doktoratu powinien mieć właśnie strukturę taką jak w dobrych artykułach naukowych. Oto dwa fajne przykłady.

Context Modulates Congruency Effects in Selective Attention to Social Cues autorstwa Andrea Ravagli i współpracowników (2018).

Przed opisaniem wyników analiz statystycznych  badacze informują odbiorców o tym jakie analizy wykonano, co zrobiono gdy dane nie spełniały założeń, jakie założenia i jakim testem sprawdzono, jakie miary siły efektu były wyliczane dla danego testu statystycznego i w końcu, jakie oprogramowanie wykorzystano do obliczeń.

An Eye Movement Desensitization and Reprocessing (EMDR) Group Intervention for Syrian Refugees With Post-traumatic Stress Symptoms: Results of a Randomized Controlled Trial

autorstwa Andrea Ravagli i współpracowników (2018).

W tym artykule jest podobnie. Nie ma tu jeszcze żadnej statystycznej wiedzy tajemnej. Badacze po prostu w pierwszych 7 zdaniach (trochę tego jest :)) piszą o tym jaki test wykonują, kiedy i po co. W przedostatnim zdaniu piszą z kolei, że wyniki były uznawane za istotne statystycznie jeśli p było mniejsze od 0,05 – standard. W zdaniu ostatnim piszą o tym, że analizy wykonano w SPSSie (wersja 19). I tyle. Nic dodać, nic ująć.

 

NO DOBRA, A CO JA MAM NAPISAĆ I JAK? – Pogotowie Statystyczne radzi :)

Twój wstęp, podobnie jak te wzorcowe, również powinien zawierać takie oto informacje:

1. W jakim programie wykonano analizy statystyczne

2. Jakie analizy statystyczne przeprowadzono przy jego użyciu

3. Kiedy przyjmujesz, że wyniki są istotne statystycznie (najczęściej p < 0,05)

Oto jak może wyglądać taki przykładowy wstęp rozdziału z wynikami w pracy dyplomowej:

W celu udzielenia odpowiedzi na postawione pytania badawcze i przetestowania postawionych hipotez przeprowadzono analizy statystyczne przy użyciu pakietu IBM SPSS Statistics w wersji 24. Za jego pomocą wykonano testy Shapiro-Wilka, wyliczono podstawowe statystyki opisowe, szereg analiz korelacji ze współczynnikiem r Pearsona, testy t Studenta dla prób niezależnych oraz dwie wielozmiennowe analizy regresji z krokową metodą wprowadzania predyktorów do modelu . Za poziom istotności w niniejszym rozdziale przyjęto alfa = 0,05 jednakże wyniki z przedziału 0,05 < p < 0,1 uznawano za istotne na poziomie tendencji statystycznej.

Naszym zdaniem powyższe wprowadzenie jest najlepszym kompromisem między ilością tekstu i jakością przekazu. Oczywiście można napisać trochę mniej w 1 zdaniu, a równie dobrze można napisać 3x więcej. Wszystko zależy od Twojego podejścia.

TO JEDNAK NIE WSZYSTKO. JEST JESZCZE WSTĘP NR 2

Na potrzeby pracy dyplomowej (rzadziej w artykułach naukowych) powinniśmy jeszcze trochę pochwalić się naszą wiedzą z zakresu statystyki zanim przejdziemy do testowania hipotez i ich weryfikacji. Po powyższym wstępie dobrze jest zrobić coś jeszcze. U nas w firmie nazywamy ten akapit po prostu wstępem nr 2. Mianowicie, dobrze jest wykonać tabelę prezentującą złotą siódemkę podstawowych statystyk opisowych (nie, to nie my wymyśliliśmy tą nazwę a jeden z Waszych promotorów – bardzo przypadła nam jednak do gustu :). Nad tabelą należy przygotować również krótki opis odnoszący się przede wszystkim do rozkładów mierzonych zmiennych. Pamiętaj, że w tabeli i opisie odnosisz się tylko do zmiennych ilościowych! W tej poniżej brak jest naszym zdaniem jeszcze 2 kolumn w których należy zaprezentować wynik testu normalności rozkładu (Shapiro-Wilka lub Kołmogorowa-Smirnowa) oraz wartość p.

Powyższa Tabela pochodzi z artykułu: 

Ecology of Freedom: Competitive Tests of the Role of Pathogens, Climate, and Natural Disasters in the Development of Socio-Political Freedom

autorstwa Kodai Kusano i Markusa Kemmelmeiera z 2018 r. 

Hipotetyczny opis podobnej tabeli mógłby wyglądać następująco:

Analizę rozpoczęto od zbadania rozkładów zmiennych ilościowych. W tym celu wyliczono podstawowe statystyki opisowe oraz wykonano testy Shapiro-Wilka, które testują zgodność rozkładów z krzywą Gaussa. Efekty przeprowadzonych wyliczeń reprezentuje tabela 1. Otrzymane wyniki pozwalają stwierdzić, że rozkłady mierzonych zmiennych w większości przypadków nie odbiegają istotnie statystycznie od rozkładu normalnego. Odstępstwo obserwuje się jedynie dla zmiennej i tutaj jej nazwa oraz a tu np. jakaś druga zmienna. W ich przypadku dokonano transformacji logarytmicznej.

a w innym przypadku można też tak 

W pierwszym kroku wyliczone zostały podstawowe statystyki opisowe oraz testy normalności rozkładu dla zmiennych ilościowych.

Wynik testu Kołmogorowa-Smirnowa w przypadku wszystkich wprowadzonych zmiennych okazał się istotny statystycznie, co oznacza, że ich rozkłady istotnie odbiegają od rozkładu normalnego. Należy jednak zwrócić uwagę, że skośność rozkładu wszystkich zmiennych nie nieznaczna, co oznacza, że ich rozkłady są asymetryczne w nieznacznym stopniu. W związku z tym zasadne jest przeprowadzenie analizy w oparciu o testy parametryczne.

Skąd wiemy kiedy wartość skośności wskazuje na niewielką asymetrię rozkładu? W literaturze przyjmuje się najczęściej dwie zakresy: wartości bezwzględnej 1 (zapisywanej jako |1|, jest to przedział między -1 a 1) lub wartości bezwzględnej 2 (zapisywanej jako |2|, jest to przedział między -2 a 2). Przy powoływaniu się na te wartości warto odwołać się do literatury. Oba te przedziały są zawarte w książce: George, D., & Mallery, P. (2016). IBM SPSS statistics 23 step by step: A simple guide and reference. Stąd proponujemy wykorzystać tę pozycję przy tworzeniu bibliografii.

Tak mniej więcej powinno to wyglądać. Po takim wprowadzeniu odbiorcy Twojego dzieła mają lepszy ogólny ogląd całej sytuacji. Wiedzą chociaż mniej więcej “co, jak i gdzie”. Możesz dzięki niemu gładko i przyjemnie wprowadzić czytelnika w kolejny etap całej statystycznej narracji czyli analiz zasadniczych, które mają na celu przetestowanie postawionych przez Ciebie hipotez. Także … DO DZIEŁA! W razie jakichkolwiek problemów z analizą statystyczną i raportowaniem uzyskanych wyników służymy pomocą. Pamiętaj o darmowych konsultacjach. Dzwoń lub pisz śmiało