ANALIZA STATYSTYCZNA GOTOWA – TERAZ OPIS – 3…2…1… START! ups… falstart

Niestety. Ulubionym startem większości studentów jest falstart. Przynajmniej jeśli chodzi o opis rezultatów przeprowadzanej analizy statystycznej do pracy magisterskiej lub doktoratu. Liczysz testy t Studenta, trochę korelacji, dwie podsumowujące regresje i może na dokładkę ANOVA w schemacie międzyobiektowym. WOW! Co za wyniki. Hipotezy potwierdzone. Trzeba o tym jak najszybciej napisać! Hola hola. Powolutku :) Wiem, że ekscytacja sięga zenitu, ale zanim odniesiesz się do postawionych hipotez i napiszesz o tym „co wyszło” warto byłoby skonstruować jakieś skromne wprowadzenie :) To jedna możliwość. Druga jest taka, że ekscytacji wcale nie ma, nie za bardzo wiesz jak teraz ugryźć te wszystkie surowe tabelki z SPSSa i w ogóle … jak zacząć.

„Kiedy nie wiesz, jak zacząć, zacznij od TU LEŻY KASZTAN, a potem się zobaczy, co będzie dalej.”

– Mały Poradnik Kubusia Puchatka, Alan Alexander Milne

WTF człowieku, gdzie Ty mi z kasztanami jak ja mam pracę do napisania. No dobra. Sorry :) Choć to mało naukowa pozycja literaturowa to jednak polecam ją gorąco. Już przechodzę do konkretów. Przyznasz jednak, że w wielu sferach życia i przy okazji różnych zadań najtrudnie jest po prostu … zacząć.

WPROWADZENIE DO OPISU WYNIKÓW ANALIZY STATYSTYCZNEJ

Zanim przejdziesz do testowania swoich hipotez, udzielania odpowiedzi na postawione pytania badawcze i po prostu do tzw. zasadniczej analizy statystycznej należy przygotować krótki wstęp. Dobrą praktyką podczas pisania prac dyplomowych jest wzorowanie się na artykułach naukowych. Rozdział z wynikami dobrej magisterki lub doktoratu powinien mieć właśnie strukturę taką jak w dobrych artykułach naukowych. Oto dwa fajne przykłady.

Context Modulates Congruency Effects in Selective Attention to Social Cues autorstwa Andrea Ravagli i współpracowników (2018).

Przed opisaniem wyników analiz statystycznych  badacze informują odbiorców o tym jakie analizy wykonano, co zrobiono gdy dane nie spełniały założeń, jakie założenia i jakim testem sprawdzono, jakie miary siły efektu były wyliczane dla danego testu statystycznego i w końcu, jakie oprogramowanie wykorzystano do obliczeń.

An Eye Movement Desensitization and Reprocessing (EMDR) Group Intervention for Syrian Refugees With Post-traumatic Stress Symptoms: Results of a Randomized Controlled Trial

autorstwa Andrea Ravagli i współpracowników (2018).

W tym artykule jest podobnie. Nie ma tu jeszcze żadnej statystycznej wiedzy tajemnej. Badacze po prostu w pierwszych 7 zdaniach (trochę tego jest :)) piszą o tym jaki test wykonują, kiedy i po co. W przedostatnim zdaniu piszą z kolei, że wyniki były uznawane za istotne statystycznie jeśli p było mniejsze od 0,05 – standard. W zdaniu ostatnim piszą o tym, że analizy wykonano w SPSSie (wersja 19). I tyle. Nic dodać, nic ująć.

 

NO DOBRA, A CO JA MAM NAPISAĆ I JAK? – Pogotowie Statystyczne radzi :)

Twój wstęp, podobnie jak te wzorcowe, również powinien zawierać takie oto informacje:

1. W jakim programie wykonano analizy statystyczne

2. Jakie analizy statystyczne przeprowadzono przy jego użyciu

3. Kiedy przyjmujesz, że wyniki są istotne statystycznie (najczęściej p < 0,05)

Oto jak może wyglądać taki przykładowy wstęp rozdziału z wynikami w pracy dyplomowej:

W celu udzielenia odpowiedzi na postawione pytania badawcze i przetestowania postawionych hipotez przeprowadzono analizy statystyczne przy użyciu pakietu IBM SPSS Statistics w wersji 24. Za jego pomocą wykonano testy Shapiro-Wilka, wyliczono podstawowe statystyki opisowe, szereg analiz korelacji ze współczynnikiem r Pearsona, testy t Studenta dla prób niezależnych oraz dwie wielozmiennowe analizy regresji z krokową metodą wprowadzania predyktorów do modelu . Za poziom istotności w niniejszym rozdziale przyjęto ? = 0,05 jednakże wyniki z przedziału 0,05 < p < 0,1 uznawano za istotne na poziomie tendencji statystycznej.

Naszym zdaniem powyższe wprowadzenie jest najlepszym kompromisem między ilością tekstu i jakością przekazu. Oczywiście można napisać trochę mniej w 1 zdaniu, a równie dobrze można napisać 3x więcej. Wszystko zależy od Twojego podejścia.

TO JEDNAK NIE WSZYSTKO. JEST JESZCZE WSTĘP NR 2

Na potrzeby pracy dyplomowej (rzadziej w artykułach naukowych) powinniśmy jeszcze trochę pochwalić się naszą wiedzą z zakresu statystyki zanim przejdziemy do testowania hipotez i ich weryfikacji. Po powyższym wstępie dobrze jest zrobić coś jeszcze. U nas w firmie nazywamy ten akapit po prostu wstępem nr 2. Mianowicie, dobrze jest wykonać tabelę prezentującą złotą siódemkę podstawowych statystyk opisowych (nie, to nie my wymyśliliśmy tą nazwę a jeden z Waszych promotorów – bardzo przypadła nam jednak do gustu :). Nad tabelą należy przygotować również krótki opis odnoszący się przede wszystkim do rozkładów mierzonych zmiennych. Pamiętaj, że w tabeli i opisie odnosisz się tylko do zmiennych ilościowych! W tej poniżej brak jest naszym zdaniem jeszcze 2 kolumn w których należy zaprezentować wynik testu normalności rozkładu (Shapiro-Wilka lub Kołmogorowa-Smirnowa) oraz wartość p.

Tabela pochodzi z artykułu: 

Ecology of Freedom: Competitive Tests of the Role of Pathogens, Climate, and Natural Disasters in the Development of Socio-Political Freedom

autorstwa Kodai Kusano i Markusa Kemmelmeiera z 2018 r. 

Hipotetyczny opis podobnej tabeli mógłby wyglądać następująco:

Analizę rozpoczęto od zbadania rozkładów zmiennych ilościowych. W tym celu wyliczono podstawowe statystyki opisowe oraz wykonano testy Shapiro-Wilka, które testują zgodność rozkładów z krzywą Gaussa. Efekty przeprowadzonych wyliczeń reprezentuje tabela 1. Otrzymane wyniki pozwalają stwierdzić, że rozkłady mierzonych zmiennych w większości przypadków nie odbiegają istotnie statystycznie od rozkładu normalnego. Odstępstwo obserwuje się jedynie dla zmiennej i tutaj jej nazwa oraz a tu np. jakaś druga zmienna. W ich przypadku dokonano transformacji logarytmicznej.

a w innym przypadku można też tak 

W pierwszym kroku wyliczone zostały podstawowe statystyki opisowe oraz testy Kołmogorowa – Smirnowa dla zmiennych ilościowych. W ich wyniku okazało się, że tylko skala neurotyzmu nie posiada rozkładu normalnego. Jednakże, wartość skośności sugeruje, iż jest on stosunkowo symetryczny względem średniej, co pozwoliło na zastosowanie w niniejszym rozdziale testów parametrycznych. Wyniki przedstawiono w tabeli 1.

Tak mniej więcej powinno to wyglądać. Po takim wprowadzeniu odbiorcy Twojego dzieła mają lepszy ogólny ogląd całej sytuacji. Wiedzą chociaż mniej więcej „co, jak i gdzie”. Możesz dzięki niemu gładko i przyjemnie wprowadzić czytelnika w kolejny etap całej statystycznej narracji czyli analiz zasadniczych, które mają na celu przetestowanie postawionych przez Ciebie hipotez. Także … DO DZIEŁA! W razie jakichkolwiek problemów z analizą statystyczną i raportowaniem uzyskanych wyników służymy pomocą. Pamiętaj o darmowych konsultacjach. Dzwoń lub pisz śmiało