Author Archives: Pogotowie Statystyczne


Analiza rzetelności Alfa Cronbacha – teoria, wyjaśnienia, przykłady raportowania

 OTWÓRZ / POBIERZ ARTYKUŁ JAKO PLIK PDF  

 

Wprowadzenie

Mimo, że wykonanie analizy rzetelności przy użyciu wskaźnika Alfa Cronbacha (np. w SPSS) jest stosunkowo proste to regularnie wśród naszych klientów spotykamy się z trudnością w zarówno zrozumieniu tej analizy, jak i zaraportowaniu jej wyników. Dlatego też w tym artykule przedstawimy jej założenia, obszary zastosowania, ograniczenia, a także instrukcje i przykłady jak zaraportować jej wyniki.

Czym jest rzetelność testu?

Rzetelność jest właściwością określającą dokładność pomiaru testem psychologicznym. Ściślej mówiąc, test rzetelny to taki, który wykorzystany dwukrotnie da zbliżone wyniki. Rzetelność warto odróżnić od innego podstawowego kryterium jakości narzędzia badawczego, czyli trafności, która odnosi się do tego czy test rzeczywiście mierzy to co ma mierzyć. Obie te właściwości są kluczowe do tego, aby uznać narzędzie psychologiczne za „dobre”.  Dodatkowe omówienie obu tych pojęć, w tym różnic między nimi, znajdziecie na jednym z naszych tutoriali video.

Jak dokonuje się oceny rzetelności?

Istnieją różne metody szacowania rzetelności testu. Dla przykładu, Jankowski i Zajenkowski (2009) wymieniają ich siedem. Warto zaznaczyć, że są to raczej sposoby mierzenia różnych aspektów rzetelności, aniżeli różne równorzędne metody jej pomiaru i mogą one dawać trochę odmienne wyniki.

Mimo tej różnorodności, najczęściej rzetelność określa się poprzez analizę zgodności wewnętrznej testu przy użyciu Alfa Cronbacha (α). Jest ona tak chętnie stosowana, ponieważ można ją wykorzystać „przy okazji” wykonywanego badania, nawet jeśli tego wcześniej nie planowaliśmy – można przeprowadzić ją na już posiadanym zbiorze danych. Dla kontrastu, zastosowanie innych metod wymaga dodatkowego nakładu pracy. Przykładowo, analiza zgodności sędziów kompetentnych wymaga osobnego badania, w którym sędziowie wypełniają dodatkowe arkusze. Z kolei badanie stabilności bezwzględnej opiera się na dwukrotnym pomiarze tym samym testem w pewnym odstępie czasu, w związku z czym wymagane jest wykonanie dodatkowego, drugiego pomiaru na tej samej grupie respondentów

Czym jest wskaźnik Alfa Cronbacha?

Tak jak wspomniano wyżej, Alfa Cronbacha jest wskaźnikiem określającą zgodność wewnętrzną testu. Określa ona stopień, w jakim pozycje testowe są ze sobą powiązane. Warto wspomnieć, że miarę tę możemy wykorzystać jedynie dla zmiennej ilościowej (odpowiednikiem tego wskaźnika dla skali 0-1 jest współczynnik Kudera-Richardsona KR20).

Wyjaśnijmy to na przykładzie jednego z najczęściej stosowanych testów psychologicznych – kwestionariusza samooceny SES Rosenberga. (tu można zobaczyć arkusz tego kwestionariusza). Zawiera on 10 pozycji testowych, tzw. „itemów” – w tym przypadku są to twierdzenia dotyczących samooceny. Do każdego z nich należy odnieść się, zaznaczając odpowiedź na skali od 1 (zdecydowanie nie zgadzam się) do 4 (zdecydowanie zgadzam się). Liczbę uzyskanych punktów sumuje się i w ten sposób każdy badany uzyskuje wynik w zakresie od 10 do 40, będący wskaźnikiem poziomu samooceny.

I teraz dochodzimy do sedna sprawy – mimo, że kwestionariusz SES zawiera 10 różnych stwierdzeń, to każde z nich dotyczy tego samego konstruktu teoretycznego – tej samej, jednej samooceny, a nie 10 różnych jej rodzajów. Oznacza to, że odpowiedzi danej osoby na poszczególne pytania powinny być podobne, i to założenie właśnie stoi u podstawy konstrukcji wskaźnika Alfa Cronbacha. Przykładowo osoba, którą charakteryzuje bardzo wysoka samoocena do wszystkich pytań powinna odnieść się na „4” (ew. do kilku na „3”), ponieważ jej wysoki poziom samooceny powinien zostać odzwierciedlony w każdym pytaniu. Oczywiście to samo dotyczy pozostałych osób, o względnie niskim lub średnim jej poziomie. Wskaźnik Alfa Cronbacha dotyczy właśnie tak rozumianej spójności między odpowiedziami na poszczególne pytania. Jeśli odpowiedzi na pytania kwestionariuszowe u poszczególnych badanych są podobne, to uzyskana korelacja będzie wysoka, wskazując na wysoką rzetelność. Jeśli z kolei odpowiedzi na poszczególne pytania będą silnie zróżnicowane, korelacja ta będzie niska, co będzie dowodem niskiej rzetelności.

Warto w tym momencie zaznaczyć, że wskaźnik Alfa Cronbacha nie mierzy stopnia, w jakim pozycje testowe odnoszą się do tego samego konstruktu. Jest to powszechna, ale błędna interpretacja. Ze względu na sposób obliczania wskaźnika α do uzyskania wysokich jego wartości wystarczy, że każda pozycja testowa będzie powiązana z kilkoma innymi pozycjami testowymi. Możemy sobie zatem wyobrazić sytuację, w której uzyskujemy wysoką wartość α dla 20 itemów, z których każde 5 wchodzi w skład osobnych 4 czynników, w niewielkim stopniu powiązanych ze sobą. W takim wypadku wysoka wartość Alfa Cronbacha będzie wynikiem wyłącznie korelacji między itemami w podskalach, nie będzie natomiast w żaden sposób dowodem na jednorodność skali ogólnej. Aby ją określić należy zastosować inną, dodatkową analizę, np. analizę czynnikową albo po prostu inną metodę szacowania rzetelności. Popularną alternatywą dla Alfa Cronbacha jest w takim wypadku omega (ω) McDonalda, która bazuje na analizie czynnikowej i pozwala uzyskać informację o tym jak czynnik ogólny i podskale wpływają na rzetelność całego narzędzia (Ciżkowicz, 2018).

Jaka wartość wskaźnika Alfy Cronbacha jest zadowalająca?

Wartość wskaźnika Alfa Cronbacha może przyjmować wartość od 0 do 1. Zakłada się, że im jest ona wyższa tym większa jest zgodność wewnętrzna testu, czyli test jest bardziej rzetelny. Przyjmuje się różne progi (punkty odcięcia) wskazujące na zadowalającą rzetelność. Zwykle mieszczą się one w granicach między 0,7 a 0,95 (Tavakol & Dennick, 2011). Jedną z konkretnych klasyfikacji proponują George i Mallery (2016, s. 240):
– α > 0,9 – doskonała
– α > 0,8 – dobra
– α > 0,7 – akceptowalna
– α > 0,6 – wątpliwa
– α > 0,5 – słaba
– α < 0,5 – nieakceptowana

Warto jednak wiedzieć, że sugerowanie się tego rodzaju progami przy ocenie wartości Alfa Cronbacha bywa zawodne. Wynika to z faktu, że moc tego testu zależna jest od liczby itemów wchodzących w skład danej skali (dokładne symulacje przedstawiają Heo, Kim & Faith, 2015). W praktyce oznacza to, że prawie każdą skalę o dużej liczbie pozycji testowych (rzędu 20) charakteryzować będzie wysoka wartość Alfa Cronbacha, nawet jeśli w rzeczywistości jej spójność wewnętrzna będzie niska. Z kolei wiele skal o małej liczbie itemów (np. 3-5) może uzyskać niską wartość Alfa Cronbacha, nawet jeśli w rzeczywistości spójność wewnętrzna będzie zadowalająca.

Ponadto, mimo, że wzrost wartości α wskazuje na większą spójność wewnętrzna skali, nie ma tu bezwzględnego zastosowania zasada pt. „im więcej tym lepiej”.  Dlaczego? Z jednej strony – wysoka wartość Alfa Cronbacha (rzędu α = 0,95) może wskazywać na to, że część itemów jest redundantna (zbędna), ponieważ mierzy dokładnie tę samą właściwość skali (są to bliźniacze pytania), zamiast mierzyć różne jej aspekty. Z drugiej strony, istnieją sytuacje, w których uzyskanie wysokich wartości Alfa Cronbacha nie jest pożądane. Bywa tak w przypadku konstruowania testów wiedzy, które powinny charakteryzować się zróżnicowaną trudnością. W takiej sytuacji uzyskanie wartości Alfa bliskiej 1 będzie wskazywało na niewłaściwą konstrukcję testu, o mało zróżnicowanej trudności, a z kolei uzyskanie „obniżonej” wartości α będzie dowodem na odpowiedni jej stopień,

W związku z ograniczeniami analizy Alfa Cronbacha wymienionymi powyżej, kluczowym staje się umiejętność poprawnej interpretacji jej wyników. W tym celu warto odnieść je bezpośrednio do zastosowanych narzędzi i teorii leżącej u podstaw danego zjawiska. Interpretację wartości α warto uzupełnić przede wszystkim analizą struktury zastosowanych kwestionariuszy (liczbą itemów oraz analizą ich treści) ponieważ wartości α nie są zawieszone w próżni, a dotyczą właśnie ich 🙂 Warto też pamiętać o wcześniej opisanej zależności między ilością itemów w skali, a mocą tego testu. Uwzględnienie tych kwestii pozwala wykroczyć poza ocenę wartości α jako takich (na zasadzie α = 0,8 to dużo, a α = 0,5 mało) i dokonać jej w szerszym kontekście.

Kiedy i po co oblicza się wskaźnik Alfa Cronbacha?

Analizę rzetelności przeprowadza się w dwóch sytuacjach:
(1)   Kiedy tworzymy nowy test od podstaw lub dokonujemy jego adaptacji (w naszym kraju zwykle z warunków angielskich na polskie). Jest to elementem procedury walidacyjnej testu, którą później opisuje się w podręczniku do narzędzia lub w artykule naukowym.
(2)   Kiedy wykonujemy jakiekolwiek badanie z użyciem istniejących, zwalidowanych już kwestionariuszy. Wysoka rzetelność skal uzyskana w próbie walidacyjnej nie gwarantuje rzetelnego pomiaru w każdym badaniu, dlatego też wskaźnik Alfa Cronbacha musi zostać policzony za każdym razem, nawet jeśli stosujemy kwestionariuszy popularny (np. NEO-FFI, FCZ-KT, SES, SWLS, CISS), dla którego analiza rzetelności była setki razy wykonywana przez innych badaczy.

Dlaczego analizę rzetelności należy przeprowadzić w każdym badaniu? Wynika to z faktu, że wskaźnik Alfa Cronbacha nie dotyczy kwestionariusza jako takiego, a jego konkretnego zastosowania. Przykładowo Taber (2018) w swoim artykule przytacza badania, w których wskaźnik Alfa Cronbacha przyjmował różne wartości dla odmiennych grup wiekowych. To samo dotyczyć może próbek z różnych populacji. Przykładowo spodziewać się można, że wyniki analizy rzetelności dla kwestionariuszy używanych w Zakładach Poprawczych („poprawczakach”) lub więzieniach będą niższe niż w populacji ogólnej, z powodu m.in. fałszowania wyników przez badanych. Po prostu każdy test może „zadziałać” inaczej w różnych warunkach i na różnych próbkach obserwacji.

Warto wspomnieć tu o dodatkowym, często pomijanym celu obliczania wskaźnika Alfa Cronbacha, jakim jest sprawdzanie poprawności konstrukcji bazy danych. Jeśli uzyskana wartość α dla danej skali okaże się bardzo niska (lub ujemna, co również jest możliwe) to jest to sygnałem, że baza danych mogła zostać wykonania niewłaściwie. Błędy w tym zakresie mogą pojawić się przy okazji tworzenia bazy danych, szczególnie jeśli dane przepisywane są do bazy danych „ręcznie” z arkuszy papierowych. Inną częstą przyczyną jest brak odpowiedniego zrekodowania (odwrócenia) itemów według klucza odpowiedzi. Jeśli nie możemy tego sprawdzić bezpośrednio (prześledzić całego procesu wstecz) można wykorzystać inny sposób – dokonać rekodowania raz jeszcze i sprawdzić jak wpłynie to na zmianę wartości α . Jeśli będzie to zmiana np. z wartości 0,247 na 0,818 to mamy prawie 100% pewności, że rzeczywiście błąd leży po tej stronie. Interpretacja wartości α jest zatem przydatna przy ocenie konstrukcji bazy danych. Bez tego ryzykujemy sytuacją, w której wykonamy analizę na błędnie obliczonych wskaźnikach, uzyskując całkowicie błędne wyniki, nie zdając sobie nawet z tego sprawy.

Jak zaraportować wartości Alfa Cronbacha w swoim badaniu?

               Skupimy się tu jedynie na sytuacji opisanej wyżej jako (2), to znaczy wtedy, kiedy raportujemy wynik naszego „zwykłego” badania, które nie jest walidacją narzędzia. Analiza walidacji jest z definicji wykonywana jest rzadko, poza tym kwestia jej przeprowadzenia to bardziej złożony temat, który odbywa się w szerszym kontekście analizy psychometrycznej, której analiza rzetelności jest jedynie częścią.

Tak jak już wspomniano, analizę rzetelności wykonujemy w każdym pojedynczym badaniu. W takiej sytuacji podajemy jednak nie jedną, a dwie wartości Alfa Cronbacha dla każdej skali:
(1)   Tę uzyskaną w naszym badaniu jako potwierdzenie wysokiej zgodności wewnętrznej podczas tego konkretnie jej zastosowania.
(2)   Tę obliczoną w badaniu walidacyjnym jako omówienie własności psychometrycznych uzyskanych w procesie konstrukcji narzędzia.

W jaki sposób odnaleźć wartości α uzyskane w procesie walidacji kwestionariusza? W tym celu zaglądamy do podręcznika do metody, a jeśli taki nie istnieje to do artykułu opisującego ten proces. Wiele z nich publikowanych jest na researchgate.net lub Google Scholar.

Jako przykład weźmy tekst: Opracowanie i walidacja eksperymentalnej polskiej wersji skróconej Kwestionariusza Schematów Younga (Staniszek, Popiel, 2017; dostęp: 31.03.2022). Opis wyników analizy rzetelności dla jednego z badań sporządzony został w następujący sposób:

Natomiast dokładne wartości Alfa Cronbacha przedstawione zostały w tabeli (kwestionariusza zawiera 18 podskal i 1 skalę ogólną):

Czasami informacje dotyczące wyników analizy rzetelności podane są również na stronie wydawcy testu. Możemy zobaczyć to na przykładzie testu LOT-R wydanego w Pracowni Testów Psychologicznych PTP – wyniki analizy rzetelności zostały zaraportowane na stronie z opisem tego narzędzia. Jest to ukazane na poniższym screenie.

Źródło: https://www.practest.com.pl/lot-r-test-orientacji-zyciowej; dostęp: 31.03.2022r.

 

Naszym zadaniem jest odczytanie tych wartości i przedstawienie ich w naszym tekście. Wystarczy ten fragment tekstu sparafrazować (lub nawet przepisać). Oprócz tego raportujemy wartości Alfa Cronbacha obliczone w naszym badaniu.

Raportowanie wartości wskaźnika Alfa Cronbacha w swoim badaniu – przykłady wraz z omówieniem

Wartości wskaźnika Alfa Cronbacha raportujemy w rozdziale metodologicznym naszego tekstu naukowego, zazwyczaj w podrozdziale z opisem zastosowanych narzędzi badawczych. Możemy też w tym celu stworzyć osobny podrozdział, szczególnie jeśli przeprowadzona przez nas analiza własności psychometrycznych jest bardziej rozbudowana i wykracza poza raportowanie wartości α.

Wyniki analizy rzetelności możemy zaraportować w tekście lub w tabeli. Zapis tabelaryczny warto wykorzystać wtedy, gdy do zaraportowania mamy wiele wartości. Poniżej znajdują się przykłady obu tych sposobów wraz z omówieniem.

PRZYKŁAD 1

Przedstawienie wyników analizy rzetelności w tekście

Skalę satysfakcji z życia SWLS autorstwa: Ed Diener, Robert A. Emmons, Randy J. Larsen i Susan Griffin (1985). Została zaadaptowana do warunków polskich przez Zygfryda Juczyńskiego (2001). Ma za zadanie ocenę subiektywnego zadowolenia z własnych osiągnięć i warunków na podstawie pięciu stwierdzeń w skali siedmiostopniowej (od zupełnie nie zgadzam się do całkowicie zgadzam się). Wynik uzyskany w badaniu mieści się w granicach 5–35 i oznacza poziom satysfakcji: im wyższy, tym większe jest poczucie satysfakcji z życia.

Właściwości psychometryczne skali zostały opisane w podręczniku do metody (Juczyński, 2001). Skala charakteryzuje się zadowalającą trafność teoretyczną, szacowaną poprzez analizę je związki ze zmiennymi, które pośrednio odzwierciedlają poczucie satysfakcji z życia lub mają na nie wpływ (dodatnia zależność ze Skalą Poczucia Własnej Wartości Rosenberga RSES; ujemna z nasileniem spostrzeganego stresu mierzonego Skalą odczuwanego Stresu PSS i kontrolą emocji gniewu, depresji i lęku mierzonej Skalą Kontroli Emocji CECS). Wskaźnik rzetelności Alfa Cronbacha w badaniu normalizacyjnym 371 osób również okazał się zadowalający, wynosząc 0,81. Wartość wskaźnika uzyskana w tym badaniu również okazała się zadowalająca, wynosząc α = 0,75.

Omówienie przykładu: Opis został stworzony częściowo na podstawie podręcznika do metody, choć niektóre z tych informacji znaleźć można również na stronie wydawcy testu. Jak widzimy, wartości Alfa Cronbacha zarówno w procesie walidacji jak i badaniu właściwym zostały zaraportowane krótko, w dwóch zdaniach. Jeśli w naszym badaniu zastosowaliśmy kilka kwestionariuszy to możemy opisać je po kolei według tego samego schematu. Ponadto należy pamiętać, że odnosząc się w tekście do poszczególnych źródeł (np. Juczyński, 2001) należy umieścić ich pełen zapis bibliograficzny w literaturze na końcu tekstu.

 

PRZYKŁAD 2

Przedstawienie wyników analizy rzetelności w tabeli

 Analiza psychometrycznych własności użytych narzędzi została wykonana przy użyciu analizy zgodności wewnętrznej Alfa Cronbacha. Wykazała ona, że 12 spośród 16 testowanych skal osiągnęła zadawalającą rzetelność α > 0,70 (podawane w tekście kryteria na podstawie: George & Mallery, 2016). Dla dwóch skal: Relacje (PERMA) oraz Zaangażowanie w czynności zastępcze (CISS) uzyskano rzetelność wątpliwą 0,60 < α < 0,70. Z kolei podskala Zaangażowanie (PERMA) charakteryzowała słaba rzetelność 0,50 < α < 0,60. Wszystkie obliczone wartości przedstawiono w tabeli 1.

  

Omówienie przykładu: Powyższe schemat raportowania jest przykładowy i możemy go zastosować, jeśli chcemy zaraportować wyniki dla wszystkich skal ze wszystkich kwestionariuszy zbiorczo. Możemy też wykorzystać tabele do raportowania wyników osobno dla poszczególnych kwestionariuszy i dołączyć je do opisu narzędzi. W takiej sytuacji najlepiej wynik dla SWLS (jako że jest tylko jeden) zapisać w tekście, a dla kwestionariuszy PERMA i LMI stworzyć dwie osobne tabele. Możemy też w tego rodzaju tabeli/tabelach umieścić nie tylko wartości α uzyskane w naszym badaniu, ale także stworzyć drugą kolumnę w które zaraportujemy poszczególne wartości obliczone w walidacji narzędzi.

 

Literatura:
Jankowski, K. & Zajenkowski, M. (2019). Jakich informacji o teście dostarcza testowanie? W: Fronczyk, K. (red.). Psychometria Podstawowe zagadnienia (84-110). Warszawa: Vizja Press.
Taber, K. (2018). The Use of Cronbach’s Alpha When Developing and Reporting Research Instruments in Science Education. Research in Science Education 48, 1-24.
Tavakol, M., Dennick, R. (2011). Making Sense of Cronbach’s Alpha. International Journal of Medical Education. 2, 53-55.
George, D., & Mallery, P. (2016). IBM SPSS statistics 23 step by step: A simple guide and reference. New York Routledge.
Heo, M., Kim, N., Faith, M. (2015). Statistical power as a function of Cronbach alpha of instrument questionnaire items. BMC Medical Research Methodology, 15.
Staniaszek, K., Popiel, A. (2017). Opracowanie i walidacja eksperymentalnej polskiej wersji skróconej Kwestionariusza Schematów Younga (YSQ-ES-PL) do badania wczesnych schematów dezadaptacyjnych, Roczniki Psychologiczne 20(2), 373-427.
Ciżkowicz, B. (2018). Omega McDonalda jako alternatywa dla alfa Cronbacha w szacowaniu rzetelności testu. Polskie Forum Psychologiczne, 23(2), 311-329.

Jak stawiać hipotezy i pytania badawcze?

 OTWÓRZ / POBIERZ ARTYKUŁ JAKO PLIK PDF   

 

Wprowadzenie

Hipoteza badawcza to stwierdzenie/przypuszczenie dotyczące jakiegoś zjawiska, które zostaje zweryfikowane w toku analizy statystycznej. Przez wielu jest ona traktowana jako jeden z kluczowych elementów tekstu naukowego, stanowiącego pomost między rozdziałem teoretycznym a analizą statystyczną, ponieważ to hipotezy bezpośrednio wskazują na to jakie analizy statystyczne będą wykonane oraz w jakim celu w ogóle przeprowadzano badanie.  Są one zatem w sposób pragmatyczny związane z analizą statystyczną i z tej perspektywy rzeczywiście są kluczowe – szczególnie dla studentów, dla których zwykle tworzenie pracy dyplomowej jest po prostu obowiązkiem, który chcą mieć jak najszybciej za sobą.

Jednocześnie, stawianie dobrych hipotez to nie lada wyzwanie, ponieważ wiele podręczników do metodologii przedstawia to zagadnienie w mało przystępny sposób. Ponadto hipotezy badawcze są nierozłączone od problemu badawczego oraz pytań badawczych. Poprawnie napisana metodologia uwzględnia te trzy aspekty i istnieją konkretne reguły dotyczące tego czym one się charakteryzują, co ja łączy a co różni i w jaki sposób się je tworzy. Dlatego też artykuł ten dotyczy wszystkich tych trzech elementów i tym samym stanowi odpowiedź nie na jedno, a na trzy pytania:
– jak poprawnie sformułować problem badawczy?
– jak poprawnie sformułować pytania badawcze?
– jak poprawnie sformułować hipotezy badawcze?

Poza udzieleniem odpowiedzi na te pytania, w artykule zostaną pokazane konkretne przykłady ukazujące jak to robić i jak tego nie robić.

Krok pierwszy – tworzymy problem badawczy (cel badania)

Podstawowym trzonem metodologii jest problem badawczy (niekiedy określanym jako cel badania). Jest to ogólny zarys tego czego badanie dotyczy i jakie ma przynieść wnioski. Czasami w danej pracy stawia się jeden problem badawczy, a czasami kilka, nawet jeśli pytań badawczych i hipotez z nim związanych jest kilka lub kilkanaście.

Co oznacza, że problem badawczy jest ogólny? (Warto wspomnieć o tym, że Brzeziński (2019) sugeruje, że jeśli problem badawczy jest zbyt ogólny to należy wyprowadzić z niego dodatkowe, problemy szczegółowe. W tym artykule jednak nie jest to ujęte, aby uniknąć nadmiernego skomplikowania, które mogłoby uczynić opisywane kwestie niepraktycznymi)

Aby to wyjaśnić posłużmy się przykładem:

Problem badawczy
Jakie są uwarunkowania rozwoju kompetencji menadżerskich?

 

Ten problem badawczy jest ogólny, ponieważ:
1. Cel tego badania może zostać zrealizowany poprzez wykonanie różnego rodzaju badań. Z jednej strony można wykonać badanie ilościowe (kwestionariuszowe), w którym zmierzone zostaną różne aspekty kompetencji menadżerskich i ich uwarunkowań, a następnie zostaną wykonane analizy korelacji i porównań średnich. Z drugiej strony, ten sam cel badania można spełnić wykonując badania jakościowe na pracownikach, którzy oceniają uwarunkowania rozwoju kompetencji menadżerów u swoich przełożonych.
2. Rozwój kompetencji menadżerskich może być mierzony na różne sposoby. Istnieją różne kwestionariusze przeznaczone do ich badania, wiele z nich ma kilka wskaźników kompetencji, z których każdy dotyczy jakiegoś innego ich aspektu. Podobnie uwarunkowania rozwoju kompetencji również można mierzyć na różny sposób i na różnych poziomach. Mogą być to zarówno ogólne cechy socjodemograficzne (wiek, płeć, stać pracy), kwestie związane z ogólnymi warunkami pracy czy specyficzne kwestie, takie jak kompetencje społeczne, cechy osobowości czy temperamentu.
3. Analizę dla danych zmiennych można przeprowadzić na różne sposoby. Przykładowo, mając kilka zmiennych socjodemograficznych jako wyjaśniających (niezależnych) oraz wskaźnik ogólny poziomu kompetencji menadżerskich jako zmienną wyjaśnianą (zależną), można dla nich wykonać analizy korelacji i porównań średnich, jednak można też wykonać analizę regresji. Zupełnie inna możliwość to podział osób badanych na te o wysokim vs niskim poziomie kompetencji na podstawie uzyskanych wyników i wykonanie testów średnich i chi kwadrat.

Powyższe argumenty wskazują na to, że problem badawczy można rozwiązać na różne sposoby. Wynika to w dużej mierze z faktu, że problem badawczy formułowany jest na podstawie teorii. Dopiero w procesie operacjonalizacji, który następuje później, dobiera się odpowiednie wskaźniki badanych konstruktów. Propozycje rozwiązania problemu badawczego wskazuje się w kolejnych etapach konstruowania badania jaką jest formułowania pytań badawczych i hipotez badawczych.

Krok drugi – formułujemy pytania badawcze

Ogólny zamysł nakreślony w ramach problemu badawczego staje się bardziej doprecyzowany w procesie tworzenia pytań badawczych. Tutaj przechodzimy do określenia w jaki sposób cel badania zostanie osiągnięty, a także jakiego rodzaju odpowiedź na postawione pytania jest oczekiwana. Aby to zobrazować rozważmy poniższy przykład. Do problemu badawczego postawionego wyżej dopiszmy przykładowe pytania badawcze.

Problem badawczy
Jakie są uwarunkowania rozwoju kompetencji menadżerskich?

Pytania badawcze
1. Czy istnieje związek między poziomem kompetencji menadżerskich a wykształceniem?
2. Czy istnieje związek między poziomem kompetencji menadżerskich a poziomem dopasowania do miejsca pracy?
3. Czy istnieje związek między poziomem kompetencji menadżerskich a poziomem inteligencji?

 

Ten przykład pokazuje, że rzeczywiście pytania badawcze są bardziej szczegółowe niż problem badawczy. Są one bardziej precyzyjne, ponieważ wskazują na to jakie elementy (konstrukty) potencjalnie warunkujące rozwój kompetencji menadżerskich zostaną w analizie uwzględnione: wykształcenie, dopasowanie do miejsca pracy oraz poziom inteligencji. Widzimy również, że sposób sformułowania pytania badawczego narzuca konkretny sposób odpowiedzi. Przykładowo, na pytanie „czy poziom kompetencji menadżerskich zależy od poziomu inteligencji” można odpowiedzieć na dwa sposoby „tak, poziom kompetencji menadżerskich zależy od poziomu inteligencji” lub „nie, poziom kompetencji menadżerskich nie zależy od poziomu inteligencji”. Jeśli na dane pytanie badawcze nie da się udzielić konkretnej odpowiedzi to oznacza, że jest ono postawione źle.

Mimo, że pytania badawcze są zwykle bardziej szczegółowe niż problem badawczy to nadal poziom tej precyzji nie jest idealny. Wskazują już na to, jakie konstrukty mają zostać uwzględnione w analizie, jednak nadal nie wiadomo jak będą one mierzone (zoperacjonalizowane). Dotyczy to zarówno zmiennej wyjaśnianej jak i zmiennych wyjaśniających. Być może wykształcenie będzie wyrażone od podstawowego do wyższego i wtedy należy będzie wykonać analizę korelacji, a może porównywane będą osoby z wykształceniem wyższym magisterskim i wykształceniem wyższym doktorskim. Z kolei w przypadku dopasowania do miejsca pracy, może być ono mierzone rozbudowanym standaryzowanym kwestionariuszem, krótkim kwestionariuszem autorskim lub nawet jednym pytaniem w stylu „jak oceniasz swój poziom dopasowania do miejsca pracy rozumiany jako (…)” (trafność i rzetelność takiego pytania to inna kwestia 😉 ) Większą precyzję można uzyskać stawiając hipotezy, ale jak zaraz zobaczymy, nie zawsze jest to takie proste.

Krok trzeci – stawiamy hipotezy badawcze

Hipoteza badawcza to zdanie twierdzące, dotyczące przewidywanego wyniku badania, skonstruowanego w celu uzyskania odpowiedzi na pytanie badawcze. Innymi słowy – hipoteza jest sugerowaną odpowiedzią na pytanie badawcze. Zobaczmy w poniżej ramce jak mogłyby brzmieć hipotezy w naszym przykładzie.

Problem badawczy

Jakie są uwarunkowania rozwoju kompetencji menadżerskich?
Pytania badawcze

1. Czy istnieje związek między poziomem kompetencji menadżerskich a wykształceniem?
2. Czy istnieje związek między poziomem kompetencji menadżerskich a poziomem dopasowania do miejsca pracy?
3. Czy istnieje związek między poziomem kompetencji menadżerskich a poziomem inteligencji?

Hipotezy badawcze

1. Istnieje związek między poziomem kompetencji menadżerskich a wykształceniem.
2. Istnieje związek między poziomem kompetencji menadżerskich a poziomem dopasowania do miejsca pracy.
3. Istnieje związek między poziomem kompetencji menadżerskich a poziomem inteligencji. 

 

Widzimy, że w tym przypadku sformułowanie odpowiednich hipotez badawczych na podstawie pytań badawczych jest łatwe. Każdemu pytaniu odpowiada jedna hipoteza, a formułuje się ją poprzez prostą zamianę treści pytania – w tym przypadku usuwany z pytania po prostu „czy” oraz „?”. Technicznie rzecz biorąc ograniczyło się to do wykonania operacji kopiuj-wklej i kilku dodatkowych stuknięć w klawiaturę. Jednak niestety, ale nie zawsze jednak jest to takie proste – pokażemy to w dalszej części artykułu, omawiając hipotezy kierunkowe i niekierunkowe.

Zazwyczaj każdemu pytaniu badawczemu odpowiada hipoteza, jednak są od tego wyjątki. Dzieje się tak w przypadku badań eksploracyjnych, w których analizujemy kwestie, które nie mają silnych podstawy w teorii i wynikach innych badań. W takiej sytuacji pytania badawcze pozostawiamy bez „odpowiedzi” w postaci hipotezy (Krajewski, 2010).  W niektórych badaniach naukowych część pytań badawczych może mieć charakter eksploracyjny, a część nie. Oznacza to, że niektóre z nich mogą mieć swój odpowiednik w postaci hipotezy, a niektóre nie.

Hipotezy dotyczące związku i różnic

Hipotezy badawcze sformułowane w powyższym przykładzie dotyczą związków/zależności, a więc nazywa się je hipotezami dotyczącymi związku i testuje w analizie korelacji. Nie jest to jednak jedyny typ hipotez, ponieważ poza analizą korelacji istnieje wiele innych. Drugim najczęściej stawianym typem są hipotezy dotyczące różnicy. Przykładowo, moglibyśmy postawić hipotezę (i oczywiście odpowiadające mu pytanie badawcze) dotyczącą zróżnicowania poziomu kompetencji menadżerskich u kobiet i mężczyzn. Mogłaby ona brzmieć w sposób następujący: „Płeć różnicuje poziom kompetencji menadżerskich” lub „Istnieje istotna statystycznie różnica między kobietami i mężczyznami w zakresie poziomu kompetencji menadżerskich”. Jednocześnie poza nimi istnieją inne rodzaje hipotez, na przykład dotyczące zgodności rozkładu z rozkładem teoretycznym (np. rozkładem normalnym) albo dotyczące dopasowania modelu regresji. W tym wpisie poświęcimy im jednak niewiele uwagi.

Hipotezy kierunkowe i niekierunkowe

Wcześniej mówiliśmy o tym, że hipoteza to odpowiedź na pytanie badawcze, które dotyczy przewidywanego wyniku. Jednocześnie podaliśmy przykłady hipotez, które niekoniecznie takimi są. Dlaczego? Ponieważ były one postawione w schemacie „Istnieje zależność między X a Y”. Nie jest to jakieś niesamowicie precyzyjne przewidywanie, ponieważ nie obejmuje tego jaki jest charakter tej zależności, czy jest ona dodania czy ujemna. Taki rodzaj hipotez nazywany hipotezami niekierunkowymi (alternatywnie – hipotezami bezkierunkowymi). Alternatywnie, możemy stawiać hipotezy, które wskazują na charakter występującego efektu – nazywamy je hipotezami kierunkowymi. W przypadku korelacji wskazywać będą one na konkretny jej kierunek (dodatni lub ujemny). Zatem tak jak hipoteza niekierunkowa stworzona została w schemacie „Istnieje zależność między X a Y” tak hipoteza kierunkowa stworzona zostałaby według wzorca „wraz ze wzrostem X maleje Y” (korelacja ujemna) lub „wraz ze wzrostem X rośnie Y” (korelacja dodatnia).

W poniższej ramce przedstawiony został schemat tworzenia hipotez kierunkowych i niekierunkowych na podstawie pytań badawczych, a ponadto pokażemy, jak robić to osobno dla hipotez dotyczących związków oraz hipotez dotyczących różnicy.

SCHEMAT STAWIANIA PROBLEMÓW I HIPOTEZ BADAWCZYCH DOTYCZĄCYCH RÓŻNIC I ZWIĄZKU

 

Pytania i hipotezy dotyczące związku
Pytanie badawcze
Czy występuje związek między X a Y?

Możliwe do postawienia hipotezy badawcze
I. Hipoteza niekierunkowa:
X jest związane z Y
II. Hipotezy kierunkowe:
Efekt dodatni: Wraz ze wzrostem X wzrasta Y
Efekt ujemny: Wraz ze wzrostem X maleje Y

Pytania i hipotezy dotyczące różnicy
Pytanie badawcze
Czy występuje różnica między A i B pod względem Y?

Możliwe do postawienia hipotezy badawcze
I. Hipoteza niekierunkowa:
Między A i B występuje różnica pod względem Y
II. Hipotezy kierunkowe:
Efekt dodatni: A charakteryzuje większe nasilenie Y niż B
Efekt ujemny: A charakteryzuje mniejsze nasilenie Y niż B

Omówienie tabeli
1. Dla danych zmiennych można postawić tylko jedną z trzech hipotez! Albo hipotezę niekierunkową, albo jedną z hipotez kierunkowych.
2. Hipotezy można formułować na różne sposoby. Przykładowo zamiast „Występuje związek między wiekiem a poziomem zarobków” można napisać „Wiej jest skorelowany z poziomem zarobków”. A zamiast „Występuje różnica między kobietami i mężczyznami pod względem zarobków” można napisać „Płeć różnicuje poziom zarobków”.

 

Skąd mamy wiedzieć czy hipotezy, które chcemy postawić mają być kierunkowe czy niekierunkowe? Odpowiedź jest prosta – hipotezy kierunkowe stawiamy wtedy, gdy na bazie wyników innych badań i wiedzy opartej o literaturę przewidujemy konkretny kierunek mierzonego efektu (w pracach dyplomowych niektórzy promotorzy proszą nawet studentów o to, aby pod każdą hipotezą stworzone zostało jej omówienie – z odniesieniem do konkretnej literatury).  Jeśli takich przypuszczeń nie mamy, bo na przykład nie istnieją badania w temacie, który podejmujemy (ezadko to się zdarza, ponieważ po pierwsze, badania są i były prowadzone praktycznie w każdym obszarze, więc ciężko być pionierem, a po drugiej metoda naukowa z założenia polega na stopniowym gromadzeniu wiedzy, gdzie każdy badacz dokłada swoją cegiełkę do tych już istniejących. Hipotezy niekierunkowe są stawiane zatem najczęściej albo przez geniuszy w danym temacie, albo przez osoby, które nie znają dobrze teorii w danym zakresie.) to stawiamy hipotezę niekierunkową. Oczywiście mając kilka hipotez, nie ma problemu w tym, aby część z nich była kierunkowa, a część niekierunkowa 🙂

Hipotezy ogólne/główne i szczegółowe

Rozważaliśmy wcześniej, że problem badawczy jest uogólniony i w efekcie można rozwiązać go na różne sposoby. Zapoznając się z przykładami pytań badawczych i hipotez zobaczyliśmy, że są one jego rozwinięciem i wskazują na sposób jego rozwiązania. Jednak nadal, nie zawsze stawiane hipotezy charakteryzuje odpowiedni poziom szczegółowości. Często bowiem kwestionariusze mierzą nie jedną właściwość ogólną, a wiele jej aspektów. W naszym studium przypadku konstruktem teoretycznym są “kompetencje menadżerskie”. Możemy sobie wyobrazić istnienie kwestionariusza, za pomocą którego można dokonać pomiaru jej czterech aspektów, wyrażanych poprzez trzy podskale i jedną skalę ogólną:
– zdolności organizacyjnych i delegowania zadań
– umiejętności udzielania informacji zwrotnych
– zdolności przywódczych
– ogólnych kompetencji menadżerskich (która jest sumą pozostałych)

W tym przykładzie mamy zatem owszem jeden konstrukt, jednak wyrażony poprzez cztery wskaźniki. Dlatego też postawienie jednej hipotezy to za mało. Możemy jednak potraktować ją jako hipotezę ogólną/główną i rozwinąć ją dodatkowo do postaci dodatkowych hipotez szczegółowych. Rozważmy to dla jednej z hipotez badawczych.

Hipoteza główna
Istnieje związek między poziomem kompetencji menadżerskich a poziomem inteligencji.

Hipotezy szczegółowe

1. Istnieje związek między zdolnościami organizacyjnymi i delegowania a poziomem inteligencji.
2. Istnieje związek między umiejętnością udzielania informacji zwrotnej a poziomem inteligencji.
3. Istnieje związek między zdolnościami przywódczymi a poziomem inteligencji.
4. Istnieje związek między ogólnymi kompetencjami menadżerskimi a poziomem inteligencji.

 

W analogiczny sposób należałoby rozpisać pozostałe hipotezy badawcze. Wydaje się to proste, jednak czasami prowadzi do „dziwnych” efektów. Jeśli naszym zadaniem jest rozpisanie 4 hipotez ogólnych np. w 12 hipotez szczegółowych to nie ma problemu. Wystarczy jednak, że nasze badanie dotyczyć będzie związku między kilkoma wielowymiarowymi konstruktami. Wyobraźmy sobie, że 4 wskaźniki kompetencji menadżerskich chcemy powiązać nie z jednym, ogólnym wskaźnikiem inteligencji, a z 4. W rezultacie, z jednej hipotezy ogólnej otrzymamy 16 hipotez szczegółowych. Jeśli w naszym badaniu kilku konstruktów będzie wielowymiarowych to możemy uzyskać jeszcze więcej hipotez szczegółowych, np. 60, 80 czy 100.

Co możemy zrobić w takiej sytuacji? Czy na prawdę w takiej sytuacji zmuszeni jesteśmy do stawiania dziesiątek hipotez, których rozpisanie może zająć wiele stron? Niekoniecznie. W takiej sytuacji sugerujemy postawienie jedynie hipotez ogólnych, bez rozwijania ich w hipotezy szczegółowe. Należy wtedy szczególnie zadbać o dokładny opis użytych narzędzi oraz operacjonalizacji zmiennych, po to, aby nie było wątpliwości co do wskaźników poszczególnych konstruktów.

Weryfikacja hipotez

Hipotezy stawia się po to, aby można było je zweryfikować. Oznacza to, że wyniki analizy statystycznej powinny w sposób konkretny i niepozostawiający wątpliwości prowadzić do decyzji: hipoteza została potwierdzona vs hipoteza została odrzucona. Dokładnie tak dzieje się w odniesieniu do hipotez szczegółowych, jednak w przypadku hipotez ogólnych bywa inaczej. Nastręcza to pewne trudności interpretacyjne. Aby to rozważyć powróćmy do poprzedniego przykładu.

Hipoteza główna
Istnieje związek między poziomem kompetencji menadżerskich a poziomem inteligencji.

Hipotezy szczegółowe

1. Istnieje związek między zdolnościami organizacyjnymi i delegowania a poziomem inteligencji.
2. Istnieje związek między umiejętnością udzielania informacji zwrotnej a poziomem inteligencji.
3. Istnieje związek między zdolnościami przywódczymi a poziomem inteligencji.
4. Istnieje związek między ogólnymi kompetencjami menadżerskimi a poziomem inteligencji.

 

Aby zweryfikować te hipotezy należy wykonać analizę korelacji. Jej wynik zostanie zaprezentowany w formie macierzy korelacji 1×4, gdzie każdy z czterech wyników odpowiadać będzie jednej hipotezie szczegółowej – każdej z nich odpowiadać będzie jedna wartość p. Tabela taka została przedstawiona poniżej.

Tabela

Wyniki analizy korelacji r Pearsona testującej związek między kompetencjami menadżerskimi a poziomem inteligencji

Poziom inteligencji
r p
Zdolności organizacyjne i delegowania zadań 0,22 0,047
Umiejętności udzielania informacji zwrotnych 0,04 0,659
Zdolności przywódcze 0,34 0,012
Ogólne kompetencje menadżerskie 0,18 0,179

Adnotacja. Wartości p < 0,05 zostały zapisane pogrubioną czcionką.

Wynik powyższej analizy wskazuje na to, że poziom inteligencji związany jest istotnie statystycznie (dodatnio) z dwoma podskalami kompetencji menadżerskich, natomiast z trzecią podskalą oraz skalą ogólną nie. Oznacza to, że nie da się w konkretny sposób zweryfikować postawionej hipotezy ogólnej. Związana jest ona przecież z pytaniem o to „czy ogólnie rzecz biorąc kompetencje menadżerskie są dodatnio związane z poziomem inteligencji”, a odpowiedź na to pytanie brzmiałaby „trochę tak, a trochę nie” lub „częściowo tak”. Możemy jednak zweryfikować hipotezy szczegółowe i w tym przypadku dwie z nich zostają przyjęte, a dwie nie.

Co zrobić w analogicznej sytuacji, jeśli zgodnie z wcześniejszą sugestią tworzymy jedynie hipotezy ogólne, a szczegółowe już nie? Wtedy najczęściej pisze się o „częściowym potwierdzeniu się hipotezy” wraz z dokładnym wyjaśnieniem, które jej „elementy” czy „części” się potwierdziły, a które nie. Słowo „elementy” oraz „części” pojawiają się w cudzysłowie, ponieważ hipoteza nie posiada przecież żadnych elementów. Taka interpretacja jest błędna. Mimo tego jest często stosowanym kompromisem pomiędzy pisaniem z osobna o potwierdzeniu każdej z (czasami kilkudziesięciu) hipotez, a niepisaniem niczego. Naszym zdaniem najważniejszym jest, aby posiadać wiedzę w tym zakresie, zdawać sobie sprawę z tych problemów i ograniczeń i z tego poziomu podejmować decyzje (zamiast, aby decyzje opierały się na niewiedzy).

Niestety, ale powyższe kwestie powodują, że stawiania hipotez nie zawsze podlega jasnej standaryzacji i zależy od kontekstu pisanej pracy badawczej. Co więcej, to nie koniec – zagadnienia związane ze stawianiem hipotez mają jeszcze więcej niuansów.

Hipoteza zerowa a hipoteza alternatywna

Klasyfikacja, według której dzielimy hipotezy na ogólne i szczegółowe nie jest jedyna. Poza nią istnieje również osobny podział na hipotezę zerową oraz hipotezę alternatywną. W tym artykule nie chcemy rozwijać mocno tego zagadnienia, ponieważ zależy nam na tym, aby ugryźć omawiany temat w sposób praktyczny od strony metodologicznej. Temat hipotezy zerowej i alternatywnej dotyczy z kolei zagadnienia hipotez statystycznych, związanych z testami statystycznymi (gdzie w zasadzie każdy test statystyczny testuje inną hipotezę), a więc statystyką jako taką, jako dziedziną matematyki.

W związku z tym sygnalizujemy istnienie tego dodatkowego podziału i w poszukiwaniu jego omówienia odsyłamy do innych źródeł – wpisu dotyczącym hipotezy zerowej i alternatywnej (klik) w naszym słowniczku oraz artykule opublikowanym na (klik) Blogu Statystycznym Krystyny Piątkowskiej.

Od strony praktycznej – czasami w rozdziale z opisem metody stawia się tylko „hipotezy” (a więc realnie ogólną hipotezę badawczą będącą hipotezą alternatywną, wtedy istnienie hipotezy zerowej traktuje się jako domyślne), a czasami wszystkie hipotezy szczegółowe rozbija się dodatkowo na osobną hipotezę zerową i alternatywną. Rekomendujemy w tym zakresie dokładnie to co w przypadku dylematu związane ze stawianiem hipotez ogólnych i szczegółowych – jeśli hipotez badawczych mamy w naszym badaniu niewiele (np. jedną, dwie lub kilka) to można rozbić je na hipotezy szczegółowe i każdej przyporządkować dodatkowo hipotezę badawczą i alternatywną. Jeśli jednak hipotez badawczych mamy wiele i musielibyśmy rozbijać je na setki hipotez szczegółowych, zerowych i alternatywnych to polecamy tego nie robić i pozostać przy ogólnych hipotezach badawczych. Aby temat nie był jedynie abstrakcyjny, w dalszej części artykułu pokażemy przykłady tego jak stawiać hipotezy i dla niektórych z nich zostanie również uwzględniony podział na hipotezę zerową i alternatywną.

Uważamy, że nie należy się też nadmiernie przejmować tym czy w naszej pracy pojawią się hipotezy szczegółowe, zerowe i alternatywne. Jeśli jesteśmy w stanie postawić je wszystkie bez poświęcania na to 5 stron formatu A4 to świetnie. Jednak naszym zdaniem ważniejsza jest ogólna jakoś naszego badania – czy jest dobrze ugruntowane w teorii, jest dobrze zaprojektowane i posiada poprawnie sformułowany problem badawczy i pytania badawcze. Jeśli tak się dzieje, to z wyników analizy jesteśmy w stanie wyciągnąć właściwe wnioski, a na podstawie tego możemy napisać wartościową (klik) dyskusję wyników, niezależnie od tego na jakim poziomie szczegółowości sformułowane zostały hipotezy. Rekomendacja ta wynika z tego, że widzimy wiele prac dyplomowych, które są po prostu źle zaprojektowane i albo hipotez w nich zawartych nie da się zweryfikować, albo da się to zrobić, ale nic konkretnego (na poziomie teorii) z tego nie wynika. Po prostu poza kwestiami teoretycznymi istnieje też poziom pragmatyczny, które warto uwzględnić.

Jak poprawnie formułować hipotezy?

W jaki sposób poprawnie formułować hipotezy? Przede wszystkim muszą one opierać się (chociażby pośrednio) na teorii i badaniach innych autorów. Dobrze jest również postawić je na samym początku – przed wykonaniem analizy statystycznej, a nawet przed rozpoczęciem pisania teorii i zaprojektowaniem badania. Załóżmy, że interesuje nas zagadnienie uwarunkowań pojawienia się wypalenia zawodowego. Zaczynamy od zapoznania się z literaturą przedmiotu, np. przeczytania kilku artykułów. W trakcie lektury okazuje się, że większość dotychczas przeprowadzonych badań dotyczyło tego jak wypalenie zawodowe warunkowane jest przez środowisko pracy oraz cechy osobowościowe. W ten sposób zyskujemy jakiś „punkt zaczepienia”. Na podstawie tego możemy sformułować ogólny problem badawczy, a następnie zacząć stawiać pytania badawcze i odpowiadające im hipotezy. Możemy rozpisać je bardzo dokładnie „na papierze”, ale jeśli mamy takie umiejętności i się nie pogubimy, to na tym etapie wystarczy je tylko przemyśleć. Posiadając hipotezy łatwiej nam będzie zaprojektować dobre badanie, które pozwoli nam uzyskać interesujące nas wnioski.

Określając hipotezy warto od razu zastanawiać się w jaki sposób będą one weryfikowane. To doskonały test na to czy dana hipoteza jest prawidłowa. Przykładowo, jeśli chcemy przetestować „związek między stażem pracy, a poziomem wypalenia zawodowego” to nie jest tajemnicą, że w tym celu należy wykonać analizę korelacji między stażem pracy, a wskaźnikami wypalenia zawodowego obliczonego za pomocą jakiegoś kwestionariusza. Z kolei gdybyśmy chcieli sprawdzić „czy poziom wiedzy pielęgniarek w zakresie pierwszej pomocy przedmedycznej jest wystarczający” to szybko okaże się, że nie istnieje test statystyczny, który to sprawdzi, w związku z tym hipotezy nie da się zweryfikować, a więc nie należy jej stawiać (jednocześnie, niestety jest to bardzo popularny rodzaj hipotez stawianych przez studentów, szczególnie pielęgniarstwa lub położnictwa). W takiej sytuacji warto pomyśleć o tworzeniu hipotez dotyczących zależności poziomu wiedzy od innych zmiennych.

Formułując hipotezy warto pamiętać o stosowaniu precyzyjnych określeń. Jeśli piszemy pracę o „satysfakcji z życia” to dokładnie tego sformułowania używajmy, bez tworzenia „synonimów” w stylu „jakości życia” czy nawet „zadowolenia z życia”. Między różnymi, pozornie podobnymi konstruktami istnieją często znaczące teoretyczne różnice, a poza tym takie wymienianie pojęć skutkuje zamieszaniem przy interpretacji informacji zawartych w metodologii i rozdziale z wynikami. Podobnie, wyjaśniając znaczenie danego konstruktu (zarówno w metodologii jak i później w rozdziale z wynikami :)) należy posługiwać się oryginalnymi definicjami stworzonymi przez autora danego konstruktu czy narzędzia badawczego. Przykładowo definiując „style radzenia sobie ze stresem” (to często badany konstrukt u studentów psychologii) duże znaczenie ma to, czy dotyczą one „skłonności do radzenia sobie ze stresem przy użyciu konkretnego stylu” czy „częstości stosowania danego stylu” – choć różnica między tymi definicjami wydaje się subtelna, to na poziomie teoretycznym ma ona duże znaczenie.

Kiedy wiemy co zostanie poddane analizie możemy przejść do kolejnych elementów – sformułowania tematu pracy oraz nakreślenia ogólnych ram dla rozdziału teoretycznego. Oczywiście jest to kolejność zalecana, można też sformułować hipotezy po napisaniu teorii. Warto jednak, aby projektując badanie wiedzieć jakie analizy zastosujemy, ponieważ ma to wpływ na wymaganą wielkość próby. Przykładowo, do wykonania analizy regresji wielozmiennowej potrzebne jest więcej obserwacji niż do analizy korelacji. Zdarza się, że badacz zbiera dane do analizy korelacji, a gdy wpada na pomysł wykonania analizy regresji okazuje się, że nie jest to możliwe z powodu braku odpowiedniej liczby zebranych obserwacja. Konkluzja jest zatem taka, że hipotez nie stawia się w oderwaniu od całości – wszystkie elementy pracy muszą być spójne, ponieważ obowiązuje tu efekt domina – każdy pojedynczy błąd ogranicza rozwój kolejnych elementów układanki i w konsekwencji pływa na całość efektu.

Kilka słów na koniec – trochę smutne podsumowanie

Tworzenie hipotez (a także pytań badawczych i problemu badawczego) bywa łatwe lub trudne, w zależności od stopnia skomplikowania badania, jego schematu, liczby zmiennych oraz planu analizy. Panuje w tym zakresie trochę „dziki zachód”, mówiąc językiem psychometrii powiedzielibyśmy, że tworzenie metodologii nie podlega ścisłej standaryzacji (w przeciwieństwie do raportowania wyników analizy statystycznej). Podręczniki do metodologii badań i psychometrii ukazuję te zagadnienia na różne sposoby, często w sposób mało praktyczny, a niektórzy promotorzy mają swoje własne standardy (czasami poprawne, a czasami nie) bazujące na ich własnej praktyce. W końcu, istnieją konkretne dylematy dotyczące stawiania hipotez ogólnych vs szczegółowych (jak na złość do tego dochodzą też hipotezy zerowe i alternatywne, kierunkowe i bezkierunkowe), gdzie czasami warto pójść na kompromis i z przedstawiania pewnych elementów świadomie zrezygnować. Mamy nadzieję, że udało nam się pokazać jak najwięcej, zapraszamy jeszcze do zapoznania się z konkretnymi przykładami.

Jak stawiać pytania i hipotezy badawcze? PRZYKŁADY 

JAK STAWIAĆ HIPOTEZY? PRZYKŁAD 1 

 

Problem badawczy
Wpływ aktywizacji stereotypu kobiety tradycyjnej na samoocenę kobiet.

Pytanie badawcze
Czy aktywizacja stereotypu kobiety tradycyjnej różnicuje poziom samooceny kobiet?

Hipoteza badawcza
Aktywizacja stereotypu kobiety tradycyjnej różnicuje poziom samooceny kobiet.

Hipoteza zerowa
Kobiety którym aktywizowano stereotyp kobiety tradycyjnej nie różnią się pod względem poziomu samooceny od kobiet z grupy kontrolnej.

Hipoteza alternatywna
Kobiety którym aktywizowano stereotyp kobiety tradycyjnej charakteryzują się wyższym poziomu samooceny od kobiet z grupy kontrolnej.

Omówienie przykładu
Przykład ten dotyczy badanie eksperymentalnego, w którym grupie eksperymentalnej aktywizowano stereotyp kobiety tradycyjna, a grupa kontrolna nie była poddana żadnej manipulacji. Obie grupy porównano potem pod względem samooceny, zakładamy, że mierzonej jednym, ogólnym wskaźnikiem – stąd pojawia się tylko jedna hipoteza badawcze, bez hipotez szczegółowych. Oprócz niej, postawiono również hipotezę zerową (która zawsze zakłada brak istnienia danego efektu) a także hipotezę alternatywną. Ta ostatnia ma charakter kierunkowy, ponieważ wskazujemy dokładnie jaki będzie wynik manipulacji eksperymentalnej, to znaczy czy w jej efekcie poziom zmiennej zależnej ulegnie obniżeniu.

 

JAK STAWIAĆ HIPOTEZY? PRZYKŁAD 2

 

Problem badawczy
Celem badania jest ustalenie zależności między prężnością psychiczną a punktualnością realizacji zadań rozwojowych u młodych dorosłych uzależnionych i nieuzależnionych od substancji psychoaktywnych. a także porównanie nasilenia tych konstruktów w obu grupach.

Pytania badawcze
1. Czy istnieje różnica w zakresie poziomu prężności psychicznej między osobami uzależnionymi od substancji psychoaktywnych a osobami nieuzależnionymi?
2. Czy istnieje różnica w zakresie punktualności realizacji zadań rozwojowych między osobami uzależnionymi od substancji psychoaktywnych a osobami nieuzależnionymi?
3. Czy prężność psychiczna u młodych uzależnionych i nieuzależnionych ma związek z punktualnością realizacji zadań rozwojowych?

Hipotezy badawcze
1. Prężność psychiczna będzie niższa u osób uzależnionych od substancji psychoaktywnych w porównaniu z grupą osób nieuzależnionych.
2. Poczucie punktualności realizacji zadań rozwojowych będzie większe u osób, które nie są uzależnione od substancji psychoaktywnych w porównaniu z grupą osób uzależnionych.
3a. Im większa jest punktualność realizacji zadań rozwojowych u osób uzależnionych tym wyższy jest ich poziom prężności psychicznej.
3b. Im większa jest punktualność realizacji zadań rozwojowych u osób nieuzależnionych tym wyższy jest ich poziom prężności psychicznej.

Omówienie przykładu
W problemu badawczym ujęto zarówno porównania grup jak i korelacje. Postawiono trzy pytania badawcze. Dwa pierwsze dotyczą porównania między grupami, a trzecie z nich wskazuje na korelacje między zmiennymi – osobno u osób uzależnionych i nieuzależnionych. Dlatego też postawiono cztery hipotezy, gdzie trzecie pytanie badawcze zostało rozwinięte w dwie hipotezy (3a i 3b), dotyczące korelacji w każdej z grup z osobna. Postawione hipotezy są kierunkowe – ta dotycząca porównania przewiduje, w której grupie wynik będzie wyższy, a te dotyczące związków wskazują na spodziewany ich kierunek. W tym przykładzie postawione zostały jedynie hipotezy ogólne. Zakładamy bowiem, że w tym przypadku konstrukty punktualności realizacji zadań rozwojowych i prężności są mierzone jednym wskaźnikiem.

 

JAK STAWIAĆ HIPOTEZY? PRZYKŁAD 3

 

Problem badawczy
Zależność między obrazem ciała kobiet i poziomu ich dobrostanu.

Pytania badawcze
1. Czy obraz ciała kobiet związany jest z ich poziomem depresji?
2. Czy obraz ciała kobiet związany jest z ich poziomem jakości życia kobiet?

Hipotezy ogólne
1. Im bardziej pozytywny jest obraz ciała kobiet tym mniejszy jest ich poziom depresji.
2. Im bardziej pozytywny jest obraz ciała kobiet tym wyższa jest ich jakość życia.

Hipotezy szczegółowe
1. Im bardziej pozytywna jest percepcja atrakcyjności fizycznej kobiet tym mniejszy jest ich poziom depresji.
2. Im bardziej pozytywna jest percepcja kontroli wagi kobiet tym mniejszy jest ich poziom depresji.
3. Im bardziej pozytywna jest percepcja kondycji fizycznej kobiet tym mniejszy jest ich poziom depresji.
4. Im bardziej pozytywny jest ogólny obraz ciała kobiet tym mniejszy jest ich poziom depresji.
5. Im bardziej pozytywna jest percepcja atrakcyjności fizycznej kobiet tym wyższa jest ich jakość życia.
6. Im bardziej pozytywna jest percepcja kontroli wagi kobiet tym wyższa jest ich jakość życia.
7.Im bardziej pozytywna jest percepcja kondycji fizycznej kobiet tym wyższa jest ich jakość życia.
8. Im bardziej pozytywny jest ogólny obraz ciała kobiet tym wyższa jest ich jakość życia.

Omówienie przykładu
Postawiono ogólny problem badawczy, który rozwinięto w dwa pytania badawcze. Sposób ich sformułowania wskazuje na fakt, że poziom dobrostanu jako konstrukt ogólny posiada dwa wskaźniki – poziom depresji oraz jakości życia (ujęte w pytaniach badawczych). Dwóm pytaniom badawczym odpowiadają dwie analogiczne hipotezy ogólne. Zostały one rozwinięte w osiem hipotez szczegółowych – cztery pierwsze dotyczą pierwszej hipotezy ogólnej, a cztery ostatniej – drugiej hipotezy ogólnej. W hipotezach szczegółowych ogólny konstrukt obrazu ciała zoperacjonalizowano, odnosząc się do czterech jego wskaźników – trzech szczegółowych oraz jednego ogólnego (wykorzystano narzędzie SOC – Skala Oceny Ciała). Wszystkie postawione hipotezy są kierunkowe, wskazując na spodziewany kierunek relacji między zmiennymi. Poziom depresji i jakość życia mierzymy narzędziami, z których wylicza się tylko jeden wskaźnik – wynik ogólny.

Streszczenie artykułu

– problem badawczy to ogólny zarys tego czego badanie dotyczy i jakie ma przynieść wnioski; można zrealizować go na różne sposoby
– pytania badawcze stanowią uszczegółowienie problemu badawczego, określają w jaki sposób ma zostać spełniony cel badania
– hipoteza to stwierdzenie dotyczące przewidywanego wyniku badania, będące jednocześnie odpowiedzią na postawione pytanie badawcze
– zazwyczaj pytanie badawcze ma swój odpowiednik w postaci hipotezy; jeśli jednak ma ono charakter eksploracyjny to nie musi zostać rozwijane do postaci hipotezy
– istnieją różne rodzaje hipotez, najczęściej stawiane są te dotyczą związku (testowane w analizie korelacji) oraz różnicy (weryfikowane za pomocą testów różnic), choć istnieją też inne ich rodzaje, np. dotyczące zgodności rozkładu z rozkładem teoretycznym (np. normalnym)
– możemy stawiać hipotezy kierunkowe lub niekierunkowe – kierunkowe to takie, które zakładają konkretny kierunek efektu (np. związek dodatni lub ujemny); hipotezy kierunkowe zakładają efekt, ale bez wskazywania jego kierunku (np. wskazują na związek, ale bez określania czy jest on dodatni czy ujemny)
– hipoteza ogólna dotyczy badanych konstruktów; te posiadają jednak często wiele wskaźników (np. podskal kwestionariusza), stąd hipotezy ogólne dodatkowo rozwija się w dodatkowe hipotezy szczegółowych, które dotyczą poszczególnych wskaźników danego konstruktu
– jeśli w badaniu dokonujemy pomiaru wielu wielowymiarowych konstruktów to możliwe, że musielibyśmy postawić kilkadziesiąt hipotez szczegółowych – w takiej sytuacji rekomendujemy zaprzestać na sformułowaniu hipotez ogólnych i szczególnie zadbać o to o precyzyjny opis wyników oraz dokładną ich dyskusję
– z punktu widzenia zagadnienia testowania hipotez statystycznych istnieje dodatkowy podział na hipotezę zerową i alternatywną
– formułowane hipotezy muszą: opierać się na teorii, być sformułowane w sposób precyzyjny, być możliwe do zweryfikowania
– stawiając hipotezy warto równolegle myśleć o tym w jaki sposób będą one weryfikowane, za pomocą jakich testów statystycznych; przy okazji to dobry sposób na sprawdzenie czy rzeczywiście dana hipoteza jest możliwa do przetestowania
– poszczególne elementy tekstu naukowego są ze sobą powiązane, należy zatem zadbać o spójność między nimi, m.in. przed zbieraniem danych należy określić jaka jest wymagana minimalna liczba obserwacji do zastosowania określonych testów statystycznych
– chcąc zaprojektować i wykonać analizę danych rzetelnie i profesjonalnie warto skonsultować się ze specjalistami – (klik) pogotowiestatystyczne.pl

 

Literatura
Brzeziński, J. (2019). Metodologia badań psychologicznych, Warszawa: Wydawnictwo Naukowe PWN.
Field, A. P. (2018). Discovering statistics using IBM SPSS statistics, 5th edition. London: SAGE Publications.
Francuz, P., Mackiewicz, R. (2007). Liczby nie wiedzą skąd pochodzą. Przewodnik po metodologii i statystyce nie tylko dla psychologów, Lublin: Katolicki Uniwersytet Lubelski.
Krajewski, M. (2020). O metodologii nauk i zasadach pisarstwa naukowego. Płock: WN NOVUM & Mirosław Krajewski.

      Autorem wpisu jest Andrzej Jankowski   

Charakterystyka próby badawczej – jak ją napisać?

 OTWÓRZ / POBIERZ ARTYKUŁ JAKO PLIK PDF  

 

Czym jest charakterystyka próby?

Badania naukowe najczęściej przeprowadzane są na ludziach, choć oczywiście mogą dotyczyć też zwierząt (nie raz liczyliśmy wyniki dotyczące myszy, gęsi, a nawet… kleszczy!) czy innych zjawisk, np. samochodów (jakie są koszty naprawy klimatyzacji autobusów marki Solaris?) czy zjawisk naturalnych (czy wielkość wzrostu groszku pachnącego zależy od nasłonecznienia terenu?). Kogokolwiek lub cokolwiek badasz, musisz o tym jasno napisać w metodologii badania, w podrozdziale pt. charakterystyka próby badawczej. Jeśli badasz ludzi – napisz konkretnie czy to było 200 osób -w wieku 70-80 lat chorujących na padaczkę czy może 20 chłopców w wieku 12-13 lat uczących się w klasie sportowej w Warszawie. To ma znaczenie! Przede wszystkim, na podstawie tych informacji określić można na ile uzyskane wyniki są możliwe do zgeneralizowania (na inne populacje), a także odtworzyć badania przez innych naukowców.

W przypadku prac dyplomowych (głównie licencjackiej i magisterskiej, ale także doktorskiej) tworzenie charakterystyki próby to formalność – element procesu edukacji, w którym student udowadnia swoją znajomość struktury raportu z badania. Jest to rodzaj treningu przed późniejszym, ewentualnym zanurzeniem się w prawdziwą pracę naukową. Jednak w przypadku badań publikowanych, charakterystyka próby ma dużo większe znaczenie – umożliwia dokonywanie porównań między replikacjami badania (może wyniki w naszym badaniu są inne niż w tym, na które się powołujemy w teorii, bo badanie na studentach psychologii przynosi inne rezultaty niż na osobach ze wsi w wieku 40-50 lat?), a także może stanowić ważne źródło informacji w przypadku opracowywania metaanalizy (zbiorczej analizy wyników wielu badań z danego zakresu).

Po co zbierać dane socjodemograficzne?

Dane socjodemograficzne można wykorzystać w analizie statystycznej. Albo w prostych analizach korelacji (np. testując związek między wiekiem i wykształceniem a zmiennymi głównymi) lub porównań średnich (porównując kobiety i mężczyzn lub osoby ze wsi i z miast) albo w analizach bardziej zaawansowanych, kontrolując wpływ zmiennych socjodemograficznych na testowane efekty za pomocą analizy regresji, kowariancji czy modelowania równań strukturalnych.

Niezależnie od tego czy dane socjodemograficzne zostaną uwzględnione w analizie, mogą stanowić ważny materiał przydatny przy dokładniejszej interpretacji – wyników. Przykładowo, jeśli porównujesz dziewczyny i chłopców klasy 6B szkoły podstawowej w Starogardzie Gdańskim pod względem sprawności, warto zebrać też dane m.in. dotyczące uprawianych przez nich sportów. Może moje badania wykażą, że dziewczyny były sprawniejsze od chłopców nie dlatego, że takie zjawisko występuje w populacji, tylko dlatego że akurat w tej klasie były dwie dziewczyny trenujące na ogólnopolskim poziomie?  Albo załóżmy, że porównujesz schizofreników i osoby zdrowe psychicznie pod względem poziomu depresji i okazuje się, że Twoje są inne niż te uzyskane przez innych autorów. Posiadając dane demograficzne, takie jak długość chorowania, ilość hospitalizacji, rodzaj stosowanego leczenia, możesz porównać badane próby między sobą, aby określić czy rzeczywiście pochodzą z jednej populacji. Może okazać się, że Twoja próba różniła się od innych, ponieważ objęła osoby o krótkiej historii choroby (średnio kilka lat), podczas gdy inne badania były robione na osobach chorujących w okresie kilkunastu lub kilkudziesięciu lat. Dzięki tym informacjom możesz domniemać, że różnice między badania mogą być (choć oczywiście nie muszą) efektem tych różnic (czyli realnie badałeś inną populację niż pozostali autorzy). Oczywiście wnioski z tych refleksji należy przedstawić w rozdziale z dyskusją wyników. Dzięki temu kolejne badania, Twoja lub innych autorów, będą mogły uwzględnić te różnice, co długofalowo sprzyja gromadzeniu ogólnej wiedzy dotyczącej danego zjawiska, czy całej dziedziny jaką jest psychologia kliniczna. Nawet, jeśli badasz populacje niekliniczne, np. pielęgniarki pracujące w szpitalu, warto zebrać dane dotyczące tego w jakim trybie pracują (nocnym czy dziennym), na jakim oddziale i jaki mają ogólny staż pracy.

Co uwzględnić w charakterystyce próby?

Jaki zakres informacji powinna obejmować charakterystyka próby? Według najnowszej, siódmej edycji podręcznika przedstawiającego zasady raportowania w standardzie APA (American Psychological Association, 2019), powinny być to podstawowe dane demograficzne, takie jak: wiek, płeć, wykształcenie czy status socjoekonomiczny. Dodatkowo, należy uwzględnić inne, ważne dane specyficzne dla danej próby, jeśli takie są. Które dane tego rodzaju są istotne? Czy wystarczą dwie czy trzy takie informacje czy może trzeba zebrać ich jak najwięcej? W tym względzie nie ma jasnych wytycznych, wszystko zależy od badanej populacji i przedmiotu badania. Również promotorzy mają w tym względzie zróżnicowane wymagania – niektórzy oczekują krótkiego opisu na kilka linijek, a inni obszernego opisu wraz z tabelami lub wykresami, zajmującego kilka stron. W artykułach naukowych korzysta się raczej z krótkiego opisu, można też spotkać zbiorcze zestawienia danych zawarte w tabeli.

Również w samym podręczniku dotyczącym standardu APA znajdziemy dwa, różniące się od siebie przykłady charakterystyki próby. Z jednej strony znajduje się w nim krótki przykład opisu próby w tekście:

Druga grupa obejmowała 40 kobiet w wieku pomiędzy 20, a 30 lat (M = 24,2; SD = 2,1; Mdn = 25,1), emigrantek z Salwadoru, posiadających przynajmniej 12 lat edukacji i będących stałymi rezydentami Stanów Zjednoczonych, mieszkających przynajmniej 10 lat w Waszyngtonie.

Źródło: Podręcznik APA 7th, s. 83
(podrozdział 3.6: Quantitive Method Standards)

A z drugiej strony bardziej rozległa charakterystyka próby, przedstawiona w formie tabeli

Mimo dużych różnic w objętości przedstawionych danych, obie charakterystyki, zgodnie z założeniem, przedstawiają podstawowe dane. Przydałoby się jednak więcej konkretnych informacji, umożliwiających dokonanie wyboru podczas projektowania badania lub raportowaniu wyników analizy.

Rekomendacje Pogotowia Statystycznego

Z racji tego, że wykonaliśmy tysiące analiz statystycznych, mamy duże doświadczenie zarówno w przygotowywaniu analizy danych socjodemograficznych, jak i wykorzystywaniu ich przy interpretacji wyników dotyczących weryfikacji hipotez. Jeśli Twoje badanie dotyczy popularnych konstruktów (takich jak poziom jakości życia czy radzenie sobie ze stresem), a próbą są osoby zdrowe z populacji ogólnej, zalecamy przede wszystkim zbieranie czterech podstawowych danych: płci, wieku, wykształcenia i miejsca zamieszkania. Opcjonalnie jako piątą zmienną, można włączyć stan cywilny, choć polecamy odejście od klasycznego, nieaktualnego w dzisiejszych czasach podziału, w którym to osoby w związku małżeńskim traktowane są jako realnie będące w związku, a te będące nawet w wieloletnim konkubinacie traktowane są jako “kawaler/panna” (czyli faktycznie poza trwałym związkiem). Polecamy przydzielić badanych do jednej z dwóch grup – będących w stałym związku (niezależnie jakiego charakteru) oraz niebędących w stałym związku.

Jeśli jednak badasz próbkę z jakiejś specyficznej populacji, z podstawowych danych socjodemograficznych możesz zebrać tylko płeć i wiek, a więcej uwagi poświęcić tym charakterystycznym dla danej populacji. Nie jest to jednak żelazna zasada, wszystko zależy od specyfiki populacji, ale nie tylko – istotny jest też przedmiot badania. Przykładowo, jeśli analizie poddajesz osoby z depresją, dane dotyczące ich specyfiki leczenia (np. stażu chorowania, obecnego nasilenia objawów, ilość i długości przyjmowania leków) będą istotne, jeśli porównujesz osoby z depresją leczone vs nieleczone psychoterapeutycznie, ponieważ mogą wchodzić one w interakcje ze zmiennymi głównymi. Jednak informacje te będą mniej przydatne, jeśli porównujesz osoby z depresją i osoby zdrowe psychicznie pod względem jakości życia. Analogicznie, szczegółowe dane socjodemograficzne przy grupach klinicznych zwykle nie są najważniejsze, jednak mogą być istotne, jeśli badanie dotyczy poziomu wiedzy dotyczącej doświadczanej choroby, ponieważ ta we wszystkich populacjach (osób zdrowych i różnych grup chorych) zależy od statusu socjodemograficznego. Dlatego pamiętaj, żeby zbierane dane były ważne z punktu widzenia zarówno charakteru badanej populacji jak i tego co konkretnie jest badane.

Warto zadbać o to, aby charakterystyka próby nie była nadmiernie rozbudowana – w raportowaniu wyników analiz statystycznych nie obowiązuje zasada pt. “im więcej tym lepiej” (zwięzłość i przejrzystość przedstawienia wyników to podstawowe wymaganie w standardzie APA). Z naszego doświadczenia wynika, że jeśli analiza zmiennych socjodemograficznych jest zbyt rozbudowana – albo objętościowo (zawiera się na czterech stronach) albo pod względem gęstości danych (zostaje ona przedstawiona w 40 wierszach w tabeli, a na dodatek w podziale na 5 podgrup) to staje się nieczytelna, a co za tym idzie trudna w interpretacji. Dlatego też, zalecamy trzymać się zasady  raportowania wszystkiego tego co konieczne, ale im mniej, tym lepiej.

Sztuką w statystyce jest nie tyle samo wykonanie obliczeń, co umiejętne pokazanie uzyskanych wyników, aby możliwa była ich względnie szybka interpretacja. Jeśli ktoś kiedykolwiek zajmował się analizą wielu tekstów naukowych w krótkim czasie (jest to potrzebne już przy pisaniu dobrego licencjatu) ten wie, że artykuły często czyta się pięcioma rzutami okiem – abstrakt, tabele, pojedyncze akapity podsumowania, i przechodzimy do kolejnego artykuł. Dlatego też mniejszy zbiór danych, np. dotyczący tylko czterech wyżej wymienionych zmiennych, można zaraportować w tekście. Jednak każdą większą ich ilość, lepiej umieścić w tabeli, tym bardziej jeśli w badaniu są wyróżnione grupy, dla których dane te można porównywać. Zamieszczenie danych w tabeli umożliwia szybką ich interpretację – najpierw ogarniamy wzrokiem całą tabelę, szybko orientujemy się jakie dane są w nich zawarte, wyciągamy wszystkie niezbędne dla nas informacje, porównujemy wartości w poszczególnych komórkach i w ciągu kilkunastu sekund uzyskujemy potrzebną orientacją. Interpretacja taka nie jest możliwa w przypadku dużej liczby danych przedstawionych w tekście. Z tego miejsca pozdrawiamy całe zastępy naszych klientów, których promotorzy zmuszali ich do raportowania charakterystyki próby w smutnej, rozwlekłej na kilka stron formie. Klienci – łączymy się z Wami w bólu. Promotorzy – wiedzcie, że w każdej takiej sytuacji ginie mały króliczek [*].

Raportowanie dużej liczby wyników w tabeli, a małej w tekście to nie nasz wynalazek, a wytyczna APA, opisana w podręczniku. Co więcej, zgodnie ze standardem APA 7th prezentacja tabelaryczna i tekstowa są równorzędne. Danych przedstawionych w tabeli nie należy powielać w tekście, choć dozwolone jest, aby wymienić te szczególnie ważne. Zatem, jeśli w swojej pracy wkleisz tabelę z 30 podanymi wartościami, nie musisz ich wszystkich przepisywać jeszcze raz w tekście (jeśli Twój promotor uważa inaczej – nie daj się “zrobić się w balona”), możesz co najwyżej podać kilka najważniejszych wartości (poniżej znajdują się przykłady). Po to umieszczasz dane w tabeli, aby każdy potencjalny czytelnik mógł je odczytać, w całości lub zwracając uwagę na interesujący go zakres. Powielenie wszystkiego w tekście utrudni jedynie ich interpretację. Mimo tego w tekście można nawiązać do najważniejszych danych w tabeli, jeśli ułatwi to jego odbiór.

Przykłady tworzenia charakterystyki próby

 

Przykład 1 – krótka charakterystyka próby w całości w tekście

W badaniu wzięło udział 77 osób, z czego 42 kobiet i 35 mężczyzn z diagnozą depresji, w wieku między 26, a 48 lat (M = 35,85; SD = 9,83). Każdy z badanych był w trakcie leczenia farmakologicznego, a dodatkowo 37 osób (48,05%) leczyła się obecnie lub w przeszłości psychoterapeutycznie.

 

Przykład 2 – krótki opis w tekście + tabela ze statystykami opisowymi

W badaniu wzięło udział 61 osób, z czego 22 kobiet i 39 mężczyzn, chorujących na stwardnienie rozsiane w postach rzutowo-remisyjnej. Wiek badanych mieścił się w przedziale 33, a 58 lat (M = 37,43; SD = 12,21). Wszyscy badani byli poddawani leczeniu farmakologicznemu. Dodatkowe dane dotyczące leczenia przedstawiono w tabeli 1.

 

Przykład 3 – krótki opis w tekście uzupełniony pełną charakterystyką w tabeli

W badaniu wzięło udział 98 osób, z czego 56 kobiet (57,1%) i 42 mężczyzn (42,9%) w wieku od 33 do 57 lat (M = 42; SD = 7,42) Największy ich odsetek stanowiły osoby mieszkające w dużych miastach, powyżej 500 tysięcy mieszkańców (45,9%) oraz legitymujące się wykształceniem średnim (35,7%) lub wyższym (32,7%).  Niewiele ponad połowa z nich była w związku (54,1%), a pozostałe 45,9% poza związkiem. Szczegółowe dane przedstawione są w tabeli 2.

 

Przykład 4 – rozbudowana charakterystyka próby w tabeli + krótki opis

W badaniu wzięło udział 101 osób, z czego 80 kobiet i 21 mężczyzn. Ich średni wiek wynosił 38,5 lat (SD = 11,05; Mdn = 37). Większość badanych stanowiły pielęgniarki (63,4%), najwięcej osób pracowało na Szpitalnym Oddziale Ratunkowym (56,4%). Największy odsetek badanych posiadał staż pracy powyżej 20 lat (31,7%) oraz charakteryzowało wykształcenie wyższe magisterskie (46,5%) oraz licencjackie (40,6%). Szczegółowa charakterystyka próby przedstawiono została w tabeli 3.

 

Pamiętaj o ważnych zasadach dotyczących raportowania wyników!

Na koniec przypominamy kilka istotnych zasad raportowania w standardzie APA. Część z nich będzie podsumowaniem informacji przedstawionych do tej pory, a część pojawi się po raz pierwszy.

  • Dla zmiennych nominalnych raportuj częstość i procent, z czego procent jest ważniejszy (i go lepiej pokazać na wykresie, zamiast częstości)
  • W przypadku zmiennych ilościowych raportujemy statystyki opisowe, z czego dwie najczęściej pokazywane to średnia i odchylenie standardowe. Czasami warto przedstawić też wartość minimalną i maksymalną (np. oprócz tego, że badani byli w wieku średnio M = 20,15; SD = 10,15 warto wiedzieć czy jego zakres to od 18 do 47 lat czy od 10 do 32). W sporadycznych przypadkach raportuje się też medianę.
  • Przy tworzeniu tabel lub opisu pamiętaj, że N to oznaczenie liczebności całej próby, natomiast właściwym oznaczeniem dla liczebności wyróżnionej podgrupy jest małe n (np. próba składała się z = 100 osób z czego n = 42 stanowiły kobiety a n = 58 mężczyźni).
  • Zapisuj symbole wszystkich statystyk (takich jak MSDMdnN) kursywą.
  • Przy zapisie wartości liczbowych, między znakami matematycznymi, a innymi elementami tekstu stosujemy spacje, np. M = 12,32; SD = 7,48. Oznacza to, że po obu stronach znaku równości znajdować się powinny spacje.

W razie pytań lub wątpliwości – zapraszamy do darmowych konsultacji!

Bibliografia
American Psychological Association. (2019). Publication manual of the American Psychological Association, Seventh Edition. Washington, DC: American Psychological Association.
Nęcka, R. Stocki. (2020). Jak pisać prace naukowe z psychologii. Kraków. Wydawnictwo Universitas.
Brzeziński J. (2019). Metodologia badań psychologicznych. Warszawa. Wydawnictwo Naukowe PWN.

Jak analizować wyniki badań przy użyciu ankiety własnego autorstwa?

Badania ankietowe są często stosowane w badaniach do prac magisterskich. Wykorzystujecie w nich kwestionariusze standaryzowane czyjegoś autorstwa (głównie studenci psychologii) lub kwestionariusze własnego autorstwa (studenci pozostałych kierunków jak pedagogika, pielęgniarstwo, dietetyka czy też socjologia). Często też zdarzają się “badania-hybrydy”, w których korzystacie z jakiegoś swojego, krótkiego narzędzia badawczego oraz 1, 2 lub 3 dobrych, rzetelnych i trafnych wystandaryzowanych kwestionariuszy. W niniejszym wpisie opiszemy kilka podstawowych możliwości analizy danych pochodzących z wykorzystanego narzędzia badawczego (kwestionariusza) własnego autorstwa, które nie zostało zbudowane przez specjalistę z zakresu psychometrii lub doświadczonego badacza tylko zapewne przez Ciebie – studenta ostatniego roku, który nie ma należytego doświadczenia i wiedzy w sferze metodologii badań naukowych oraz tworzenia rzetelnych i trafnych kwestionariuszy. Analizy danych mogą na pierwszy rzut oka wydawać się bardzo skomplikowane. Podpowiemy jednak, jak zabrać się za to trudne zadanie! Z naszymi podpowiedziami opisywanie ankiet do prac mgr będzie znacznie prostsze.

Bardzo często kwestionariusze ankiety, które przygotowujcie są dosyć rozbudowane i zawierają np. 25-35 pytań. W sytuacji, gdy stawiacie 10-30 hipotez o związku “każdego pytania z każdym” może okazać się, że owszem da się to wszystko sprawdzić, ale za “milion złotych”, w raporcie na 80 stron, którego stworzenie zajmie nam miesiąc pracy – a to nie powinno tak wyglądać. W pracy naukowej (czyli już licencjacie czy pracy magisterskiej) dobra analiza statystyczna nie polega na tym żeby zrobić ile się da a jedynie to co jest niezbędne z punktu widzenia postawionych hipotez lub pytań badawczych. Oczywiście są projekty, w których dokonuje się bardzo głebokiej eksploracji, ale sam znajdź w internecie 10 artykułów naukowych i zobacz ile stron zajmuje sekcja “Results” – najczęściej nie więcej niż 3-9 stron. Żeby natomiast analiza statystyczna była krótka, ale wyczerpująca, dogłębna, ale konkretna dobrze jest pomyśleć przed stworzeniem kwestionariusza, w jaki sposób będą analizowane dane, które dzięki niemu pozyskacie. Jeśli tego nie wiecie to skonsultujcie to koniecznie ze statystykiem, któremu powierzycie wyniki swoich badań. Dobre firmy nie odmówią Wam krótkich i darmowych konsultacji. My jesteśmy jedną z nich! Chętnie doradzimy w kwestii przygotowania badania statystycznego.

Niestety, tak jak w przypadku badań psychologicznych z wykorzystaniem wystandaryzowanych narzędzi badawczych zazwyczaj jasne jest, jakie analizy trzeba przeprowadzić (wiemy to często z samej konstrukcji badania, nawet bez znajomości hipotez), tak w przypadku badań ankietowych z narzędziami własnego autorstwa jest dokładnie odwrotnie. Dane z takiego badania można przeanalizować na różne sposoby. Niestety często rozdziały metodologiczne, które otrzymujemy są napisane błędnie i na ich podstawie nie potrafimy określić, co ma zostać wykonane. Dlatego w tym wpisie omówię trzy podstawowe sposoby analizy danych ankietowych i odpowiadające im hipotetyczne pytania badawcze. Z pewnością ułatwią one opisywanie ankiet oraz wyciąganie właściwych wniosków.

Kwestionariusz ankiety – jak interpretować odpowiedzi?

Wcielimy się dziś w pielęgniarkę, która pisze pracę na bardzo ważny temat – wiedzy i opinii pielęgniarek na temat przeszczepiania narządów zmarłych. W celu realizacji celu badania przeprowadziła ona ankietę z wykorzystaniem kwestionariusza własnego autorstwa składającego się z trzech części:

– 5 pytań dotyczących wiedzy na temat przeszczepiania narządów

– 4 pytań dotyczących opinii na powyższy temat

– 4 pytań dotyczących tzw. metryczki (wiek, płeć, miejsce zamieszkania i wykształcenie).

 

 

W takim badaniu, mamy możliwość wykonania analizy między innymi na trzy podstawowe sposoby. Co więcej, to postawione pytania badawcze powinny wskazywać na rodzaj analizy, która ma zostać wykonana. Możemy postawić trzy rodzaje pytań badawczych:

1. Pytanie o rozkład odpowiedzi – np. jak przedstawia się opinia lub rozkład odpowiedzi na pytania dotyczące wiedzy

2. Pytanie o relacje między zmiennymi (to jaki test wykonamy zależy od tego jaki wskaźnik stworzymy. O tym piszemy niżej.)

a) test niezależności chi kwadrat – np. czy istnieje zależność/związek między miejscem zamieszkania czy płcią, a opinią czy wiedzą nt. przeszczepiania narządów

b) analiza korelacji – czy istnieje korelacja między wykształceniem, a poziomem wiedzy na temat transplantacji narządów

3. Testy istotności różnic – czy istnieje różnica pomiędzy grupami w zakresie poziomu wiedzy na temat przeszczepów od osób zmarłych

 

Ad 1. Pytanie o rozkład odpowiedzi

Jest to tzw. analiza częstości i polega ona na przedstawieniu rozkładów odpowiedzi na poszczególne pytania z ankiety w tabeli i/lub na wykresie wraz z opisem. Często zdarza się, że analiza statystyczna do magisterki opiera się właśnie o analizę częstości całej ankiety, a czasami jest ona jedynie uzupełnieniem analizy głównej, opartej na testach zależności/korelacji czy istotności różnic.

Przykładowa analiza częstości:

Na pytanie o warunki które muszą być spełnione do pobrania narządów zmarłego, większość badanych (42,9%) prawidłowo wskazała, że w tym celu potrzebna jest “zgoda domniemana”. Pozostałe osoby zaznaczyły jedną z błędnych odpowiedzi, z czego najwięcej (28,6%) odpowiedź, że do tego celu potrzebna jest zgodna rodziny zmarłego (tabela 1).

Tabela 1

Rozkład odpowiedzi na pytanie o warunki które muszą być spełnione do pobrania narządów zmarłego

Aby można było pobrać narządy od zmarłego, konieczna jest n %
zgoda osoby zmarłej, wyrażona na piśmie 5 7,1%
zgoda rodziny zmarłego 20 28,6%
“zgoda domniemana”, czyli brak sprzeciwu wyrażonego za życia 30 42,9%
żadna forma zgody nie jest wymagana 15 21,4%
Ogółem 70 100%

 

Mimo, iż niektóre analizy do prac dyplomowych opierają się tylko o analizę częstości, powiedzmy sobie jasno – nie jest ona “analizą statystyczną” o której była mowa na zajęciach podczas studiów lub na seminarium z promotorem – nie testujemy w niej w sposób matematyczny żadnych związków czy zależności. Nie sprawdzamy czegokolwiek, co pozwalałoby powiedzieć coś znaczącego o jakiejś populacji. Nie dokonujemy tzw. wnioskowania statystycznego czyli strategii analizy danych, która pozwala przełożyć wyniki uzyskane w pewnej małej grupie na całą populację.

Co więcej, analiza taka jest problematyczna w interpretacji. Czy 43% osób, które zaznaczyło poprawną odpowiedź, to dużo czy mało? Czy wiedza pielęgniarek w tym zakresie jest duża lub wystarczająca? Nie wiadomo – nie mamy żadnego punktu odniesienia. Są pytanie trudne i łatwe, takie na które odpowiedź zna 80% populacji, ale też takie, na które odpowiedź zna niewiele pielęgniarek i wynik wskazujący na 20% poprawnych odpowiedzi to już wielkie “WOW”. W takim wypadku, ciężko określić też co jest celem takiego badania.

Bardzo często celem badań ankietowych jest “określenie poziomu wiedzy X na temat Y” i podobnie skonstruowane są też pytania badawcze. Czy istnieje jednak możliwość udzielenia na nie odpowiedzi, jeśli w ankiecie mamy 10 pytań i na każde z nich odpowiedział poprawnie różny odsetek osób? Tak, to pytanie retoryczne 🙂 Unikajcie zwykłej analizy częstości bo jeśli to jedyny sposób opracowania wyników Waszych badań to jednak jest on niegodny tytułu magistra lub nawet licencjata. I to nie jest nasze zdanie a Waszych promotorów (tych, którzy ogarniają statystykę i metodologię trochę lepiej niż gorzej). Cytując jednego z nich, który od swojej studentki dostał właśnie tylko analizę częstości w formie tabel jak wyżej, wykres kołowy i opis jak wyżej:

PROCENTY TO NIE STATYSTYKA!!!

Unikajcie tym samym stawiania hipotez o treści:

H1: Wiedza rodziców na temat szczepień jest wystarczająca

H2: Pacjenci odczuwają silny ból

H3: Pielęgniarki są wypalone zawodowo

H4: Wynagrodzenie księgowych w Płocku jest na niskim poziomie

H5: Badani uważają, że czerwone rowery są ładne

Lub im podobnych pytań badawczych:

Pyt. 1: Czy osoby bezdomne mają problem z nadużywaniem alkoholu?

Pyt. 2: Jaka jest wiedza pacjentów na temat niedoczynności tarczycy?

Pyt 3: Jaki jest stosunek pracowników instytucji państwowych do rozpoczętego procesu rekrutacji na stanowisko woźnego w szkole podstawowej nr 3?

Pyt. 4: Jakie problemy występują u młodych dorosłych do 3 lat po ukończeniu studiów?

Pyt. 5: Czy rodzice są skłonni do współpracy z pedagogiem szkolnym, a jeśli nie, to dlaczego?

Analizę częstości możemy “podrasować” i uzupełnić o test zgodności rozkładu chi kwadrat – sprawdza on czy rozkład odpowiedzi na dane pytanie różni się od rozkładu losowego. Innymi słowy i w uproszczeniu – czy jakaś odpowiedź była zaznaczana przez badanych wyraźnie częściej/rzadziej niż pozostałe. Dzięki temu testowi możemy sprawdzić czy np. jedna z odpowiedzi nie pojawiała się istotnie statystycznie częściej od pozostałych. Taka analiza najczęściej nie wnosi zbyt wielu ważnych i rzetelnych informacji a tym samym napisanie dyskusji wyników i wyciągnięcie z nich wniosków graniczy z cudem.
Po lewej widzimy bowiem, że w częstotliwości pojawiania się poszczególnych 4 odpowiedzi występują istotne statystycznie różnice. Poprawna odpowiedź nr 3 była zaznaczana najczęściej, a jedna z błędnych odpowiedzi (nr 1) najrzadziej. Cóż jednak z tego skoro sumując wszystkie błędne odpowiedzi było ich więcej niż poprawnych (30 poprawnych i 40 błędnych). Oczywiście można zrobić dwie kategorie (błędne vs poprawne), ale nadal taka analiza to coś pod czym nie podpisze się żaden dobry badacz.  W dużej mierze dlatego, że ten tzw. dobry badacz nie interesuje się tym jak odpowiadali badani tylko DLACZEGO TAK ODPOWIADALI – od czego zależy to, że jedna pielęgniarka zaznaczy odpowiedź poprawną a inna błędną?

Ad 2. Pytania o relacje między zmiennymi (pojedynczymi pytaniami z kwestionariusza, które zakodowane są na skali nominalnej/porządkowej)

W tego rodzaju analizie sprawdzamy czy natężenie mierzonego zjawiska (np. poziom wiedzy, ale mierzony pojedynczymi pytaniami z osobna) zależy od jakiegoś czynnika (np. płci, wykształcenia lub stażu pracy). Krótko mówiąc – czy odpowiedzi na jedno pytanie (lub pytania), zależą od odpowiedzi na inne pytanie. Na przykład możemy sprawdzić czy stosunek badanych pielęgniarek do zjawiska przeszczepiania narządów od osób zmarłych jest skorelowane (w uproszczeniu powiedzmy “uzależnione od”) z ich stażem pracy.

W praktyce, w badaniach ankietowych możemy podjąć dwa różne działania badające związki między zmiennymi. Pierwszą z nich (A) jest przeanalizowanie zależność między odpowiedziami na pytania z ankiety (wyrażonymi na skali nominalnej lub porządkowej) w tzw. tabeli krzyżowej wykonując jednocześnie test chi kwadrat. Drugą z nich (B) jest stworzenie ilościowego wskaźnika wiedzy i wykonanie analizy korelacji (najczęściej Pearsona, Spearmana albo Kendalla), ale oczywiście jeśli taki wskaźnik ilościowy będziemy odnosić/korelować z inną zmienną ilościową lub porządkową.

a) test niezależności chi kwadrat

W tym wariancie sprawdzamy czy rozkład odpowiedzi na jakieś pytanie zależy od jakiejś innej zmiennej (innego pytania z kwestionariusza). Tak jak wspomniałem, oba pytania muszą być wyrażone na skali nominalnej (ew. porządkowej).

Analizę zależności wykonujemy w formie tzw. tabel krzyżowych, w których w poszczególnych kolumnach przedstawiamy rozkłady odpowiedzi dla poszczególnych wyodrębnionych grup. Do tego wykonujemy testy niezależności chi kwadrat (to inny test niż test zgodności chi kwadrat opisany powyżej), które pokazują czy istnieje istotna statystycznie (czyli zapewne nieprzypadkowa) zależność/związek pomiędzy rozkładami odpowiedzi na oba pytania. W naszym przykładzie sprawdzać będziemy czy poziom wiedzy zależy od stażu pracy.

Przykład analizy zależności:

Sprawdzono czy nastawienie do zostania dawcą organów po śmierci zależy od miejsca zamieszkania badanych osób. W tym celu przeprowadzono analizę z wykorzystaniem testu chi kwadrat niezależności. Wynik testu chi kwadrat okazał się istotny statystycznie  – chi kwadrat(1) = 5,58; p = 0,018 co oznacza, że istnieje zależność pomiędzy nastawieniem do zostania dawcą organów, a miejscem zamieszkania. Okazuje się, że osoby z miasta częściej wykazywały wolę zostania dawcami organów po śmierci (60,6%) niż osoby zamieszkujące tereny wiejskie (32,4%) (tabela 2).

Tabela 2

Związek między motywacją do zostania dawcą organów po śmierci a wielkością miejsca zamieszkania

Czy chce Pan/ Pani w przypadku wystąpienia własnej śmierci zostać dawcą narządów? Miasto Wieś
n % n %
Tak 20 60,6% 12 32,4%
Nie 13 39,4% 25 67,6%
Ogółem 33 100% 37 100%

 

W praktyce, często badania ankietowe są oparte głównie lub w całości o analizy w tabelach krzyżowych. Jest kilka sposobów wykonania tej analizy:

– sprawdzamy czy rozkład odpowiedzi na pytania z ankiety dotyczącej interesującego nas tematu zależy od jednej, wybranej zmiennej socjodemograficznej; w naszym przypadku, moglibyśmy sprawdzić czy rozkład opinii na temat transplantacji narządów zależy od miejsca zamieszkania badanych (miasto vs wieś)
– testujemy czy rozkład jednych odpowiedzi zależy od rozkładu odpowiedzi na pytanie związane z przedmiotem badania – w naszym przypadku moglibyśmy sprawdzić np. czy rozkład na pytania dotyczące wiedzy na temat transplantacji zależy od tego czy badany sam chciałbym zostać dawcą
– układ mieszany – testujemy różne zależności, np. zależność między pytaniem 2 i 4, oraz 3 i 7, a także 12 a 4, 5 i 6; takie rozwiązanie ma sens przy przemyślanych ankietach, z których chcemy wydobyć interesujące Cię wyniki.

Analizę zależność wykonujemy raczej dla pytań jednokrotnego wyboru. Tylko w ten sposób możemy sprawdzić zależności całych rozkładów odpowiedzi. W przypadku gdy jedno z pytań jest wielokrotnego wyboru, należy wykonać test chi kwadrat dla każdej odpowiedzi z ankiety z osobna, sprawdzając czy fakt zaznaczenia danej opcji zależy od odpowiedzi na inne pytanie. W takim wypadku wyciąganie wniosków może być jednak problematyczne.

Polecamy unikać pytań wielokrotnego wyboru!

Należy również pamiętać, że w przypadku pytań dotyczących wiedzy, jeśli chcemy rzeczywiście sprawdzić rozkład odpowiedzi pomiędzy posiadaną wiedzą, a drugą zmienną, musimy najpierw zrekodować odpowiedzi poprzez scalenie w jedną kategorię wszystkich odpowiedzi poprawnych i niepoprawnych.

Przykładowo, jeśli weźmiemy pytanie drugie z ankiety dotyczące kryteriów istnienia śmierci mózgu:

Śmierć mózgu orzekana jest na podstawie:

  • rezonansu magnetycznego
  • badania neurologicznego
  • dwukrotnego badania neurologicznego i w przypadku wątpliwości badania obrazowego
  • nie wiem

Nie możemy wykonać testu niezależności dla tych odpowiedzi – tzn. możemy, ale to niewiele powie nam o wiedzy badanych! Przykładowo, może się okazać, że w obu grupach odsetek osób, które udzieliły poprawnej odpowiedzi jest taki sam. Mimo tego wynik testu chi kwadrat jest istotny statystycznie, wskazując na występowanie zależności, podczas gdy rozkłady mogą się różnić jedynie rozkładem udzielenia odpowiedzi niepoprawnych! Dlatego w takim wypadku, należy zsumować wszystkie niepoprawne odpowiedzi w jedną kategorię i porównać rozkłady odpowiedzi poprawnych do niepoprawnych. Pamiętajmy, że w niektórych ankietach może być więcej niż jedna poprawna odpowiedź. Wtedy musimy przemyśleć jak będziemy je uwzględniać, czy np. badany musi udzielić wszystkich odpowiedzi, aby uznać, że posiada wiedzę w jakimś zakresie czy wystarczy, że zaznaczy tylko jedną. Jak będziemy to punktować?

 

b) analiza korelacji (gdy obie zestawiane ze sobą zmienne są porządkowe/ilościowe)

Sposób rzadko wykorzystywany, ale okazuje się on często najszybszy i najlepszy (oraz najtańszy!). Nie tylko dlatego, że taka analiza zajmuje “mało miejsca”, ale także dlatego że często w ten sposób uzyskujemy najbardziej pełną wiedzę dotyczącą mierzonego zagadnienia. Nie bez powodu statystyka opiera się na analizach ilościowych, w których wskaźniki ilościowe są sumą odpowiedzi z różnych pytań. Choć to inny temat, związany z założeniami psychometrii i teorii testów.

W celu wykonania analizy korelacji dla pytań związanych z wiedzą takich jak te omawiane w niniejszym wpisie powinniśmy utworzyć nowy wskaźnik (o wskaźnikach pisaliśmy tutaj) – sumę poprawnych odpowiedzi na pytania z kwestionariusza. Traktując zatem taką ankietę jako test wiedzy obliczamy dla każdego badanego respondenta wynik w skali od 0 do 5, jako miernik poziomu wiedzy. Po prostu poprawną odpowiedź na każde kolejne pytanie punktujemy jako 1 a każdą niepoprawną jako 0. Mamy 5 pytań więc badane pielęgniarki mogły uzyskać od 0 punktów (wszystkie zaznaczone odp. są błędne) do maksymalnie 5 punktów (zaznaczono wszystkie poprawne odpowiedzi).

Po utworzeniu wskaźnika ilościowego, możemy przeprowadzić analizę korelacji Pearsona dla zmiennych wyrażonych na skali ilościowej (np. wieku i wiedzy) lub Spearmana dla zmiennych na skali porządkowej (np. wykształcenia i wiedzy).

Utworzenie wskaźnika jest oczywiście jedną z możliwości. Możemy bowiem oczywiście korelować pojedyncze pytania z ankiety między sobą. Często niektóre z nich wyrażone są na skali porządkowej i wtedy możemy korelować je np. z poziomem wykształcenia czy wielkością miejsca zamieszkania. Rodzaj analizy uzależniony jest w ogromnym stopniu o tego na jakiej skali pomiarowej są zakodowane odpowiedzi na zadane pytania. Ta wiedza to podstawa podstaw więc koniecznie zobacz ten tutorial – https://youtu.be/Z4x3WTkQK1U

Analiza ilościowa ma ogromną przewagę nad jakościową szczególnie w jednym przypadku – gdy mamy bardzo rozbudowaną ankietę. Mając np. 30 pytań w ankiecie, chcąc sprawdzić zależność odpowiedzi na nie wszystkie od stażu pracy i wykształcenia, musielibyśmy wykonać 60 osobnych analiz. W analizie ilościowej, robimy dwie proste analizy, które zajmują jedną/dwie strony.

Przykładowa analiza korelacji:

W celu sprawdzenia czy istnieje związek między poziomem wykształcenia a wiedzą pielęgniarek w zakresie transplantacji narządów zmarłych wykonano analizę korelacji r Pearsona. Wykazała ona, że istnieje istotny, dodatni i umiarkowanie silny związek między tymi zmiennymi (r = 0,34; p = 0,037). Oznacza to, ze wraz z poziomem wykształcenia wzrasta wiedza pielęgniarek na badany temat.

Ad 3. Testy istotności różnic

Podobnie jak w przypadku korelacji, w analizach ankietowych na kiepskich uczelniach albo na kierunkach, na których nie kładzie się należytego nacisku na jakość prowadzonych badań rzadko kiedy wykonujecie testy istotności różnic między grupami takie jak testy t Studenta lub analiza wariancji (ANOVA). Pamiętajcie jednak, że nadal jest to bardzo dobry sposób na udzielenie odpowiedzi na postawione pytania badawcze dotyczących różnic międzygrupowych. Znacznie lepszy niż pokazanie po prostu ile padło odpowiedzi na każde pytanie badawcze i jaki procent z całości te odpowiedzi stanowią.

Tak jak przy okazji analiz korelacji, najpierw musimy stworzyć ilościowy wskaźnik wiedzy. Następnie, potrzebujmy drugiej zmiennej – nominalnej (np. płeć). W ten sposób możemy porównać czy wyróżnione podgrupy (kobiety i mężczyźni) różnią się między sobą w zakresie średniego poziomu wiedzy. W przypadku dwóch grup korzystamy z testu t Studenta dla prób niezależnych, a w przypadku większej liczby grup – z testu ANOVA. Pamiętajcie również, że w przeciwieństwie do analizy korelacji czy badania związków przy użyciu testu chi kwadrat niezależności wykonując test t Studenta lub analizę wariancji możemy mówić nie tylko o współwystępowaniu dwóch zmiennych, ale o tym, która zmienna wpływa na którą.

Przykładowy opis wyniku testu t Studenta dla prób niezależnych:

W celu sprawdzenia czy poziom wiedzy dotyczący procedur medycznych różni się między kobietami a mężczyznami wykonano test t Studenta dla prób niezależnych. Jego wyniki wskazują na brak istotnych statystycznie różnic w tym zakresie t(37) = 4,12; p = 0,387. Oznacza to, że poziom wiedzy badanych kobiet (M = 3,52; SD = 1,72) i mężczyzn (M = 3,86; SD = 1,79)  jest podobny. Brak jest tym samym podstaw do odrzucenia hipotezy zerowej i uznania obserwowanych różnic za nieprzypadkowe.

Idealny mail do statystyka. Jakie informacje są dla nas ważne?

Słowem wstępu… (Nie masz czasu? Przejdź do kolejnego akapitu!)

Zgłaszacie się do nas bo potrzebujecie pomocy z analizą statystyczną. Statystyka jest zmorą większości studentów w całej Polsce, więc potrzebujecie kogoś, kto zdejmie ten ciężar z waszych barków lub chociaż doradzi w momencie gdy się “przyblokujecie” na jakimś etapie. Od tego jesteśmy właśnie my –Pogotowie Statystyczne. Zajmujemy się wszystkim co związane jest ze statystyką. Pomagamy w wykonaniu analizy statystycznej wyników zebranych badań ankietowych lub eksperymentalnych (do prac magisterskich, doktoratów, artykułów naukowych i wielu innych projektów). Zresztą to już na pewno wiecie! Co więcej, zajmujemy się edukacją, a także darmowymi konsultacjami z zakresu statystyki, a także metodologii i psychometrii.

Wpis ten to niestety odpowiedź na bardzo niepokojące sygnały płynące od Was od kilku lat. Zauważyliśmy, że z roku na rok na wielu uczelniach statystyka jest wykładana coraz gorzej (https://pogotowiestatystyczne.pl/bardzo-niesmieszne-bledy-wykladowcow-statystyki/) lub nie jest wykładana wcale, ale na uczelni jednak jest wymóg aby do pracy magisterskiej zrobić profesjonalne opracowanie wyników badań z należytym testowaniem hipotez i bezbłędnym raportowaniem wyników. Nie dość, że poziom nauczania na pewnych uczelniach nie pozwala Wam na samodzielne opracowanie wyników swoich własnych badań to niestety nawet macie problem z poprawnym zamówieniem usługi w takich firmach jak nasza. Nie wiedząc zupełnie nic o statystyce (CZĘSTO NIE Z WASZEJ WINY!) nie wiecie co nam wysłać, czego wymagać, na co absolutnie nie liczyć itd. To sprawia z kolei, że stajecie się idealną pożywką dla oszustów, którzy np. w połowie pracy lub pod jej koniec informują Was, że dostaniecie tylko surowy raport z SPSSa bez jakiegokolwiek opisu. Niestety 🙁

Tak jak my specjalizujemy się w opracowaniu wyników badań tak Wy z kolei jesteście specjalistami z zakresu teorii, w której się poruszacie, która Was na tyle zainteresowała, że obraliście ją jako temat waszych badań. Zaprojektowaliście już badanie, wiecie czy przebadacie ludzi przez internet czy na żywo, hipotezy już postawione, zapewne cała metodologia została też zaprojektowana. Ba! Nawet zebraliście już dane, ale nie wiecie co teraz z tymi danymi zrobić (film z instrukcją jak wykonać prawidłową bazę danych w excelu TUTAJ).

Oczywiście, nie jesteśmy jedyną firmą, która zajmuje się analizą statystyczną, więc wpis ten jest uniwersalny. UWAGA: pewne sugestie zawarte w tym wpisie sprawdzą się tylko jeśli wybierzecie dobrą, rzetelną i sprawdzoną firmę. Jeśli wyślecie swoje dane w ciemno, do niesprawdzonej firmy to nie ręczymy, że jakiś domorosły statystyk Rysiek, który nie ma firmy, nie ma regulaminu serwisu, nie ma setek rekomendacji etc. nie sprzeda Waszej bazy danych za 5 zł pierwszemu lepszemu studentowi, który zgłosi taką potrzebę. Korzystajcie tylko z usług profesjonalistów. Jak wybrać porządną firmę, która Was nie oszuka, zrobi dobrą robotę i zaopiekuje aż do czasu obrony lub publikacji artykułu wyjaśniamy z kolei W TYM WPISIE.

Często pytacie nas w pierwszym mailu co macie nam przesłać, co udostępnić, jakich informacji udzielić i jakie tajemnice zdradzić, żebyśmy Wam pomogli. Ten wpis jest właśnie po to, żeby ułatwić Wam ten pierwszy kontakt z nami.

DO RZECZY! Im więcej dasz, tym więcej otrzymasz…

Przede wszystkim nie bójcie się dzielić z nami wynikami swoich badań. Często chcecie przesłać je dopiero uściskając nam dłoń, po ustaleniu warunków współpracy, gdy na stole już leży umowa spisana krwią. Nie bójcie się zrobić tego wcześniej! Wasze dane są nam potrzebne tylko i wyłącznie do tego, by skutecznie pomóc Wam pomóc w zakresie analizy statystycznej. Do niczego więcej. Pamiętajcie, że w Pogotowiu Statystycznym kluczowa jest dla nas poufność, tak jak u księdza czy lekarza – a może nawet bardziej? 😉 Tak więc, dzielcie się z nami od początku jak największą ilością danych i informacji. Dzięki temu szybciej i sprawniej przebiegnie nasza współpraca, a wycena i plan analiz którą otrzymacie będzie bardziej rzetelna. Regulamin serwisu PogotowieStatystyczne.pl, jak sama nazwa wskazuje, reguluje wszelkie te prawne kwestie. Uwierzcie nam – gdybyśmy wykorzystywali wyniki Waszych badań w niecnych celach to mielibyśmy już swoją prywatną wyspę na Atlantyku i do końca życia popijali już tylko drinki w cieniu palm.

Każda profesjonalna firma zajmująca się statystyką MUSI mieć regulamin serwisu. Jeśli natkniesz się na firmę bez regulaminy – uciekaj gdzie pieprz rośnie, a szczególnie nie wysyłaj swoich danych, bo to na 99% serwis działający niezgodnie z prawem!

Co powinno znaleźć się w pierwszym mailu do statystyka?

1. Napisz do czego potrzebna jest Tobie analiza statystyczna i nasza pomoc. Do pracy magisterskiej, doktoranckiej lub artykułu? A może do pracy zaliczeniowej czy jako podrozdziału monografii? Jaka to dziedzina wiedzy?

2. Prześlij nam rozdział z metodologią lub zawrzyj w swoich słowach informacje, które zwykle znajdują się w takowym rozdziale:
– opis badania, uczestników i generalnie okoliczności przeprowadzenia badania
– opis zmiennych zależnych, niezależnych, ubocznych oraz wyjaśnienie skrótów, które dla Ciebie są “oczywiste” a nam nic nie mówią
– jeśli była stosowana jakaś manipulacja eksperymentalna to na czym ona polegała
– narzędzia badawcze – pokaż nam je, chcemy zobaczyć zaróno treść pytań i skalę odpowiedzi
– opis użytych narzędzi badawczych – jeśli były to kwestionariusze autorskie to napisz o tym i wspomnij jak mamy się z nimi obchodzić. Jeśli zaś użyłeś istniejących już narzędzi to prześlij do nich klucze odpowiedzi bądź instrukcje jak liczyć wyniki – ile wymiarów ma dane narzędzie, jak się je oblicza, czy konieczne jest rekodowanie (odwracanie) pytań/pozycji itd? W ciągu 13 lat udało nam się uzbierać klucze do kilkuset wystandaryzowanych narzędzi (głównie psychologicznych) więc jeśli masz utrudniony dostęp do klucza to po prostu wymień tylko wykorzystane narzędzia bo na 80% posiadamy klucz do tego, z którego korzystasz.
i najważniejsze z tej części – hipotezy lub pytania badawcze! Jeśli nie masz sformułowanych hipotez to napisz jakie związki/zależności Cię interesują np. “interesuje mnie związek pomiędzy poziomem samooceny a cechami osobowości”. Daj znać przy tym, że samoocenę mierzyłeś narzędziem SES Rosenberga, a cechy osobowości NEO FFI. W przypadku gdy korzystasz z kwestionariusza własnego autorstwa i nie miałeś pomysłu lub zamiaru tworzyć jakichkolwiek wskaźników to nie pisz samej informacji, że interesuje Cię związek pomiędzy stanem zdrowia pacjentów a ich płcią w momencie, gdy ich “stan zdrowia” mierzy pytanie 2, 4, 6, 9 i 12. Zaznacz proszę, że pisząc “stan zdrowia” masz na myśli właśnie te pytania, ponieważ my sami się tego nie domyślimy. Wystarczy nam informacja “proszę zestawić pytanie 8 z pytaniem 12, 14, i 17” lub “kolumna C w excelu z kolumną F, G i J” i my wtedy już wszystko wiemy.

3. Baza danych! Może być w excelu lub SPSS czy innej “sensownej” formie. Jak ją stworzyć zapewne wiecie bo stworzyliśmy na ten temat tutorial video, o którym wspomnieliśmy już wyżej.

4. Podajcie preferowany termin realizacji. Napiszcie nam jaki macie deadline lub po prostu kiedy chcielibyście najpóźniej otrzymać od nas gotowy projekt. Z naszego 13-letniego doświadczenia wynika, że 70% klientów chce projekt “na wczoraj”, ok 20% “na już” a pozostałe 10% “na jutro” 🙂 OK. Pogotowie Statystyczne działa szybko i w takich realiach świetnie się odnajdujemy, ale jeśli faktycznie macie spotkanie z promotorem na seminarium za 2 tygodnie to nie piszcie, że mamy projekt zrobić na jutro bo ktoś kto może faktycznie potrzebować go tak szybko zostanie przez nas “odesłany z kwitkiem” ponieważ przecież termin “na jutro” jest już zajęty.

5. Prześlijcie wszystkie inne pliki lub informacje, które wydadzą się Wam przydatne. To mogą być notatki z zajęć, instrukcje od promotora lub prowadzącego, artykuły naukowe na których mamy się wzorować, a nawet spis zasad i reguł dotyczących pisania rozdziału z wynikami badań własnych ? wiem, że niektóre uczelnie takie posiadają i nie stosują się do standardów APA. Może Wasz promotor jest ultra-patriotą, ma wytatuowany symbol Polski Walczącej na bicepsie i wszyscy jego studenci mają prawo robić tylko biało-czerwone wykresy? OK, dla nas nie ma problemu, ale poinformuj nas o tym wcześniej.

Naprawdę, często nie zdajecie sobie sprawy jak pozornie nieważne “dla obcego statystyka” pewne informacje są wręcz kluczowe dla powodzenia naszych działań. Niejednokrotnie realizacja projektu była utrudniona ponieważ nie napisaliście nam o tym, że:
– promotor nie odpisuje na maile tylko trzeba do niego jeździć osobiście
– jesteście z uczelni “ABC” z miasta “GHI” a my już z tej placówki mieliśmy klientów i wiemy, że trzeba tam raportować wyniki w specyficzny sposób
– jeście osobami niepełnosprawnymi (np. niemymi lub niesłyszącymi) a my już w szóstym mailu ciśniemy Was o to żebyście podali nam swój nr tel. bo trzeba coś koniecznie omówić
– macie świetne relacje z promotorem lub są one totalnie beznadziejne … albo, że promotor na pewno wszystko zaakceptuje co od nas dostanie, albo że na pewno wszystko poskreśla bo to taki typ człowieka

Zatem: IM WIĘCEJ INFORMACJI TYM LEPIEJ. To czego od Was nie potrzebujemy to wstęp teoretyczny. On nas nie interesuje.

Nie martw się jeśli nie masz czegoś z powyższej listy lub czegoś nie rozumiesz! Już widzę jak część z Was myśli sobie “UOJEZU! A co to jest zmienna zależna i niezależna?” lub “Ja nie mam hipotez ani pytań badawczych bo promotor powiedział, że postawimy je jak już poznamy wyniki analiz”. Zero problemu! Wszystkie powyższe punkty na naszym mailu to scenariusz idealny a ideały nie istnieją. No … może poza naszymi raportami 😛

6. I na koniec … PODPISZ SIĘ I PODAJ NUMER TELEFONU 🙂 Czasami gdy mamy ogrom klientów nie odpisujemy do osób, które się nie podpisały imieniem i nazwiskiem. Może osoba, która się nie podpisała jest jakimś szpiegiem z firmy konkurencyjnej? 🙂 Tym lepiej jest nie odpisywać na maila.
Numer telefonu z kolei bardzo ułatwia i skraca czas współpracy. Czasami podczas analizy danych wychodzą jakieś “kwiatki”, których nie dało się przewidzieć i musimy coś bardzo szybko z Wami skonsultować żeby nie wstrzymywać prac nad Waszymi projektami. Musimy mieć możliwość zadania krótkiego, szybkiego pytania i uzyskania krótkiej i szybkiej odpowiedzi a przez telefon jest właśnie najszybciej.

Czego NIE PISAĆ do firm zajmujących się analizą statystyczną…

Na wstępie przepraszamy za małą niekonsekwencję bo przed chwilą napisaliśmy, że “im więcej, tym lepiej” a teraz jest jakiś punkt mówiący o tym czego do nas nie pisać 🙂 No to pisać wszystko lub dużo czy mało/konkretnie/treściwie? Już spieszymy z wyjaśnieniami! Nie piszcie proszę:

1. “Dzień dobry, czy wykonują państwo analizę statystyczną wyników badań?” lub “Czy analizują państwo dane?” czy też “Czy mogę prosić o pomoc ze statystyki?” – Nie pytajcie o to firmy, którą wybraliście. Jeśli zadajecie takie pytanie to oznacza, że nie zrobiliście należytego researchu w celu znalezienia najlepszej firmy, która opracuje wyniki Waszych badań. A to spory błąd! Sprawdźcie wszystkie niezbędne informacje, które powinny być dostępne na stronie serwisu, któremu przekażecie swoje cenne dane.

2. “Czy mają państwo wolne terminy?” – to pytanie zdroworozsądkowo zasadne, ale z drugiej strony troszkę “bez sensu”. Wolny termin na pewno kiedyś się znajdzie. Może za tydzień. Może za rok. A może za 100 lat 🙂 Tak, mamy wolny termin, ale rzadko kto ma go tu i teraz w tej sekundzie. To na szczęście jest prawie zawsze oczywiste 🙂 Staramy się dbać o sprawny przepływ klientów więc nikt z Was nie czeka zazwyczaj dłużej niż 10-12 dni na wyniki naszej pracy.

3. “Czy nie wykorzystacie nigdzie moich danych? Czy nigdzie ich nie udostępnicie?” –  jasne, że wykorzystamy i jasne, że udostępnimy… ale tylko w celu realizacji Twojego projektu i tylko wewnątrz firmy 🙂 Jeśli zrobisz należyty research zgodny z naszym instruktażem (https://pogotowiestatystyczne.pl/zlecenie-analizy-statystycznej-profesjonalistom-wybrac-dobra-firme/) to znacznie ograniczysz ryzyko natrafienia na kogoś “niepewnego”. Z większym prawdopodobieństwem wybierzesz firmę godną zaufania, która nie sprzeda Twoich danych komuś kto bardzo ich potrzebuje (np. inny student, któremu nie chce się przeprowadzić badania).

4. “Dzień dobry. W załączniku zamieszczam bazę danych i moją ankietę. Proszę o wycenę i podanie terminu realizacji analizy danych” – tutaj “kłania się” potrzeba wysłania nam hipotez i/lub pytań badawczych. Analizę statystyczną wykonuje się bowiem właśnie po to żeby udzielić odpowiedzi na postawione pytania lub przetestować hipotezy. Bez nich statystyk nie wie co robić. Chyba, że chcesz uzyskać odpowiedź “Nie ma sprawy. Zrobimy analizę wszystkiego ze wszystkim w podziale na wszystko. Zajmie nam to 3 lata a szacunkowy koszt to 2 miliony złotych…” 😀 No właśnie. Sprecyzuj czego Ci trzeba. Chyba, że nie wiesz. Wtedy napisz, że nie wiesz czego Ci trzeba i mamy Ci pomóc z określeniem nawet tego. Zero problemu! Zero oceniania! My wiemy, że Wasze braki w zakresie wiedzy o statystyce i metodologii badań to nie Wasza wina. Zazwyczaj 😉

I na koniec ostatnia ogromna prośba. Nam “to rybka”, ale prosimy tak dla dobra ludzkości. BŁAGAMY – nie wysyłajcie nam “wrażliwych” danych w bazie jak numery telefonów, adresy e-mail, numery PESEL, adresy zamieszkania respondentów etc. Dostawaliśmy od Was już wszystko! Mistrzami w tym zakresie są lekarze. Nie wiem czemu. Niedawno otrzymaliśmy bazę danych nastoletnich pacjentów po zatruciu środkami psychoaktywnymi jak dopalacze, LSD, grzyby halucynogenne, butapren itp. W bazie były ich nry tel. i adresy zamieszkania. Serio…

Dlaczego to takie ważne?

Pamiętajcie, że to na co się umówimy na samym początku jest wiążącą umową pomiędzy nami. Po przesłaniu nam wszystkich niezbędnych informacji do wykonania opracowania statystycznego my wyceniamy Wasz projekt oraz szacujemy termin realizacji. Dopiero po poznaniu warunków cenowych i czasowych oraz po waszej akceptacji powyższych warunków rezerwujemy Wam termin w naszym kalendarzu. Niepoprawne lub niepełne informacje przekazane nam na samym początku mogą skutkować tym, że umówimy się na coś na co umówić się nie powinniśmy. My to zrobimy, Wy nam za to zapłacicie, a promotor powie, że “super praca, ale jednak nie o to mi chodziło”. Co wtedy? Wyjaśniamy między innymi w zakładce CZĘSTE PYTANIA na naszej stronie internetowej.

Zdajemy sobie sprawę, że bywają też sytuacje odbiegające od typowych, nie wszystko da się bowiem generalizować. W takim przypadku omawiamy wszystko indywidualnie. Zgłaszacie się do nas z różnymi sprawami, nie tylko z tymi opisanymi powyżej. Jesteśmy otwarci na kontakt z Wami więc nawet jeśli nie jesteście w stanie przedstawić nam całego kompletu wyżej wymienionych danych i informacji to nie rezygnujcie! Wspólnymi siłami na pewno dojdziemy do satysfakcjonującego rozwiązania. W tym wszystkim powyżej ważny jest również kontakt z promotorem. Możesz nie mieć nic, nic nie wiedzieć a i tak Ci pomożemy. Będzie to trudniejsze i zajmie więcej czasu, ale obronisz się na 5 lub opublikujesz świetny artykuł. Obiecujemy!

Nie pozostaje nam teraz nic innego jak czekać na Wasze nadchodzące maile. Jesteśmy po to, by pomagać Wam we wszystkim co związane jest ze statystyką i analizą statystyczną. Wiemy, że trudno jest nawet napisać maila z prośbą o pomoc, gdy zakres potrzebnej pomocy jest bardzo trudny do zrozumienia. Pogotowie Statystyczne zna swoich klientów i wie czego potrzebują. Mamy nadzieję, że teraz łatwiej będzie Wam sformułować swoje potrzeby!

Zapraszamy do kontaktu!

PSPP – darmowa alternatywa dla SPSS

Wpis ten popełniłem ponieważ ciągle widzę na grupach studenckich na FB jak piszecie “podeślijcie mi kod licencyjny bo muszę otworzyć bazę danych a nie mogę bez kodu zainstalować SPSSa”, albo “muszę na jutro koniecznie policzyć alfę Cronbacha i test t Studenta dla mojej promotorki żeby zaliczyła mi seminarium a nie mogę zainstalować SPSSa – RATUJCIE!” … iiiii tak dalej iiiiiiiiiiiiiii tak dalej. Tragedii, które rozgrywają się na moich oczach jest ogrom każdego dnia, tygodnia, miesiąca …

Skąd te nerwy? Po co panika? Dlaczego szlochasz?!! Jest darmowa alternatywa dla SPSSa – do pobrania za darmo, teraz, szybko! Bez licencji! Bez przekierowania na strony porno i/lub łamania prawa!

https://www.gnu.org/software/pspp/

Przedstawiam Wam program, który powinien znać każdy spanikowany student, na którego uczelni pracuje się w SPSSie 🙂 Waży tyle co piórko gołębia, działa szybko, wygląda równie strasznie co prawdziwy SPSS i robi te same czary, choć PSPP to Harry Potter na pierwszym roku w Hogwardzie a SPSS to Dumbledore….. wiesz …. bez podjazdu 🙂

Program PSPP pozwoli Ci przetrwać, zrobić podstawę podstaw i nie umrzeć. Jest mocno okrojony względem prawdziwego SPSSa, ale bez problemu ogarnie wszystkie korelacje, zrobi ANOVĘ, testy t Studenta, chi kwadraty, 99% znanych Ci innych testów nieparametrycznych czy analizę regresji a nawet regresję logistyczną czy analizę skupień czyli coś czego wcale nie miałeś/aś na studiach (zapewne)! Sprawdzisz też czy zmienna nie odbiega istotnie statystycznie od rozkładu normalnego lub odnajdziesz obserwacje odstające. OCZYWIŚCIE wszystko w mega okrojonej, uproszczonej, prymitywnej formie!

Jeśli Twoje umiejętności ze sfery IT przekraczają jednak włącznie i wyłącznie komputera to pamiętaj, że PSPP jest darmowym programem w pełni open source’owym i ma rozbudowane opisy swojego działania. Dostępne np. tutaj – https://www.gnu.org/software/pspp/manual/pspp.html

Serio, możesz ogarnąć przy jego użyciu nawet wszystkie analizy do pracy magisterskiej! To oczywiście działanie porównywalne do budowania domu z końskiej kupy w XXI wieku czyli w czasie gdy mamy dostęp do super mieszkań od super deweloperów na super kredyt na SUUUUPER 40 lat … Mimo wszystko deszcz na głowę nie pada i jak rozpalisz ognisko to nawet jest w środku całkiem ciepło. Dlaczego by w takim razie nie spróbować jeśli trzeba szybko i efektywnie schować się przed deszczem i mrozem?

Ogólnopolska Konferencja Kół Nauk Psychologicznych Psychozjum 2019

TAK JEST! To już! Właśnie ruszyła II Ogólnopolska Konferencja Kół Naukowych Psychozjum, która odbywa się w dniach 7-8 czerwca w Poznaniu na Uniwersytecie Adama Mickiewicza!

W ubiegłym roku mieliśmy przyjemność jedynie tejże konferencji patronować a w tym roku mamy zaszczyt na niej wystąpić! Poprowadzimy na niej półtorej godzinny warsztat, na którym nauczymy Was na czym polega, jak wykonać oraz jak zaraportować wyniki w standardzie APA dla analizy mediacji i moderacji.

Będzie to doskonała możliwość by nauczyć się analiz, które sprawią, że Twój promotor lub recenzent będzie klaskał uszami ze szczęścia! Pozwoli też ugruntować mocne podstawy do testowania w przyszłości bardziej złożonych modeli.

 

A cóż będzie działo się na samej konferencji?

Organizator zaprasza na prezentację badań i opracowań z zakresu psychologii i kognitywistyki, ciekawe dyskusje, warsztaty metodologiczno-statystyczne i treningi umiejętności miękkich, a przede wszystkim na wspólną integrację przedstawicieli nauk społecznych!

Konferencja jest organizowana przez Koło Naukowe Psychologii Społecznej oraz Koło Projektowania i Analiz Narzędzi Psychometrycznych działające przy Instytucie Psychologii Uniwersytetu im. Adama Mickiewicza w Poznaniu. Ideą wydarzenia jest stworzenie miejsca, w którym student bądź doktorant nauk społecznych będzie mógł zaktualizować wiedzę o najnowsze wyniki badań, zaprezentować swoją pracę naukową, wymienić się doświadczeniami czy nawiązać kontakty z innymi młodymi naukowcami.

Tutaj znajdziesz wszelkie niezbędne informacje o konferencji:

Fanpage https://www.facebook.com/psychozjum  – TUTAJ ZNAJDZIECIE MIĘDZY INNYMI WYWIAD Z NASZYM PRZEDSTAWICIELEM

Wydarzenie https://www.facebook.com/events/158643761695504/

Strona www: https://psychozjum.weebly.com/ 

Co jeszcze przygotowało Pogotowie Statystyczne?

Oprócz samego warsztatu z analizy mediacji i moderacji w sobotę 08.06.2019 między godziną 11:00 a 16:00 będzie można znaleźć nasze stanowisko na terenie konferencji i zapytać nas o co tylko chcecie. Możemy się po prostu poznać, możesz liczyć na darmowe konsultacje statystyczne. Ba! Możesz wziąć ze sobą swój komputer i pomożemy policzyć Ci wyniki swojej pracy magisterskiej lub doktoratu. Co tylko chcesz i to zupełnie za darmo!

Cóż radzimy?

NIE MOŻE CIĘ ZABRAKNĄĆ NA KONFERENCJI!

RADZIMY NA NIĄ PRZYJŚĆ 🙂

Metodologia, statystyka i raportowanie wyników w psychologii – wytyczne APA

Statystyka jest prosta, choć nie jest łatwa. Jedną z podstawowych trudności w tym zakresie jest powszechny problem z rozumieniem wnioskowania częstościowego, opierającego się na falsyfikowaniu hipotez statystycznych poprzez wykorzystywanie wartości testu statystycznego. O niektórych problemach związanych z wartością pisaliśmy w jednym z poprzednich artykułów. Zachęcam też do przeczytania artykułu dotyczącego istotności na poziomie tendencji statystycznej.

Regularnie spotykamy się ze skutkami tego niezrozumienia, widząc rozczarowanie klientów z powodu uzyskania “nieistotnych wyników”, z którego wyciągają wnioski, że “nic w badaniu nie wyszło”. Otrzymujemy też od klientów prośby, o wykonanie, na życzenie promotora, dodatkowych analiz, byleby tylko otrzymać wyniki istotne statystycznie. Ot taki urok opracowań statystycznych do prac magisterskich i doktoratów 🙂

Debata na temat wad testowania poziomu istotności statystycznej sięga początków samej statystyki. Niestety, mimo ciągłych rekomendacji zawartych w standardach APA (obecnie wersji szóstej), poziom chaosu nadal jest wysoki. W tym wpisie, przywołam rekomendacje dotyczące raportowania wyników statystycznych, opublikowane w artykule w 1999 roku (sic!). Zauważymy jednak, że ich znaczenie dziś, nadal jest tak samo duże. Rekomendacje te są wynikiem dwuletniej debaty w ramach powołanego przez Radę ds. Naukowych (jednego z organów Amerykańskiego Towarzystwa Psychologicznego) komitetu nazywanego Grupą Zadaniową ds. Wnioskowania Statystycznego. W jej skład wchodziła grupa specjalistów z różnych dziedzin związanych z badaniami psychologicznymi a ich celem było wyjaśnienie kontrowersyjnych kwestii związanych z testowaniem poziomu istotności w badaniach psychologicznych i stworzenie rekomendacji do wdrożenia w kolejnej edycji (wtedy piątej) standardów APA (pamiętaj, że obecnie obowiązuje wersja 6). Artykuł na bazie którego powstał niniejszy wpis nie dotyczy jednak tylko p value. Raportowanie wyników analiz statystycznych jest trochę bardziej rozbudowane 🙂

Oto niektóre z rekomendacji:

1. Jasno określ, jakiego rodzaju badanie przeprowadzasz (case study, eksperyment, quasi-eksperyment, badanie kwestionariuszowe itp). Każde z nich, ma swoje wady i zalety, standardy i ograniczenia.

2. Jasno zdefiniuj populację, którą badasz, szczególnie, jeżeli w badaniu jest grupa porównawcza/kontrolna. Określ dobór próby (losowy/nielosowy oraz jaki konkretnie rodzaj) i opisz, jakie kryteria włączenia/wykluczenia zostały zastosowane. Opisz ile osób i z jakiego powodu zostało ew. odrzuconych.

3. Jeśli przeprowadziłeś eksperyment, pamiętaj, o efekcie oczekiwań eksperymentantora (efekcie Rosenthala) i o zastosowaniu podwójnej ślepej próby. Przy przydzielaniu badanych do grup stosuj raczej komputerowe generatory liczb pseudolosowych niż własny instynkt – ludzie nie potrafią generować przypadkowych wzorców. Jeżeli dobór do grupy jest nierandomizowany, bądź nie kontrolujesz zmiennych pośredniczących, zamiast “grupy kontrolnej” określ ją raczej jako “grupę porównawczą”. Pamiętaj, aby zawsze dokładnie opisać charakter i procedurę przydziału badanych do grupy.

4. Zwracaj szczególną uwagę na nazwę raportowanych zmiennych. Nazywaj je w odniesieniu do tego jak zmienna jest mierzona. Przykładowo, zamiast “inteligencja” lepiej napisz “wynik testu IQ”, a zamiast “wykorzystywanie seksualne w dzieciństwie” lepiej użyj określenia “retrospekcyjna ocena stopnia wykorzystywania seksualnego w dzieciństwie”. Nieprecyzyjne nazwy zmiennych wprowadzają czytelników w błąd i mogą być źródłem niewłaściwej interpretacji wyników.

5. Sprawdzaj czy wyszczególnione przez Ciebie wymiary narzędzi badawczych rzeczywiście mierzą to co mierzą i czy robią to trafnie – sprawdzaj trafność i rzetelność wyników uzyskany w Twoim badaniu. Pamiętaj, że statystyki z badań walidacyjnych narzędzi, których używasz dotyczą próby normalizacyjnej, a w Twoim badaniu może być zupełnie inaczej.

6. W opisie wyników opisz wszelkie komplikacje związane ze zbieraniem i analizowaniem danych. Określ braki danych oraz jak wykrywano i radzono sobie z wartościami odstającymi. Sprawdzaj zawsze rozkłady wyników w zakresie poszczególnych zmiennych, sprawdzając nie tylko statystyki numeryczne, ale też graficzne, poprzez histogramy, czy macierze wykresów. Pamiętaj o rozsądnym kodowaniu braków danych – np. używanie popularnej wartości “99” nie jest dobrym pomysłem, jeśli możliwe są takie wartości zmiennych (np. w przypadku wieku)

7. Korzystaj z testów statystycznych, które w najlepszy sposób pomogą Ci przetestować postawione hipotezy – Twoim zadaniem nie jest zaimponowanie innym badaczom i ewentualnym czytelnikom. Korzystaj z programów komputerowych, ale upewnij się, że rozumiesz jak liczone są określone statystyki i w razie czego, kontroluj otrzymane wyniki.

8. Przedstawiaj statystyki testowe w tabelach, ale pamiętaj, że one często nie zastąpią formy graficznej – dobry wykres pozwala szybko zapoznać się z wynikami i zrozumieć zależności między zmiennymi. Staraj się jednak, aby forma graficzna niosła dodatkowe informacje względem statystyk w tabeli (np. efekty proste i efekty interakcji w wieloczynnikowej ANOVA’ie).

9. Raportuj zawsze dokładną wartość statystyki pprzedziały ufności i siły efektu. Zaznaczaj również przedziały ufności na wykresach przedstawiających średnie.

10. Bądź ostrożny w interpretowaniu wyników analizy pod kątem przyczynowości. Pamiętaj, że badania korelacyjne i porównawcze nie pozwalają na jej stwierdzanie.

11. Podobnie, pamiętaj, że wynik pojedynczego badania nie pozwala na wyciąganie jednoznacznych wniosków co do natury badanych zjawisk. Wynik badania zawsze powinien być zestawiany z wynikami innych, analogicznych badań, łącznie z porównywaniem ich sił efektów.

12. Pamiętaj, aby rozróżniać istotność statystyczną od istotności teoretycznej. Fakt, że uzyskałeś wyniki nieistotne statystyczne, nie znaczy, że badane związki między zmiennymi nie występują i nie są istotne. Z kolei uzyskanie wyników istotnych statystycznie nie sprawia automatycznie, że dokonałeś idkrycia istotnego dla świata nauki. Otrzymany istotny statsytycznie efekt może być mało ważny lub bardzo słaby.

13. Interpretacja i dyskusja wyników powinna być krótka, zwięzła i wiarygodna. Nie bój się uogólniać otrzymanych wyników na populację, ale rób to tylko wtedy, gdy masz ku temu przesłanki i oczywiście jasno je wtedy przedstaw. Porównaj wyniki otrzymanych badań do innych. Wskaż konkretne ograniczenia swoich badań i rekomendacje dla innych badaczy (“Potrzebne są dalsze badania w tym zakresie” się nie liczy).

Literatura:

Wilkinson, L., & Task Force on Statistical Inference, American Psychological Association, Science Directorate. (1999). Statistical methods in psychology journals: Guidelines and explanations. American Psychologist, 54(8), 594-604.

Krzywoliniowy związek między zmiennymi. Czy lepszy niż prostoliniowy?

LINIA PROSTA CZY MOŻE KRZYWA?

No właśnie! Jaki model jest lepszym odzwierciedleniem zależności między zmienną X a zmienną Y? Dzięki poniższemu tutorialowi dowiesz się jak sprawdzić czy krzywa jest lepiej dopasowana do danych niż linia prosta. W ciągu 12 lat naszej działalności chyba tylko 1 klient miał postawioną hipotezę, która mówiła o tym, że między zmiennymi zachodzi krzywoliniowa relacja, wiedział on, że da się taką zależność przetestować i świadomie nas o to poprosił. Dlaczego tylko 1? Na pewno nie dlatego, że relacja między dwiema zmiennymi w 99,99% badań jest prosto a nie krzywoliniowa 

Najczęściej hipotezy i swoje oczekiwania co do analizy danych budujecie na podstawie swojej (niestety) niewielkiej wiedzy z zakresu statystyki. Nie raz słyszałem, że “musi być ANOVA” bo moja promotor zna taką nazwę i w ogóle wszyscy na wydziale mają anovę więc u mnie też musi być…. albo – “musi być analiza mediacji choć wcale nie wiem dlaczego nie moderacji, recenzent ponoć mówił, że to teraz modne”.

Celem Pogotowia Statystycznego jest przede wszystkim dydaktyka i taki właśnie edukacyjny charakter ma ten wpis oraz poniższy film. Miej świadomość, że bardzo ważnym założeniem tak dobrze znanej Ci analizy korelacji ze współczynnikiem r Pearsona lub analizy regresji jest liniowa (prostoliniowa) zależność między jedną a drugą zmienną. Widziałem “milion” razy bazy danych, w których niektóre związki między zmiennymi były krzywoliniowe (i w teorii, i “na oko”, i wynikało to również z analiz eksploracyjnych) a mimo wszystko badacz liczył “zwykłe” korelacje lub analizy regresji. Tyle go nauczono, tyle potrafił, tyle mógł świadomie policzyć i opisać ze zrozumieniem. Błędnie.

NIE – JESZCZE NIE JESTEŚ STATYSTYKIEM STULECIA

Nawet mimo tego, że za chwilę dowiesz się jak testować związki krzywoliniowe między dwiema zmiennymi. Dwa sposoby, które pokazujemy na tym tutorialu są i tak, bądź co bądź, banalnie proste, nawet trochę infantylne a w skrajnych ocenach błędne (choć jak wszystko w naszych działaniach – oparte na statystycznej literaturze). Analiza nieliniowych relacji między zmiennymi to bardzo rozbudowany temat i szczerze informuję, że tutaj otrzymujesz od nas tylko pewną zajawkę. Mimo wszystko na pewno wystarczy ona nawet na spore podciągnięcie oceny swojej pracy magisterskiej. Wielu promotorów będzie w niebo wziętych jeśli w poniższy sposób udowodnisz, że między dwiema zmiennymi zachodzi krzywoliniowa relacja. Przykłady takich relacji mógłbym mnożyć i mnożyć … ale mi się nie chce 🙂
Jestem jednak pewien, że Twoja analiza statystyczna do pracy magisterskiej lub doktoratu będzie bogatsza jeśli dodasz do niej analizę związków krzywoliniowych. Oczywiście jeśli będą ku temu przesłanki płynące z teorii i przeglądu dotychczasowych badań innych autorów. Nie traktuj analizy, którą tutaj pokazujemy jako eksplorację i podejście “poklikajmy i zobaczymy co wyjdzie”. Powinieneś mieć jakieś podwaliny by móc przypuszczać i testować krzywoliniową relację między zmiennymi.

Wszystkich dociekliwych odsyłam między innymi do fajnej książki Davida Garsona z North Carolina State University, który opublikował ogrom świetnych e-booków o statystyce pod nazwą Blue Book Series.

Klikając na spinacz po prawej możesz ściągnąć przykładowy, wzorcowy opis wyników pochodzących z estymacji krzywej i testowania hipotezy mówiącej o tym, że model liniowy jest tak samo dobrze dopasowany do danych jak model kwadratowy (hipoteza zerowa). Opis ten został przygotowany w formie nadającej się w szczególności do pracy dyplomowej. W artykule naukowym wyniki powinny być zaraportowane w sposób znacznie bardziej skondensowany. Pamiętaj – ilu jest badaczy, tyle jest pomysłów na opis wyników. Sugeruj się naszym, ale nie jest to jedyne, doskonałe wyjście. Jeśli znajdziesz lepszy sposób to koniecznie się nim z nami podziel!

Tutaj masz bazę danych, na której pracowaliśmy w tym tutorialu

Odchylenie standardowe – czyli nie samą średnią człowiek żyje :)

Wykonując analizy statystyczne wyników do pracy magisterskiej, doktorskiej czy artykułu naukowego, wyliczamy i przedstawiamy szereg statystyk/estymatorów. W przypadku zmiennych ilościowych, najczęściej najważniejszą z nich jest średnia arytmetyczna, ponieważ traktujemy ją, jako główny wskaźnik określający wartość mierzonego przez nas parametru, np. nasilenia jakiejś cechy lub poziomu danej zdolności. Średnia arytmetyczna jest szczególnie ważną statystyką w przypadku testów porównujących średnie, takich jak test t Studenta czy ANOVA, ponieważ m.in. na jej podstawie określamy czy zaobserwowane różnice między porównywanymi grupami są istotne statystycznie.

Wnioskowanie statystyczne nie polegają jednak na wyliczaniu bądź porównywaniu samych średnich arytmetycznych, a na porównywaniu rozkładów wyników zebranych z danych prób, w celu określenia czy (prawdopodobnie) pochodzą z tej samej populacji. Dlatego też, nawet w przypadku dużych rozbieżności w wartości średnich, wynik testu może okazać się nieistotny statystycznie. Obrazuje to poniższy rysunek, na którym widać, że mimo tych samych wartości średnich, rozkłady w różnym stopniu nakładają się na siebie, co oczywiście ma swoje odbicie w wyniku testu oraz jego istotności statystycznej. Oznacza to, że im większa jest wartość odchylenia standardowego porównywanych rozkładów, tym większe muszą być różnice w średnich, aby uznać, że określone rozkłady istotnie statystycznie różnią się między sobą.

 

Jeżeli zmienność wyników wokół średniej ma wpływ na wynik testu, oczywistym jest, że wzór do obliczenia wyniku testu, a co za tym idzie jego istotności statystycznej, musi zawierać w sobie jakiś wskaźnik dotyczący tej zmienności. Wskaźnikiem tym jest wariancja, która jest miarą zmienności wyników w rozkładzie wokół wartości oczekiwanej – w tym przypadku średniej (wariancja wyliczana jest jako średnia arytmetyczna kwadratów odchyleń poszczególnych wartości od średniej).

PAMIĘTAJ, ŻE WARIANCJA TO ODCHYLENIE STANDARDOWE PODNIESIONE DO KWADRATU, A ODCHYLENIE STANDARDOWE TO PIERWIASTEK KWADRATOWY Z WARIANCJI. Oba te estymatory są względem siebie zależne. 

Powyższe przykłady pokazują, że sama wartość średniej arytmetycznej nie jest dobrym wskaźnikiem dotyczącym otrzymanych wyników i musi ona zostać uzupełniona o statystykę opisującą rozproszenie wyników wokół średniej. W praktyce, nie podaje się wyżej wymienionej wartości wariancji, a odchylenia standardowego, która obliczana jest poprzez wyciągnięcie pierwiastka z wariancji. Dlaczego? Jest tak z racji tego, że wariancja obliczana jest, jako suma kwadratów odchyleń od wartości średniej – po to, żeby wyniki dodatnie i ujemne nie zniosły się wzajemnie – więc spierwiastkowanie tej wartości pozwala na “powrót” do “właściwej” wartości średniego odchylenia. Czyli? Czyli odchylenie standardowe wyrażone jest w jednostkach pomiaru zmiennej, którą mierzyć a wariancja nie. Wszystko to jest powodem, dla którego znienawidzona i niezrozumiała dla wielu osób wartość odchylenia standardowego, raportowana jest prawie zawsze przy wartości średniej. Dzięki niej możemy od razu zobrazować rozkład wszystkich wyników, a nie tylko samą średnią.

No dobra, wiemy już, że odchylenie standardowe to średnie odchylenie wyników od średniej. I co z tego? Do czego potrzebna jest nam ta informacja? W dużej mierze, dzięki niej, jesteśmy w stanie zrozumieć, na ile średnia arytmetyczna jest trafną wartością określającą otrzymane wynikiPrzyjmuje się, że jest tak w sytuacji, w której wartość odchylenia standardowego nie przekracza około 1/3 wartości średniej. Przykładowo, jeśli średni wiek badanych wyniósł 40 lat, a odchylenie standardowe 10, to wiemy, że większość osób badanych jest w wieku rzeczywiście zbliżonym do 40 lat. Występuje względnie silna koncentracja wyników wokół średniej. Natomiast gdyby przy tej średniej, odchylenie standardowe wyniosło 30, to istnieje szansa, że niewiele osób badanych jest wieku bliskim 40 lat – w dużej mierze zależy to od rozkładu wyników.

PAMIĘTASZ O JEDNORODNOŚCI WARIANCJI?

Jeśli tak, to super! Jeśli nie to koniecznie przeczytaj nasz wpis o tym czym jest ich homogeniczność i dlaczego jest taka ważna:
https://pogotowiestatystyczne.pl/slowniczek/rowne-wariancje/

Jednorodność wariancji to prawie to samo co jednorodność odchyleń standardowych. Dla większości analiz, które dobrze znacie (jak np. test t Studenta czy ANOVA) ważnym założeniem jest, aby odchylenia standardowe w porównywanych grupach były podobne do siebie. Średnie oczywiście nie. Zazwyczaj im bardziej się różnią tym dla Was lepiej. Odchylenia standardowe powinny być jedna podobne. Jeśli w jednej grupie SD (z ang. Standard Deviation) wynosi 12, a w drugiej 36 to oznacza, że prawdopodobnie na wyniki działa jakiś czynnik, którego nie kontrolujecie a nie tylko Wasza zmienna niezależna.

Należy jednak pamiętać, że odchylenie standardowe ma jedną istotną wadę – nie zawiera w sobie informacji o symetrii rozkładu. Wracając do powyższego przykładu dotyczącego wieku – przy średniej wieku 40 lat i odchyleniu standardowym 30, może być tak, że większość badanych jest w wieku ok 20 lat i ok 60 lat, jednakże również istnieje szansa, że 75% badanych jest wieku ok 20 lat, a reszta w wieku ok 90, lub na odwrót. W obu przypadkach, wartość odchylenia standardowego jest podobna, jednak rozkłady wyników – zupełnie różne. Dlatego też, warto raportować i zwracać uwagę na inne statystyki opisowe, takie jak wartość minimalna, maksymalna czy wartość skośności (asymetrii) czy kurtozy rozkładu.