Archiwum dla miesiąca: czerwiec 2021


 OTWÓRZ / POBIERZ ARTYKUŁ JAKO PLIK PDF 

 

Czym jest charakterystyka próby?

Badania naukowe najczęściej przeprowadzane są na ludziach, choć oczywiście mogą dotyczyć też zwierząt (nie raz liczyliśmy wyniki dotyczące myszy, gęsi, a nawet… kleszczy!) czy innych zjawisk, np. samochodów (jakie są koszty naprawy klimatyzacji autobusów marki Solaris?) czy zjawisk naturalnych (czy wielkość wzrostu groszku pachnącego zależy od nasłonecznienia terenu?). Kogokolwiek lub cokolwiek badasz, musisz o tym jasno napisać w metodologii badania, w podrozdziale pt. charakterystyka próby badawczej. Jeśli badasz ludzi – napisz konkretnie czy to było 200 osób -w wieku 70-80 lat chorujących na padaczkę czy może 20 chłopców w wieku 12-13 lat uczących się w klasie sportowej w Warszawie. To ma znaczenie! Przede wszystkim, na podstawie tych informacji określić można na ile uzyskane wyniki są możliwe do zgeneralizowania (na inne populacje), a także odtworzyć badania przez innych naukowców.

W przypadku prac dyplomowych (głównie licencjackiej i magisterskiej, ale także doktorskiej) tworzenie charakterystyki próby to formalność – element procesu edukacji, w którym student udowadnia swoją znajomość struktury raportu z badania. Jest to rodzaj treningu przed późniejszym, ewentualnym zanurzeniem się w prawdziwą pracę naukową. Jednak w przypadku badań publikowanych, charakterystyka próby ma dużo większe znaczenie – umożliwia dokonywanie porównań między replikacjami badania (może wyniki w naszym badaniu są inne niż w tym, na które się powołujemy w teorii, bo badanie na studentach psychologii przynosi inne rezultaty niż na osobach ze wsi w wieku 40-50 lat?), a także może stanowić ważne źródło informacji w przypadku opracowywania metaanalizy (zbiorczej analizy wyników wielu badań z danego zakresu).

Po co zbierać dane socjodemograficzne?

Dane socjodemograficzne można wykorzystać w analizie statystycznej. Albo w prostych analizach korelacji (np. testując związek między wiekiem i wykształceniem a zmiennymi głównymi) lub porównań średnich (porównując kobiety i mężczyzn lub osoby ze wsi i z miast) albo w analizach bardziej zaawansowanych, kontrolując wpływ zmiennych socjodemograficznych na testowane efekty za pomocą analizy regresji, kowariancji czy modelowania równań strukturalnych.

Niezależnie od tego czy dane socjodemograficzne zostaną uwzględnione w analizie, mogą stanowić ważny materiał przydatny przy dokładniejszej interpretacji wyników. Przykładowo, jeśli porównujesz dziewczyny i chłopców klasy 6B szkoły podstawowej w Starogardzie Gdańskim pod względem sprawności, warto zebrać też dane m.in. dotyczące uprawianych przez nich sportów. Może moje badania wykażą, że dziewczyny były sprawniejsze od chłopców nie dlatego, że takie zjawisko występuje w populacji, tylko dlatego że akurat w tej klasie były dwie dziewczyny trenujące na ogólnopolskim poziomie?  Albo załóżmy, że porównujesz schizofreników i osoby zdrowe psychicznie pod względem poziomu depresji i okazuje się, że Twoje są inne niż te uzyskane przez innych autorów. Posiadając dane demograficzne, takie jak długość chorowania, ilość hospitalizacji, rodzaj stosowanego leczenia, możesz porównać badane próby między sobą, aby określić czy rzeczywiście pochodzą z jednej populacji. Może okazać się, że Twoja próba różniła się od innych, ponieważ objęła osoby o krótkiej historii choroby (średnio kilka lat), podczas gdy inne badania były robione na osobach chorujących w okresie kilkunastu lub kilkudziesięciu lat. Dzięki tym informacjom możesz domniemać, że różnice między badania mogą być (choć oczywiście nie muszą) efektem tych różnic (czyli realnie badałeś inną populację niż pozostali autorzy). Oczywiście wnioski z tych refleksji należy przedstawić w rozdziale z dyskusją wyników. Dzięki temu kolejne badania, Twoja lub innych autorów, będą mogły uwzględnić te różnice, co długofalowo sprzyja gromadzeniu ogólnej wiedzy dotyczącej danego zjawiska, czy całej dziedziny jaką jest psychologia kliniczna. Nawet, jeśli badasz populacje niekliniczne, np. pielęgniarki pracujące w szpitalu, warto zebrać dane dotyczące tego w jakim trybie pracują (nocnym czy dziennym), na jakim oddziale i jaki mają ogólny staż pracy.

Co uwzględnić w charakterystyce próby?

Jaki zakres informacji powinna obejmować charakterystyka próby? Według najnowszej, siódmej edycji podręcznika przedstawiającego zasady raportowania w standardzie APA (American Psychological Association, 2019), powinny być to podstawowe dane demograficzne, takie jak: wiek, płeć, wykształcenie czy status socjoekonomiczny. Dodatkowo, należy uwzględnić inne, ważne dane specyficzne dla danej próby, jeśli takie są. Które dane tego rodzaju są istotne? Czy wystarczą dwie czy trzy takie informacje czy może trzeba zebrać ich jak najwięcej? W tym względzie nie ma jasnych wytycznych, wszystko zależy od badanej populacji i przedmiotu badania. Również promotorzy mają w tym względzie zróżnicowane wymagania – niektórzy oczekują krótkiego opisu na kilka linijek, a inni obszernego opisu wraz z tabelami lub wykresami, zajmującego kilka stron. W artykułach naukowych korzysta się raczej z krótkiego opisu, można też spotkać zbiorcze zestawienia danych zawarte w tabeli.

Również w samym podręczniku dotyczącym standardu APA znajdziemy dwa, różniące się od siebie przykłady charakterystyki próby. Z jednej strony znajduje się w nim krótki przykład opisu próby w tekście:

Druga grupa obejmowała 40 kobiet w wieku pomiędzy 20, a 30 lat (M = 24,2; SD = 2,1; Mdn = 25,1), emigrantek z Salwadoru, posiadających przynajmniej 12 lat edukacji i będących stałymi rezydentami Stanów Zjednoczonych, mieszkających przynajmniej 10 lat w Waszyngtonie.

Źródło: Podręcznik APA 7th, s. 83
(podrozdział 3.6: Quantitive Method Standards)

A z drugiej strony bardziej rozległa charakterystyka próby, przedstawiona w formie tabeli

 

Mimo dużych różnic w objętości przedstawionych danych, obie charakterystyki, zgodnie z założeniem, przedstawiają podstawowe dane. Przydałoby się jednak więcej konkretnych informacji, umożliwiających dokonanie wyboru podczas projektowania badania lub raportowaniu wyników analizy.

Rekomendacje Pogotowia Statystycznego

Z racji tego, że wykonaliśmy tysiące analiz statystycznych, mamy duże doświadczenie zarówno w przygotowywaniu analizy danych socjodemograficznych, jak i wykorzystywaniu ich przy interpretacji wyników dotyczących weryfikacji hipotez. Jeśli Twoje badanie dotyczy popularnych konstruktów (takich jak poziom jakości życia czy radzenie sobie ze stresem), a próbą są osoby zdrowe z populacji ogólnej, zalecamy przede wszystkim zbieranie czterech podstawowych danych: płci, wieku, wykształcenia i miejsca zamieszkania. Opcjonalnie jako piątą zmienną, można włączyć stan cywilny, choć polecamy odejście od klasycznego, nieaktualnego w dzisiejszych czasach podziału, w którym to osoby w związku małżeńskim traktowane są jako realnie będące w związku, a te będące nawet w wieloletnim konkubinacie traktowane są jako “kawaler/panna” (czyli faktycznie poza trwałym związkiem). Polecamy przydzielić badanych do jednej z dwóch grup – będących w stałym związku (niezależnie jakiego charakteru) oraz niebędących w stałym związku.

Jeśli jednak badasz próbkę z jakiejś specyficznej populacji, z podstawowych danych socjodemograficznych możesz zebrać tylko płeć i wiek, a więcej uwagi poświęcić tym charakterystycznym dla danej populacji. Nie jest to jednak żelazna zasada, wszystko zależy od specyfiki populacji, ale nie tylko – istotny jest też przedmiot badania. Przykładowo, jeśli analizie poddajesz osoby z depresją, dane dotyczące ich specyfiki leczenia (np. stażu chorowania, obecnego nasilenia objawów, ilość i długości przyjmowania leków) będą istotne, jeśli porównujesz osoby z depresją leczone vs nieleczone psychoterapeutycznie, ponieważ mogą wchodzić one w interakcje ze zmiennymi głównymi. Jednak informacje te będą mniej przydatne, jeśli porównujesz osoby z depresją i osoby zdrowe psychicznie pod względem jakości życia. Analogicznie, szczegółowe dane socjodemograficzne przy grupach klinicznych zwykle nie są najważniejsze, jednak mogą być istotne, jeśli badanie dotyczy poziomu wiedzy dotyczącej doświadczanej choroby, ponieważ ta we wszystkich populacjach (osób zdrowych i różnych grup chorych) zależy od statusu socjodemograficznego. Dlatego pamiętaj, żeby zbierane dane były ważne z punktu widzenia zarówno charakteru badanej populacji jak i tego co konkretnie jest badane.

Warto zadbać o to, aby charakterystyka próby nie była nadmiernie rozbudowana – w raportowaniu wyników analiz statystycznych nie obowiązuje zasada pt. “im więcej tym lepiej” (zwięzłość i przejrzystość przedstawienia wyników to podstawowe wymaganie w standardzie APA). Z naszego doświadczenia wynika, że jeśli analiza zmiennych socjodemograficznych jest zbyt rozbudowana – albo objętościowo (zawiera się na czterech stronach) albo pod względem gęstości danych (zostaje ona przedstawiona w 40 wierszach w tabeli, a na dodatek w podziale na 5 podgrup) to staje się nieczytelna, a co za tym idzie trudna w interpretacji. Dlatego też, zalecamy trzymać się zasady  raportowania wszystkiego tego co konieczne, ale im mniej, tym lepiej.

Sztuką w statystyce jest nie tyle samo wykonanie obliczeń, co umiejętne pokazanie uzyskanych wyników, aby możliwa była ich względnie szybka interpretacja. Jeśli ktoś kiedykolwiek zajmował się analizą wielu tekstów naukowych w krótkim czasie (jest to potrzebne już przy pisaniu dobrego licencjatu) ten wie, że artykuły często czyta się pięcioma rzutami okiem – abstrakt, tabele, pojedyncze akapity podsumowania, i przechodzimy do kolejnego artykuł. Dlatego też mniejszy zbiór danych, np. dotyczący tylko czterech wyżej wymienionych zmiennych, można zaraportować w tekście. Jednak każdą większą ich ilość, lepiej umieścić w tabeli, tym bardziej jeśli w badaniu są wyróżnione grupy, dla których dane te można porównywać. Zamieszczenie danych w tabeli umożliwia szybką ich interpretację – najpierw ogarniamy wzrokiem całą tabelę, szybko orientujemy się jakie dane są w nich zawarte, wyciągamy wszystkie niezbędne dla nas informacje, porównujemy wartości w poszczególnych komórkach i w ciągu kilkunastu sekund uzyskujemy potrzebną orientacją. Interpretacja taka nie jest możliwa w przypadku dużej liczby danych przedstawionych w tekście. Z tego miejsca pozdrawiamy całe zastępy naszych klientów, których promotorzy zmuszali ich do raportowania charakterystyki próby w smutnej, rozwlekłej na kilka stron formie. Klienci – łączymy się z Wami w bólu. Promotorzy – wiedzcie, że w każdej takiej sytuacji ginie mały króliczek [*].

Raportowanie dużej liczby wyników w tabeli, a małej w tekście to nie nasz wynalazek, a wytyczna APA, opisana w podręczniku. Co więcej, zgodnie ze standardem APA 7th prezentacja tabelaryczna i tekstowa są równorzędne. Danych przedstawionych w tabeli nie należy powielać w tekście, choć dozwolone jest, aby wymienić te szczególnie ważne. Zatem, jeśli w swojej pracy wkleisz tabelę z 30 podanymi wartościami, nie musisz ich wszystkich przepisywać jeszcze raz w tekście (jeśli Twój promotor uważa inaczej – nie daj się “zrobić się w balona”), możesz co najwyżej podać kilka najważniejszych wartości (poniżej znajdują się przykłady). Po to umieszczasz dane w tabeli, aby każdy potencjalny czytelnik mógł je odczytać, w całości lub zwracając uwagę na interesujący go zakres. Powielenie wszystkiego w tekście utrudni jedynie ich interpretację. Mimo tego w tekście można nawiązać do najważniejszych danych w tabeli, jeśli ułatwi to jego odbiór.

Przykłady tworzenia charakterystyki próby

 

Przykład 1 – krótka charakterystyka próby w całości w tekście

W badaniu wzięło udział 77 osób, z czego 42 kobiet i 35 mężczyzn z diagnozą depresji, w wieku między 26, a 48 lat (M = 35,85; SD = 9,83). Każdy z badanych był w trakcie leczenia farmakologicznego, a dodatkowo 37 osób (48,05%) leczyła się obecnie lub w przeszłości psychoterapeutycznie.

Przykład 2 – krótki opis w tekście + tabela ze statystykami opisowymi

W badaniu wzięło udział 61 osób, z czego 22 kobiet i 39 mężczyzn, chorujących na stwardnienie rozsiane w postach rzutowo-remisyjnej. Wiek badanych mieścił się w przedziale 33, a 58 lat (M = 37,43; SD = 12,21). Wszyscy badani byli poddawani leczeniu farmakologicznemu. Dodatkowe dane dotyczące leczenia przedstawiono w tabeli 1.

Przykład 3 – krótki opis w tekście uzupełniony pełną charakterystyką w tabeli

W badaniu wzięło udział 98 osób, z czego 56 kobiet (57,1%) i 42 mężczyzn (42,9%) w wieku od 33 do 57 lat (M = 42; SD = 7,42) Największy ich odsetek stanowiły osoby mieszkające w dużych miastach, powyżej 500 tysięcy mieszkańców (45,9%) oraz legitymujące się wykształceniem średnim (35,7%) lub wyższym (32,7%).  Niewiele ponad połowa z nich była w związku (54,1%), a pozostałe 45,9% poza związkiem. Szczegółowe dane przedstawione są w tabeli 2.

Przykład 4 – rozbudowana charakterystyka próby w tabeli + krótki opis

W badaniu wzięło udział 101 osób, z czego 80 kobiet i 21 mężczyzn. Ich średni wiek wynosił 38,5 lat (SD = 11,05; Mdn = 37). Większość badanych stanowiły pielęgniarki (63,4%), najwięcej osób pracowało na Szpitalnym Oddziale Ratunkowym (56,4%). Największy odsetek badanych posiadał staż pracy powyżej 20 lat (31,7%) oraz charakteryzowało wykształcenie wyższe magisterskie (46,5%) oraz licencjackie (40,6%). Szczegółowa charakterystyka próby przedstawiono została w tabeli 3.

 

Pamiętaj o ważnych zasadach dotyczących raportowania wyników!

Na koniec przypominamy kilka istotnych zasad raportowania w standardzie APA. Część z nich będzie podsumowaniem informacji przedstawionych do tej pory, a część pojawi się po raz pierwszy.

  • Dla zmiennych nominalnych raportuj częstość i procent, z czego procent jest ważniejszy (i go lepiej pokazać na wykresie, zamiast częstości)
  • W przypadku zmiennych ilościowych raportujemy statystyki opisowe, z czego dwie najczęściej pokazywane to średnia i odchylenie standardowe. Czasami warto przedstawić też wartość minimalną i maksymalną (np. oprócz tego, że badani byli w wieku średnio M = 20,15; SD = 10,15 warto wiedzieć czy jego zakres to od 18 do 47 lat czy od 10 do 32). W sporadycznych przypadkach raportuje się też medianę.
  • Przy tworzeniu tabel lub opisu pamiętaj, że N to oznaczenie liczebności całej próby, natomiast właściwym oznaczeniem dla liczebności wyróżnionej podgrupy jest małe n (np. próba składała się z = 100 osób z czego n = 42 stanowiły kobiety a n = 58 mężczyźni).
  • Zapisuj symbole wszystkich statystyk (takich jak MSDMdnN) kursywą.
  • Przy zapisie wartości liczbowych, między znakami matematycznymi, a innymi elementami tekstu stosujemy spacje, np. M = 12,32; SD = 7,48. Oznacza to, że po obu stronach znaku równości znajdować się powinny spacje.

W razie pytań lub wątpliwości – zapraszamy do darmowych konsultacji!

 

Bibliografia
American Psychological Association. (2019). Publication manual of the American Psychological Association, Seventh Edition. Washington, DC: American Psychological Association.
Nęcka, R. Stocki. (2020). Jak pisać prace naukowe z psychologii. Kraków. Wydawnictwo Universitas.
Brzeziński J. (2019). Metodologia badań psychologicznych. Warszawa. Wydawnictwo Naukowe PWN.