Archiwum dla miesiąca: sierpień 2016


Wykres skrzynkowy, pudełkowy, ramka – wąsy lub z angielskiego box plot.

Wiele nazw a wykres ten sam. My będziemy nazywali go wykresem skrzynkowym. Nie wiem czy nazwa ta jest najbardziej popularna czy nie. Na pewno jesteśmy do niej najbardziej przywiązani i to właśnie jej używamy w naszej codziennej pracy. W dzisiejszym poście chcemy omówić każdy element wykresu skrzynkowego, a jak się za chwilę okaże, jest on dosyć rozbudowany. Niesie on ze sobą wiele informacji, więc dobrze jest zrozumieć co przedstawiają.

Po co rysujemy wykres i dlaczego akurat skrzynkowe? Niczego nowego przed Tobą nie odkryjemy ponieważ często inne rodzaje wykresów rysuje się w tym samym celu. Wykresy skrzynkowe rysujemy zazwyczaj z dwóch powodów.

  • Eksploracja danych
    Z uwagi na wartość informacyjną wykresów skrzynkowych są one często wykorzystywane w pierwszym lub drugim kroku stosunkowo pobieżnej eksploracji danych, z którymi przyjdzie zmierzyć się analitykowi. Bez potrzeby przeglądania, czasami gigantycznych tabel z podstawowymi statystykami opisowymi, klikania tu, klikania tam, wystarczy szybki rzut oka na wykres by zobaczyć “co w trawie piszczy”. Prawdopodobnie najważniejszy jest jednak fakt, że wykresy skrzynkowe wskazują na to czy w bazie danych występują obserwacje odstające czy nie. Wynik nietypowy, odstający od reszty, outlier czy nawet dewiant to nazwa obserwacji (najczęściej wyniku badanej osoby lub innego podmiotu badań), której rezultat może negatywnie wpłynąć na wyniki przeprowadzanych testów statystycznych. Dobrze jest mieć narzędzie, które jest detektorem takich przypadków (choć wykres skrzynkowy nie jest jedyny)
  • Zilustrowanie różnic między grupami lub między kolejnymi pomiarami
    Szczególnie w przypadku analiz statystycznych w naukach medycznych zdarza nam się ilustrować różnice między porównywanymi grupami lub kolejnymi pomiarami wykonanymi w różnych odstępach czasu, przy użyciu wykresu skrzynkowego. W medycynie, biotechnologii i im podobnych bardzo często wykonuje się po prostu testy nieparametryczne w celu potwierdzenia postawionych hipotez. Gdy wykonujemy testy nieparametryczne, które nie porównują przecież średnich arytmetycznych tylko inne miary, dobrze jest wykonać właśnie wykresy skrzynkowe zamiast standardowych wykresów słupkowych lub innych prezentujących średnie i przedziały ufności, odchylenia lub błędy standardowe. Wykresy skrzynkowe prezentują mediany i odchylenia od nich, a to bardzo dobry sposób ilustracji wyników uzyskanych w toku przeprowadzonych testów nieparametrycznych.

Zanim zaczniemy omawiać wykres skrzynkowy.

Przed omówieniem kolejnych elementów wykresu skrzynkowego najpierw dokonam małego wyjaśnienia dotyczącego zmiennej, którą będziemy dziś poddawać analizie. Mianowicie, będą to tak zwane paczkolata. Szczególnie w naukach medycznych, gdy pomagamy wykonać analizy statystyczne wraz z opisem do jakiejś publikacji naukowej napotykamy na taką właśnie zmienną. Oczywiście jeszcze zależy czego dotyczy samo badanie bo pomiar paczkolat to nie jest jakaś szczególna domena badań w medycynie jako ogółu. Chcąc sprawdzić czy palenie papierosów współwystępuje lub wpływa na jakieś inne zmienne najczęściej nie mierzy się ani samej liczby wypalanych papierosów w ciągu dnia, ani też samego stażu jako osoby palącej. Wylicza się tak zwaną liczbę paczkolat ze wzoru:

LICZBA WYPALANYCH PACZEK PAPIEROSÓW W CIĄGU DNIA x LICZBA LAT PALENIA

Paczkolata to po prostu iloczyn przeciętnej liczby papierosów wypalanych w ciągu 24 godzin wyrażonej w liczbie paczek pomnożona przez staż palacza w latach. Ta tabela powinna wszystko wyjaśnić i rozwiać ewentualne wątpliwości.

Osoba nr. Papierosy na dzień mierzone liczbą paczek Liczba lat palenia papierosów Paczkolata
1 1 40 40
2 1,5 10 15
3 0,5 2 1
4 0,2 6 1,2
5 1 7 7

Zmienna “paczkolata” mówi po prostu o nasileniu i stażu palenia jednocześnie.

WYKRES SKRZYNKOWY – spora paczka informacji statystycznych na jednym rysunku

Jak już wspominałem, wykres skrzynkowy niesie ze sobą sporo różnych informacji na temat rozkładu mierzonej zmiennej. Jest ich tak dużo, że omówię je teraz w podpunktach. Zanim przejdziemy jednak do analizowania wykresu skrzynkowego dla mierzonych przez nas paczkolat to przyjrzymy się po prostu jakiemuś hipotetycznemu rysunkowi.

Oto wykres skrzynkowy z opisanymi pięcioma najważniejszymi dla niego elementami. Jak widzisz, niektóre elementy mają te same oznaczenia literowe. Wynika to z tego, że wykres skrzynkowy jest wykresem symetrycznym z punktu widzenia jego poszczególnych elementów. Oczywiście zdarza się, że górny wąs jest dłuższy, a dolny krótszy. Czasami obserwacje odstające są tylko na górze, a czasami tylko na dole. W takim sensie wykres skrzynkowy może być bardzo asymetryczny.

A) Obserwacja ekstremalna (dolna lub górna) to jeden lub kilka wyników uzyskanych przez badane osoby, które spełniają taki warunek:

Górna wartość ekstremalna:

wynik badanego ≥ Q3 + IQR * 3

…czyli? Czyli gwiazdką oznaczony będzie każdy wynik, który jest większy niż rezultat dodania do wartości trzeciego kwartyla (Q3) wartości uzyskanej poprzez pomnożenie rozstępu kwartylowego (czyli inaczej rozstępu ćwiartkowego) i trójki (IQR * 3).

Dolna wartość ekstremalna:

wynik badanego ≤ Q1 – IQR * 3

Czyli gwiazdkę na dole wykresu zobaczymy, gdy jeden lub kilku badanych osób uzyska wynik interesującej nas zmiennej, który będzie niższy niż rezultat odejmowania iloczynu rozstępu ćwiartkowego i trójki od wartości pierwszego kwartyla.

Innymi słowy, obserwacja ekstremalna to taka, która jest oddalona od skrzynki o jej 3 “długości” (3 razy wysokość skrzynki). W górę lub w dół

Mało z tego rozumiesz? Nie martw się. Zaraz przejdziemy do praktycznego przykładu dla mierzonych paczkolat i wszystko stanie się jasne!

B) Górny i dolny outlier czyli obserwacja odstająca to niemal to samo co obserwacja ekstremalna, ale spełniająca trochę inne kryterium.

Pamiętaj, że obserwacja ekstremalna też jest obserwacją odstającą. Też jest outlierem i to nawet jeszcze bardziej nietypowym!

Górny outlier:

wynik badanego ≥ Q3 + IQR * 1,5

Dolny outlier:

wynik badanego ≤ Q1 – IQR * 1,5

Jak widzisz, kryterium jest niemal takie samo, ale rozstęp ćwiartkowy mnożymy razy 1,5 a nie razy 3.

C) Najwyższy i najniższy wynik, który nie jest outlierem.

Jak sama nazwa wskazuje. Górny tak zwany “wąs” jest na wykresie zawsze na wysokości wartości uzyskanej przez osobę o najwyższym wyniku, ale takiej osoby, która nie jest obserwacją odstającą ani ekstremalną.

Dolny wąs kończy się zawsze na wartości najniższego wyniku, ale nie najniższego w całej bazie danych, tylko najniższego wyniku, który nie jest ani dolnym outlierem ani dolną obserwacją odstającą.

D) “Podłoga” i “sufit” skrzynki, czyli wartości zamykające skrzynkę z dołu i z góry to wyniki pierwszego kwartyla (Q1) i trzeciego kwartyla (Q3).

Pamiętaj, że pierwszy kwartyl to wartość 25% rozkładu wszystkich wyników a trzeci kwartyl to wynik 75% rozkładu wszystkich wyników. Więcej o kwartylach przeczytasz w naszym słowniczku statystycznym wyjaśniającym najważniejsze pojęcia. Tutaj: KWARTYLE

E) Pozioma linia wewnątrz skrzynki prezentuje wartość mediany, czyli drugiego kwartyla.

Mediana to wartość środkowa rozkładu mówiąca o tym, jaki wynik uzyskany w zakresie mierzonej przez nas zmiennej dzieli wszystkich badanych na (niemalże) dwie równe połowy. Więcej o medianie piszemy w słowniczku statystycznym. Tutaj: MEDIANA

Trzeci kwartyl minus pierwszy kwartyl czyli rozstęp ćwiartkowy

Jak zauważyliście, wspominałem już wyżej o czymś takim jak rozstęp międzykwartylowy, rozstęp ćwiartkowy lub w skrócie IQR. Jako, że wyrażenie logiczne pomocne w zdiagnozowaniu, czy ktoś jest outlierem, czy obserwacją ekstremalną, zawiera w sobie IQR. Należy w tym miejscu wyjaśnić co to oznacza i jak się to coś liczy. Skrót IQR pochodzi z angielskiego interquartile range. Tłumacząc dosłownie na język polski będzie to rozstęp międzykwartylowy, a tłumacząc trochę mniej dokładnie, ale poprawnie, będzie to rozstęp ćwiartkowy.

Rozstęp ten to po prostu różnica między wartością trzeciego a pierwszego kwartyla. Jeśli np. wartość pierwszego kwartyla wzrostu wszystkich studentów Uniwersytetu Jagiellońskiego wynosi 150 cm a wartość trzeciego kwartyla wynosi 183 cm to rozstęp międzykwartylowy wynosi 33 cm ponieważ 183 – 150 = 33.

W naszym pomiarze liczby paczkolat wyliczone kwartyle wyglądają następująco.

Czerwone strzałki prowadzają od wartości 3 kwartyla wyliczonego przy pomocy pakietu SPSS do “sufitu” wykresu skrzynkowego. Zielone strzałki to jego “podłoga”, którą stanowi pierwszy kwartyl. Mediana to środkowa wartość i jednocześnie wartość drugiego kwartyla bo przecież jeden kwartyl to 25% rozkładu wyników a 2 x 25% to 50% 🙂

Zauważ, że wartość mediany nie leży idealnie po środku skrzynki. Wcale nie musi! Położenie mediany w stosunku do pierwszego i trzeciego kwartyla mówi nam między innymi o tym jak bardzo asymetryczny jest nasz rozkład oraz o tym, czy jest to asymetria dodatnia (rozkład prawoskośny), czy ujemna (rozkład lewoskośny). Wyjaśnimy to jednak w innym wpisie na blogu.

Jak łatwo policzyć rozstęp ćwiartkowy paczkolat w naszej grupie badanych palaczy wynosi 13. Dlaczego? Ponieważ 33 (Q3 czyli kwartyl trzeci) minus 20 (Q1 czyli kwartyl pierwszy) = 13.

 

Rysujemy wykres skrzynkowy.

W celu narysowania wykresu skrzynkowego dla jednej analizowanej zmiennej klikamy na wykresy, a następnie na wykresy-tradycyjne i następnie na skrzynkowy. W poniższym oknie dialogowym, które się pojawi musimy wybrać typ wykresu “Prosty” oraz na dole zaznaczyć kropką “Podsumowanie oddzielnych zmiennych by ostatecznie kliknąć Definiuj.

menu-wykres

W kolejnym oknie dialogowym definiujemy dla jakiej zmiennej chcemy narysować wykres skrzynkowy. W naszym przypadku przenosimy tylko paczkolata z lewej strony na prawą do okna o tytule “Skrzynki przedstawiają” i naciskamy na OK

wykres-ostatnie-menu

 

Wiemy już, że mediana czyli drugi kwartyl wynosi 23 paczkolata i na tym poziomie widzimy środkową linię w środku skrzynki.

Pierwszy kwartyl wynosi 20 paczkolat i na tym poziomie znajduje się “podłoga” wykresu skrzynkowego. Z kolei “sufit” znajduje się na wysokości 33 paczkolat ponieważ tyle wynosi wartość trzeciego kwartyla rozkładu analizowanej zmiennej. Cóż jeszcze widzimy prócz samej skrzynki? Są wąsy, są kropki i są gwiazdki.

Żeby dowiedzieć się dlaczego dany respondent jest dolną albo górną kropką lub jedną z górnych gwiazdek, czy też jednym z wąsów, musimy wykonać kilka obliczeń.

Aha! Jeszcze jedno. Przy każdej gwiazdce i kropce widzisz cyfrę lub liczbę. Określa ona numer badanego w bazie danych. Łatwo go dzięki temu namierzyć i odfiltrować.

 

UWAGA! Gwiazdki i kropki są “podejrzanie” ponumerowane jedna po drugiej (po kolei). To nie przypadek. Po prostu przed narysowaniem wykresu posortowałem w bazie danych wyniki paczkolat od największych do najmniejszych. Zrobiłem to dla ułatwienia wykonania kolejnego rysunku. Najczęściej w Waszych badaniach zmienne nie będą posortowane i tym samym numeracja kropek i gwiazdek nie będzie “po kolei”.

 

Gwiazdki, kropki, wąsy, czyli co?

Zacznijmy od górnych obserwacji ekstremalnych czyli palaczy, których liczba paczkolat spełnia warunek, o którym pisałem już wyżej:

wynik palacza ≥ Q3 + 3 * IQR

Znamy już wartości kwartyli oraz rozstępu ćwiartkowego więc podstawiamy dane do wzoru:

Wynik palacza ≥ 33 + 3 * 13 —> Wynik palacza ≥ 33 + 39

… czyli wynik palacza większy od 72 lub równy tej wartości (rezultat dodawania 33 + 39) będzie uznawany za górną obserwację ekstremalną.

Dolną obserwację ekstremalną będą stanowili palacze, którzy spełnią warunek

Wynik palacza ≤ Q1 – 3 * IQR —> Wynik palacza ≤ 20 – 39 —> Wynik palacza ≤ -19

Jest to wynik niemożliwy do uzyskania ponieważ wynik paczkolat nie może być wartością ujemną. Podobnie jak np. wiek, czas reakcji lub waga jakiegoś przedmiotu. Mimo wszystko z teoretycznego punktu widzenia taki warunek musiałby spełnić palacz by zostać uznanym za dolną obserwację ekstremalną. Na pewno żaden osobnik w naszej bazie danych takiego warunku nie spełnia. Między innymi dlatego nie widzimy na dole wykresu jakiejkolwiek gwiazdki.

A teraz “klasyczne” obserwacje odstające, czyli kropki. Kryterium dla nich jest trochę bardziej liberalne zatem łatwiej jest zakwalifikować badaną osobę do grupy dewiantów. Z doświadczenia wiemy, że zbyt łatwo.

Górną kropkę dostrzeżemy jeśli jakiś badany palacz spełni poniższy warunek

Wynik palacza ≥ Q3 + 1,5 * IQR —> Wynik palacza ≥ 33 + 1,5 * 13 —> Wynik palacza ≥ 33 + 19,5

… czyli dany respondent będzie narysowany na wykresie jako górna kropka jeśli jego liczba paczkolat będzie wyższa niż 52,5 (wynik dodawania 33 + 19,5).

Widzimy 2 takie osoby. Pamiętaj jednak, że aby respondent był kropką to jego wynik nie może być wyższy niż 72 ponieważ wtedy stałby się gwiazdką – obserwacją ekstremalną.

Kropkę na dole wykresu zobaczymy jeśli jakiś palacz spełni taki warunek

Wynik palacza ≤ Q1 – 1,5 * IQR —> Wynik palacza ≤ 20 – 19,5

Innymi słowy, dolną obserwacją odstającą będzie palacz, który uzyskał wynik paczkolat mniejszy lub równy 0,5.

A co z wąsami?

No właśnie! Górny wąs jest na wysokości wyniku paczkolat, który jest w niecałej odległości 1,5 rozstępu ćwiartkowego od trzeciego kwartyla. Górny wąs wskazuje po prostu wynik maksymalny, który nie jest obserwacją odstającą.

Tam samo dolny wąs. Jego wartość pokazuje, jaki wynik paczkolat uzyskał palacz, który pali najmniej, ale nie spełnia warunku, który sprawiłby, że zostanie on zaklasyfikowany jako dolna obserwacja odstająca.

Proste, prawda? 🙂

 

Oto dowód na to, co napisałem w powyższych akapitach

wykres skrzynkowy z bazą

Na sam koniec. Ciekawostki na temat wykresu skrzynkowego.

  • Haniebnym byłoby nie wspomnieć kto jest pomysłodawcą tego wspaniałego wynalazku! Jest nim sam John Tukey. Tak, to ten od znanego testu post hoc (między innymi HSD Tukeya). Wymyślił wykres skrzynkowy w okolicach roku 1970, ale dopiero 7 lat później opublikował pierwszy artykuł z nim związany, co przyczyniło się do rozpowszechnienia tej metody graficznej ilustracji rozkładu zmiennej. Panie Janie – dziękujemy!
  • Omówiony wykres to tylko jeden z wielu możliwych wykresów skrzynkowych lub jego pochodnych. Więcej przeczytać można w świetnym (czyt. przystępnym dla nie-matematyków) artykule Hadleya Wickhama i Lisy Stryjewski (Stryjewskiej? 🙂 40 years of boxplots
  • To co my nazywamy “sufitem” czyli górną częścią skrzynki (Q3) oraz “podłogą” czyli dolną częścią skrzynki (Q1) inni nazywają często zawiasami (z ang. hinges)
  • Jeśli zmienna, dla której rysujecie wykres skrzynkowy ma rozkład zgodny z rozkładem normalnym to między górnym a dolnym wąsem powinno znajdować się w przybliżeniu 95% wszystkich obserwacji (źródło)

W ostatnim wpisie pokazaliśmy Wam, że czasami analizy statystyczne ujawniają wyniki, które na pierwszy rzut oka wydają nam się błędne. SPSS raczej się nie myli więc ewentualny błąd może leżeć po naszej stronie. Wiesz już jednak, że rezultaty, które mogą wydawać się błędne są w zupełności prawdziwe i uzyskane w toku poprawnie wykonanych testów statystycznych. Trzeba tylko wiedzieć co się dzieje z danymi po dokonaniu pewnych operacji i dlaczego właśnie to może się z nimi dziać. Wtedy okiełznasz dane i nawet najbardziej nielogiczne rezultaty będą pod Twoją pełną kontrolą dzięki czemu poddasz je właściwej interpretacji i wyciągniesz poprawne wnioski. Pamiętaj, że pozbawiony logiki nie jest wynik testu, lecz Twoja jego interpretacja. Niniejszy wpis ma za zadanie ukazanie innej często spotykanej sytuacji w przypadku wykonywania analizy korelacji najpierw ogółem u wszystkich badanych łącznie, a następnie w podziale na dwie lub więcej grup.

Analiza korelacji nieistotna statystycznie – analiza korelacji istotna statystycznie. O co tutaj chodzi?

Ostatni wpis dotyczył sytuacji odwrotnej niż powyższy tytuł tego akapitu. Pokazaliśmy Wam, że czasami najpierw korelacja w całej badanej próbie występuje, a gdy analizy korelacji wykonamy w podziale na jakieś dwie grupy (np. oddzielnie u kobiet i mężczyzn) to związek przestaje być istotny statystycznie. Możliwe też jest zaobserwowanie odwrotnego zjawiska, zgodne z tytułem tego akapitu. Gdy wykonujemy analizę statystyczną dla ogółu badanych osób to współczynnik korelacji jest nieistotny statystycznie. Gdy dokonamy podziału na jakieś dwie grupy (lub więcej grup) to okazuje się, że korelacja między zmiennymi zachodzi … nawet w obu grupach jednocześnie! W takich przypadkach studenci również często pytają: Jak to możliwe? Koreluję ze sobą dwie zmienne. Związku nie ma. Nagle dzielimy bazę na dwie podgrupy, które “ładują” całą naszą bazę danych i okazuje się, że jednak w jednej i drugiej grupie związek jest istotny statystycznie. To dlaczego w obu grupach łącznie nie był? Czary? Wcale nie. Już pokazuję jak to możliwe.

Wyobraźmy sobie, że chcemy sprawdzić czy zachodzi istotny statystycznie związek między zarobkami (miesięczny dochód netto) a optymizmem (skala ogólnego optymizmu życiowego). Obie zmienne są mierzone na skali ilościowej i załóżmy, że mają niemalże idealny rozkład normalny. Oto wyniki przeprowadzonego testu.

wykres rozrzutu ogółem
wynik korelacji

         Współczynnik r Pearsona wynosi tylko 0,2 a istotność statystyczna czyli wartość p wynosi 0,067. Jest to wynik istotności bardzo bliski poziomu 0,05 i może być uznany za rezultat istotny na tak zwanym poziomie tendencji statystycznej, ale uznajmy, że jest on po prostu nieistotny, i że pojęcia “tendencja statystyczna” nie znamy lub jesteśmy przeciwnikami jego stosowania (a jest ich wielu :). Uzyskany rezultat wskazuje zatem na to, że brak jest związku liniowego między zarobkami a nasileniem optymizmu. Brak jest tym samym podstaw do stwierdzenia, że im więcej zarabiamy, tym bardziej optymistycznie jesteśmy nastawieni do świata. Widać to nawet na wykresie rozrzutu. Chmura punktów jest raczej nieregularna i naprawdę trudno dopatrzeć się tutaj jakiegoś liniowego związku. Jako badacze, którzy zakładali, że taki związek będzie dostrzegalny zapewne jesteśmy bardzo smutni i zrezygnowani.

Podział na podzbiory. Czy na pewno zarobki nie korelują z optymizmem?

        Nawet na poziomie studiów licencjackich, a tym bardziej magisterskich i doktoranckich, przeprowadzając badanie i analizując zebrane wyniki myślcie o sobie jako podróżnikach, odkrywcach lub poszukiwaczach. Myślisz, że prawdziwemu odkrywcy wystarczy odpowiedź “tu nic nie ma”? Zapewniam Cię, że nie. Jeśli masz zasoby i umiejętności to szukaj dalej. Wiesz zapewne, że wiele odkryć istotnych dla całej ludzkości było wynikiem przypadku lub pomyłki.

Okazuje się, ze w bazie danych mieliśmy jeszcze kilka innych zmiennych. Jedną z nich, która przykuła naszą uwagę, była informacja o tym, czy badany respondent posiada psa czy też nie. Bez chwili wahania dzielimy bazę danych na dwie grupy i analizę korelacji wykonujemy oddzielnie u osób, które posiadają psa i oddzielnie u tych, które psa nie posiadają. Oto uzyskane wyniki.

wykres rozrzutu w podziale
wynik korelacji w podziale

         Jak widzisz nie tylko w jednej grupie, ale w obu jednocześnie, zachodzi istotny statystycznie związek  między zarobkami a optymizmem. Co więcej, w jednej i drugiej grupie wartość wyliczonych współczynników korelacji r Pearsona wskazują na to, że związki mają umiarkowaną siłę. Współwystępowanie zarobków i optymizmu na charakter pozytywny (dodatni znak współczynnika korelacji), a co za tym idzie, im więcej zarabiamy tym większy jest nasz optymizm … lub im większy jest optymizm tym większe są nasze zarobki

Pamiętaj, że analiza korelacji nie uprawnia do wyciągania wniosków o tym co jest przyczyną a co skutkiem!

 

Jak to możliwe, że w całej grupie korelacja nie jest istotna, a za chwilę, także w całej grupie, ale podzielonej na dwie mniejsze grupki staje się ona istotna i jest w dodatku korelacją o średniej sile? Niestety odpowiedź może nie być dla Ciebie satysfakcjonująca. Po prostu tak jest. Podobnie jak w tym artykule, także tutaj sytuacją sprzyjającą występowaniu takiego zjawiska może być różnica między średnimi w zakresie jednej lub dwóch zmiennych, które ze sobą korelujemy. Teraz obserwujemy akurat zróżnicowanie tylko w zakresie ogólnego optymizmu życiowego (posiadacze psa są mniej optymistyczni niż osoby, które go nie posiadają). Jedna i druga grupa ma jednak bardzo zbliżony średni wyników miesięcznych dochodów. Tak jak podkreślamy to w tym wpisie, także tutaj pamiętaj koniecznie o tym, że różnice w średnich nie są przyczyną tego, że korelacja najpierw była nieistotna, a później stała się istotna w obu grupach oddzielnie. Jest to bardzo często sytuacja sprzyjająca. Jeśli porównasz sobie najpierw posiadaczy psa z osobami, które go nie posiadają pod względem optymizmu i dochodów (np. testem t Studenta dla prób niezależnych) to możesz po prostu przypuszczać, że skoro posiadanie psa różnicuje nasilenie obu tych zmiennych to jest szansa, że także “namiesza” nam ta zmienna w zakresie innych analiz, które przeprowadziliśmy lub mamy zamiar przeprowadzić.

PODKREŚLAM JEDNAK PONOWNIE – różnice w średnich między grupami, które rozbiły nam bazę danych na dwa podzbiory nie są przyczyną tego, że najpierw korelacja była nieistotna, a po podziale stała się istotna statystycznie w obu grupach.

         Kolejny przykład ma na celu pokazanie, że nawet kiedy obie grupy mają niemal identyczne średnie w zakresie obu zmiennych ilościowych, które korelujemy, to i tak możemy zaobserwować “dziwne” zachowanie współczynnika korelacji.

Odwrotne związki w obu grupach. Wstęp do analizy moderacji.

Niniejszy, ostatni przykład ma na celu pokazanie jak inaczej może zachować się współczynnik korelacji gdy dokonamy podziału na podzbiory przed jego policzeniem. Cały czas jednak trzymamy się sytuacji, w której najpierw u ogółu badanych osób związek liniowy nie występuje, a po podziale na dwa podzbiory nagle robi się istotny statystycznie. Nawet w dwóch grupach jednocześnie! Nawet bardzo silny!

Tym razem chcemy skorelować ze sobą samoocenę moralności (czyli to, jak pozytywnie uczestnicy badania oceniają swoją moralność) oraz nasilenie zewnętrznego umiejscowienia poczucia kontroli (czyli skłonność do uznania, że mniej zależy od nas samych niż od zewnętrznych czynników takich jak pogoda lub “ślepy los”).

W wyniku przeprowadzonej analizy korelacji z wykorzystaniem współczynnika r Pearsona okazało się, że obie analizowane zmienne nie są ze sobą skorelowane – r(67) = -0,05; p = 0,690. Oznacza to, że samoocena moralności oraz nasilenie zewnętrznego umiejscowienia poczucia kontroli nie współwystępują ze sobą. Tak wygląda wykres rozrzutu oraz tabela z wynikami, którą otrzymamy w pakiecie SPSS.

wykres dla korelacji
tabela korelacji SPSS

          W naszej bazie danych znajduje się jednak jeszcze wiele różnych zmiennych, a w tym kontynent, z którego pochodzą badani – Europa lub Azja. Jako osoby o niezwykle wysokim poziomie ciekawości poznawczej dzielimy naszą bazę danych na podzbiory i jeszcze raz wykonujemy obliczenia. Dzięki temu dowiemy się czy brak związku liniowego między dwiema analizowanymi zmiennymi dostrzegalny jest oddzielnie w jednej jak i drugiej grupie. Oto wyniki.

tabela korelacji w podziale SPSS
wykres do korelacji w podziale

Cóż się okazuje? Obserwujemy dwie, istotne statystycznie i całkiem silne korelacje, ale o odwrotnych znakach. Ujemny związek w Europie “zerował” się z dodatnim związkiem wśród mieszkańców Azji. Wzajemne “zwalczanie” się korelacji u ogółu badanych osób doprowadziło do tego, że właśnie bez podziału na dwie grupy korelacja nie występowała. Test wskazywał na zdecydowanie nieistotny statystycznie wynik i skłaniał nas do przyjęcia hipotezy zerowej. Okazuje się, że związek między samooceną moralności a nasileniem zewnętrznego umiejscowienia poczucia kontroli występuje, ale na jednym kontynencie w jednym kierunku, a na drugim kontynencie w innym kierunku. Przykład ten pokazuje, że obie grupy nie muszą wcale różnić się w zakresie dwóch mierzonych zmiennych ilościowych by dostrzegać “dziwne” wyniki analizy korelacji. Europejczycy mają bardzo zbliżone wyniki do Azjatów zarówno w przypadku jednej jak i drugiej zmiennej.

To co obserwujemy w tej chwili to klasyczny przykład efektu moderacji. O moderatorach i analizie moderacji będziemy mówili w innych postach i na pewno poświęcimy temu tematowi przynajmniej 2 tutoriale video. Teraz wspomnę tylko, że moderator to jakaś trzecia zmienna, która wpływa najczęściej na siłę lub kierunek związku między pierwszą a drugą zmienną. O efekcie moderacji możemy mówić np. gdy okaże się, że związek zachodzi w jednej grupie, a w drugiej nie zachodzi lub gdy mamy taką sytuację jak powyższa. W grupie Europejczyków korelacja ma znak ujemny natomiast w grupie Azjatów ma ona odwrotny, dodatni znak. Można uznać tym samym, że kontynent, z którego pochodzą badane osoby jest moderatorem relacji między samooceną moralności a wynikiem uzyskanym na skali zewnętrznego umiejscowienia poczucia kontroli. Zmienna będąca moderatorem wyjaśnia w jakich warunkach zaobserwować możemy poszukiwany efekt, a w jakich go nie zaobserwujemy lub będzie on odwrotny.

“Normalne” wyniki analizy korelacji w podziale na dwie grupy – podsumowanie

Zakładam, że do niedawna “dziwne” zachowanie się współczynników korelacji jest już teraz uznawane przez Was za zupełnie normalne. To nic dziwnego, i na pewno nie wynika to z popełnionego przez Was błędu, że korelacje u ogółu badanych osób są nieistotne statystycznie, a w podziale nagle stają się istotne na klasycznym poziomie p < 0,05.  To standardowa sytuacja, która powinna Was cieszyć. Dlaczego? Dlatego, że dostarcza Wam świetnego materiału do napisania ostatniego rozdziału pracy dyplomowej czy też artykułu naukowego – dyskusji wyników i podsumowania. Dyskusja wyników jest dużo ciekawsza i pisze się ją znacznie łatwiej, gdy w wyniku przeprowadzonych analiz statystycznych uzyskujemy tak interesujące rezultaty. Polecam tym samym drążyć dane do granic możliwości. Jeśli macie czas, chęci i umiejętności to starajcie się zawsze wycisnąć z danych tyle ile się da. Powodzenia!

Tutaj znajdziesz pierwszą część artykułu – CZĘŚĆ 1