fbpx

Słownik

START | EDUKACJA | SŁOWNIK | Mediana

Mediana

Mediana (lub drugi kwartyl)środkowy punkt zbioru danych uporządkowanego rosnąco lub malejąco. Jest to wartość, która dzieli zestaw danych na dwie równe części. Medianę zwykle raportujemy skrótem Me lub Mdn. choć pierwszy skrót jest coraz rzadziej stosowany.

Aby określić medianę, należy uporządkować dane rosnąco lub malejąco, a następnie wybierać wartość środkową. Jeśli liczba obserwacji jest nieparzysta, medianą jest dokładnie środkowa wartość. Jeśli liczba obserwacji jest parzysta, medianą jest średnia arytmetyczna dwóch środkowych wartości.

Przykłady:

1. Przykład dla nieparzystej liczby obserwacji:

Mamy zbiór liczb: 1, 1, 2, 2, 4, 6, 7, 7, 9

Mediana = 4 (środkowa wartość)

2. Przykład dla parzystej liczby obserwacji:

Mamy zbiór liczb: 1, 1, 2, 2, 45, 6, 7, 7, 9

Mediana = (4 + 5) / 2 = 4,5 (średnia arytmetyczna dwóch środkowych wartości)

Medianę wykorzystuje się w statystyce do określania centralnej tendencji w danych (tzw. miara tendencji centralnych), zwłaszcza w przypadku występowania wartości odstających (outliers), których obecność może powodować, że średnia arytmetyczna nie jest dobrym wskaźnikiem tendencji centralnej. W takich sytuacjach mediana może być lepszym odzwierciedleniem typowej wartości w zestawie danych. Ukazano to na poniższym rysunku.

 Rysunek 1

Przykład oddziaływania wartości skrajnej na średnią i medianę w badanej próbce

Jak widać na rysunku 1, rozkład po prawej stronie (błękitny) jest rozkładem przypominającym rozkład normalny, gdzie średnia (M = 35,16 tys. zł) i mediana (Mdn = 35,09 tys. zł) pokrywają się, a obrazująca je przerywana linia przecina idealnie środek uzyskanych wartości. W przypadku analizy rozkładu danych po lewej (zielony), mamy typowy rozkład zarobków w którym pojawiają się wartości skrajne (osoby lepiej zarabiające). Dodanie obserwacji odstających spowodowało przesunięcie średniej z 35 tysięcy do prawie 46 tysięcy zł (znikąd zarabiamy o 11 tysięcy więcej jako przeciętny pracownik!), natomiast mediana zareagowała w mniejszym stopniu (z 35,09 tys. zł do 36,27 tys. zł), zatem wartość mediany była bardziej adekwatna do rzeczywistości.

Zwykle średnią wykorzystujemy np. w teście t Studenta, jednak gdy zaobserwujemy wartości skrajne których nie możemy usunąć, alternatywą jest właśnie mediana, która jest naszą statystyką centralnej tendencji porównywanych grup w testach nieparametrycznych.

Ponadto, mediana przydaje się nam w podziale prób na dwie równe połówki (o czym można przeczytać tutaj), które zwykle określamy jako „osoby o niższym poziomie X” i „osoby o wyższym poziomie X”. Tylko jak to sprawnie zrobić lub co gdy chcemy więcej porównywanych próbek? Zapraszamy do naszego tutorialu!

Warto także wspomnieć, iż mediana jest jednym z niezbędnych elementów wykresu skrzynkowego, który pozwala nam na jednym rysunku przedstawić ogrom informacji na temat naszej zmiennej zależnej lub niezależnej (jeżeli rangowa lub ilościowa).

Podsumowując mediana to bardzo pożyteczna wartość w życiu statystyka lub po prostu badacza, stanowi dobrą alternatywę dla średniej, jeżeli korzystamy ze skali rangowej lub posiadamy wartości odstające w skali ilościowej. Pozwala również dzielić próbki obserwacji na dwie równoliczne grupy w oparciu o dowolną zmienną rangową lub ilościową, co niekiedy bywa dla nas istotne np. w porównaniu osób starszych i młodszych.

COFNIJ

wróć do spisu wszystkich pojęć

Podziel się wiedzą

z innymi

Opinie Klientów

Co o nas sądzą?

Współpracowaliśmy

między innymi z:

Nasi partnerzy