fbpx

Słownik

START | EDUKACJA | SŁOWNIK | Standaryzacja

Standaryzacja

Standaryzacja zmiennej to proces matematycznego przekształcania danych, w celu uzyskania nowego rozkładu wyników o średniej równej 0 i odchyleniu standardowym równym 1. Proces standaryzacji można wyrazić za pomocą wzoru:

gdzie,
Z – znormalizowana wartość zmiennej
X – oryginalna wartość zmiennej
M – średnia arytmetyczna wszystkich wartości zmiennej
SD – odchylenie standardowe zmiennej

Zobrazujmy proces standaryzacji na przykładzie. Załóżmy, że zebrano dane dla których średnia wyniosła M = 10, a odchylenie standardowe SD = 4. Oto przykłady efektu tego przekształcenia:

  • oryginalna wartość zmiennej X = 10 po standaryzacji wyniesie Z = 0 (ponieważ oryginalna wartość równa jest wartości średniej)
  • oryginalna wartość zmiennej X = 6 po standaryzacji wyniesie Z = -1 (ponieważ oryginalna wartość mniejsza jest od średniej o wartość 1 odchylenia standardowego)
  • oryginalna wartość zmiennej X = 20 po standaryzacji wyniesie Z = 2,5 (ponieważ oryginalna wartość większa jest od średniej o wartość 2,5 odchyleń standardowych)

Więcej przykładów dla tej symulacji przedstawiono w Tabeli 1.

Tabela 1
Przykład standaryzacji wybranych wartości zmiennej przy założeniu M = 10; SD = 4

Oryginalna wartość zmiennej (X) Wynik standaryzowany (Z)
4 -1,5
6 -1
8 -0,5
10 0
12 0,5
14 1
20 2,5

 

Procedura standaryzacji jest używana w statystyce i analizie danych z kilku powodów:

  • Ułatwienie porównywania zmiennych: dzięki standaryzacji możliwe jest tworzenie współczynników standaryzowanych, np. współczynnika korelacji r (wystandaryzowana kowariancji) lub współczynnika regresji Beta (wystandaryzowana wartość B). Dzięki standaryzacji możliwe jest porównywanie tych współczynników między sobą, niezależnie od oryginalnych jednostek pomiaru.
  • Diagnoza występowania obserwacji odstających: ocena rozkładu wystandaryzowanych wartości zmiennej jest jednym ze sposobów diagnostyki obserwacji odstających. Jedną z „reguł kciuka” jest traktowanie jako outliery wartości leżących poza zakresem od -3 do 3.
  • Możliwość identyfikacji specyficznych obserwacji: standaryzacja jest przydatnym narzędziem np. w analizie skupień, która klasyfikuje nam badaną próbkę ze względu na zmienne testowane.
  • Ułatwia interpretację wielkości efektu: procedura ta jest stosowana podczas obliczania wartości współczynników siły efektu, co ułatwia ich interpretację.

Podsumowując, standaryzacja jest przydatnym narzędziem które pozwala programom statystycznym sprawniej działać na danych, jednak dla badacza mogą stanowić wyzwanie w kwestii interpretowania uzyskanych wyników na danych standaryzowanych, zatem zalecana jest ostrożność w sytuacji ich stosowania.

COFNIJ

wróć do spisu wszystkich pojęć

Podziel się wiedzą

z innymi

Opinie Klientów

Co o nas sądzą?

Współpracowaliśmy

między innymi z:

Nasi partnerzy