Słownik

START | EDUKACJA | SŁOWNIK | Analiza skupień

Analiza skupień

Analiza skupień — często nazywana też analizą klasterową (ang. cluster analysis), służy do kategoryzacji zebranych obserwacji w mniejsze, podobne do siebie zbiory. Jej celem jest uzyskanie grup, które wyraźnie różnią się od siebie, ale w skład których wchodzą obserwacje jak najbardziej zbliżone do siebie. W tym sensie, analizę skupień można skonceptualizować jako „odwrotność” analizy wariancji, w której również testuje się stosunek między wariancją międzygrupową oraz wewnątrzgrupową.

Do analizy skupień wprowadzić możemy jednocześnie wiele zmiennych i w ten sposób uzyskać grupy, które posiadają specyficzne wzorce konfiguracji ich wartości. Wyobraźmy sobie, że chcemy sprawdzić od czego zależy nasilenie uzależnienia od gier komputerowych u dzieci. W tym celu dokonaliśmy pomiaru nasilenia uzależnienia, jako zmiennej wyjaśnianej, a także:

  • nasilenia uzależnienia (jako zmiennej wyjaśnianej)
  • płci
  • wieku
  • wielkości miejsca zamieszkania
  • średniej ocen w szkole
  • ilość kontaktów rówieśniczych

W „klasycznej” analizie danych moglibyśmy przetestować związek między zmienną wyjaśnianą, a każdą zmienną wyjaśniającą, ewentualnie zastosować analizę regresji liniowej. Wykonując natomiast analizę skupień, moglibyśmy dokonać klasyfikacji grup, wyróżnionych ze względu na konfigurację wartości zmiennych wyjaśniających. W ten sposób moglibyśmy uzyskać podział na przykładowo trzy grupy:

  • osoby (niezależnie od płci) starsze, które pochodzą z dużych miast, mają wysoką średnią w szkole oraz dużą ilość kontaktów rówieśniczych
  • młodszych chłopców, którzy pochodzą z dużych miast, mają wysoką średnią w szkole oraz małą ilość kontaktów rówieśniczych
  • starszych chłopców, którzy pochodzą ze wsi, mają niską średnią w szkole oraz małą ilość kontaktów towarzyskich

Grupy te można by było następnie poddać porównaniu pod względem stopnia nasilenia uzależniania od gier komputerowych, uzyskując w ten sposób informacje (jaka konfiguracja warunków życiowych związana jest z różnicami w stopniu nasilenia uzależnienia), których nie da się uzyskać wykonując pojedyncze analizy porównań grup i zależności liniowych.

Analiza skupień ma zastosowanie w różnych dziedzinach. Dla przykładu, w biostatystyce grupuje się nietypowe objawy, które występują na zmianę lub równolegle ze sobą. Na podstawie tej analizy skupień, wyróżnia się nowe zespoły chorobowe, co umożliwia rozpoczęcie działań nad opracowywaniem prawidłowego leczenia. Jednocześnie, istnieje wiele różnych typów analizy skupień, wykorzystujących różne algorytmy. Przykładowo, popularny pakiet do analizy SPSS (w wersji 27) oferuje trzy metody analizy skupień: dwustopniową, metodą k-średnich oraz hierarchiczną, choć realnie jest ich znacznie więcej.

Podziel się wiedzą

z innymi

Opinie Klientów

Co o nas sądzą?

Współpracowaliśmy

między innymi z:

Nasi partnerzy