Słownik

START | EDUKACJA | SŁOWNIK | Analiza skupień

Analiza skupień

Analiza skupień [ang. cluster analysis; data clustering] – termin określający metody eksploracyjnego grupowania obserwacji na podstawie interesujących nas danych w taki sposób, że obserwacje znajdujące się w tej samej grupie (zwanej także skupieniem lub klastrem) są do siebie bardziej podobne niż do obserwacji znajdujących się w innych grupach. W tym sensie analiza skupień jest podobna do analizy czynnikowej z tą różnicą, że poszukiwane są nadrzędne grupy dla obserwacji, a nie nadrzędne czynniki dla analizowanych zmiennych.

Analiza skupień jest terminem zbiorczym dla różnych algorytmów, których zadaniem jest odnalezienie podobieństw między obserwacjami dla wyznaczonych zmiennych. Przykłady takich algorytmów to: k-średnich, hierarchiczna analiza skupień metodą Warda, czy najdalszych sąsiadów [ang. furthest neighbor] lub DBSCAN.

Przykład problematyki badawczej:

Grupa badaczy z Europy przeprowadziła testy osobowości z wykorzystaniem teorii Wielkiej Piątki na 1% losowo wybranej próbki z populacji każdego kraju przynależącego do Europy. Ich celem było sprawdzenie, czy można pogrupować państwa europejskie pod kątem cech osobowości np. w taki sposób, że kraje skandynawskie będą tworzyły jedną grupę, kraje Europy Wschodniej następną, a kraje Europy Zachodniej kolejną oraz które cechy i jakie ich natężenie będzie powodowało wytworzenie się takich podziałów.

 

Źródła:
Bruce, P., & Bruce, A. (2017). Practical statistics for data scientists: 50 essential concepts. ” O’Reilly Media, Inc.”.
https://www.statsoft.pl/textbook/stathome_stat.html?https%3A%2F%2Fwww.statsoft.pl%2Ftextbook%2Fstcluan.html
https://en.wikipedia.org/wiki/Cluster_analysis#Algorithms
https://www.discoveringstatistics.com/2017/01/13/cluster-analysis/
https://pl.wikipedia.org/wiki/Analiza_skupie%C5%84

Podziel się wiedzą

z innymi

Opinie Klientów

Co o nas sądzą?

Współpracowaliśmy

między innymi z:

Nasi partnerzy