fbpx

Słownik

START | EDUKACJA | SŁOWNIK | Metoda głównych składowych (analiza czynnikowa)

Metoda głównych składowych (analiza czynnikowa)

Analiza głównych składowych (ang. Principal Component Analysis, PCA) to jedna z metod eksploracyjnej analizy czynnikowej – techniki statystycznej wykorzystywanej do redukcji wymiarów.

Analiza głównych składowych polega na transformacji oryginalnego zbioru zmiennych na nowy zestaw nieskorelowanych ze sobą zmiennych, zwanych składowymi głównymi. Składowe główne są liniowymi kombinacjami oryginalnych zmiennych, gdzie każda kolejna składowa główna wyjaśnia jak najwięcej zmienności w danych.

Proces analizy głównych składowych można podzielić na kilka kroków:

  • Standaryzacja danych: Jeśli zmienne mają różne skale, należy je standaryzować, to znaczy wyrazić w jednostkach wartości odchyleń standardowych.
  • Obliczanie macierzy kowariancji: Następnie oblicza się macierz kowariancji, która określa stopień korelacji między zmiennymi.
  • Obliczanie składowych głównych: Korzystając z macierzy kowariancji, oblicza się wektory własne i wartości własne. Wektory własne reprezentują kierunki składowych głównych, a wartości własne określają wariancję w tych kierunkach. Wektory własne są uporządkowywane malejąco według wartości własnych.
  • Wybór składowych głównych: Wybiera się pierwsze k składowych głównych, które wyjaśniają największą część wariancji w danych. Można przyjąć, że pewien próg (np. 80%) wariancji jest zachowany po wyborze odpowiedniej liczby składowych głównych.
  • Transformacja danych: Dane oryginalne są przekształcane przy użyciu wybranych składowych głównych, tworząc nowy zestaw zmiennych, które są kombinacjami liniowymi oryginalnych zmiennych. Ta transformacja pozwala uzyskać nowe reprezentacje danych, w których zmienne są nieskorelowane i uporządkowane według ich wartości własnych.
COFNIJ

wróć do spisu wszystkich pojęć

Podziel się wiedzą

z innymi

Opinie Klientów

Co o nas sądzą?

Współpracowaliśmy

między innymi z:

Nasi partnerzy