Słownik

START | EDUKACJA | SŁOWNIK | Regresja liniowa

Regresja liniowa

Analiza regresji liniowej jest techniką statystyczną używaną do modelowania i analizy związków między zmienną wyjaśnianą a jedną lub większą liczbą zmiennych wyjaśniających. W literaturze można spotkać się z różnym nazewnictwem elementów tego modelu regresji, które w niniejszym tekście będą traktowane jako synonimy:

zmienna niezależna, predyktor, zmienna objaśniająca lub wyjaśniająca;
zmienna zależna, zmienna objaśniana lub wyjaśniana.

Regresja liniowa jest bardziej zaawansowaną metodą analizy związków liniowych, przez niektórych traktowana jest jako rozwinięcie czy też rozszerzenie analizy korelacji Pearsona. Różnica między tymi dwiema polega na tym, że analiza korelacji polega na testowaniu związków między parami zmiennych (nawet w przypadku dużych matryc korelacji), podczas gdy w analizie regresji możemy testować bardziej złożone modele, w których sprawdzamy w jaki sposób wiele zmiennych wyjaśniających przewiduje wartości jednej zmiennej wyjaśnianej.

Przykładowo, wyobraźmy sobie że testujemy związek między ogólnym poziomem depresji (jedna zmienna) a cechami osobowości (pięć zmiennych). Wykonując analizę korelacji Pearsona, uzyskamy wyniki w postaci matrycy korelacji 5×1, gdzie każdy wynik (współczynnik korelacji i wartość p) odnosić się będzie do zależności między poziomem depresji a nasileniem jednej z cech osobowości. Dla kontrastu, w przypadku analizy regresji liniowej, możemy zbudować model, który wyjaśnia ogólne nasilenie depresji na podstawie wszystkich pięciu cech osobowości. W takiej sytuacji określić będziemy mogli, w jaki sposób określony układ („konstelacja”) cech osobowości wyjaśnia nasilenie depresji. Przykładowo (i w uproszczeniu), będziemy mogli stwierdzić, że osoba z wysokim nasileniem depresji to taka, która jednocześnie charakteryzuje się wysokim poziomem neurotyzmu, niskim nasileniem ekstrawersji oraz niskim nasileniem otwartości na doświadczenia.

Wyróżnia się kilka rodzajów regresji liniowej:

regresja prosta – jedna zmienna objaśniana i jedna zmienna objaśniająca
regresja wieloraka (wielozmiennowa) – jedna zmienna objaśniana i dwie lub więcej zmiennych objaśniających
hierarchiczna regresja – metoda ta opiera się na selekcji predyktorów i uporządkowaniu je w specyficzne bloki, które następnie stopniowo włączane są do analizowanego modelu regresji; w badaniach psychologicznych częstym rozwiązaniem jest włączenie w pierwszym bloku zmiennych socjodemograficznych (w celu kontrolowania ich, jako zmiennych ubocznych), a w drugim zmiennych psychologicznych

Regresja prosta (z jednym predyktorem) jest rzadko wykonywana, ponieważ jej interpretacja jest w pewnym sensie identyczna z wynikiem analizy korelacji (wyjątkiem jest sytuacja, w której chcemy uzyskać określone równanie regresji do przewidywania wartości zmiennej wyjaśnianej). Znacznie częściej wykonywana jest regresja wieloraka, której celem jest prześledzenie jednoczesnego efektu wielu predyktorów dla nasilenia zmiennej wyjaśnianej. Regresja liniowa wieloraka, wymaga jednak spełnienia kilku założeń:

Pomiar zmiennych – zmienna wyjaśniana (zależna) powinna być zmienną ilościową, natomiast predyktor może być albo zmienną ilościową albo nominalną dychotomiczną, zero-jedynkową, co odnosi się do wystąpienia (1) lub braku występowania (0) danego zjawiska.
Liniowy związek – podstawowe założenie dotyczy zależności liniowej relacji między zmienną wyjaśniającą a zmienną wyjaśnianą. W przypadku obserwacji związku nieliniowego, należy zainteresować się regresją krzywoliniową.
Homoskedastyczność – dotyczy stałości wariancji błędów wokół linii regresji dla każdego predyktora. Oznacza to, że średnie wyniki niskie, umiarkowane i wysokie mają jednakowe rozproszenie danych wokół siebie. Założenie to możemy przetestować chociażby przy użyciu wykresu rozrzutu.
Brak idealnej współliniowości predyktorów – założenie to dotyczy braku idealnej lub bardzo silnej korelacji (równej lub bliskiej +1, lub -1) między zmiennymi objaśniającymi. Wysoka korelacja predyktorów najczęściej sprawia, że przynajmniej jeden z nich okaże się nieistotny w modelu regresji z uwagi na niską korelację semicząstkową, co jest skutkiem występowania korelacja cząstkowej dwóch predyktorów. Upraszczając – jeden z predyktorów może okazać się nieistotny w modelu (nawet jeśli w rzeczywistości, traktowany osobno, jest istotny), ponieważ inny „przejmie” jego efekt z powodu znaczącej korelacji między nimi. Współliniowość możemy testować chociażby za pomocą współczynnika VIF. Jeżeli ją wykryjemy, zwykle usuwamy z modelu predyktor, który jest słabiej związany ze zmienną objaśnianą.
Normalność rozkładów błędów – założenie to związane jest z rozkładem normalnym reszt regresji. Nie jest ono konieczne dla oceny jakości modelu w którym wykorzystujemy metodę najmniejszych kwadratów, pozwala jednak ocenić jakość samych predyktorów. Ich ocena jest stosunkowo prosta np. w SPSS w trakcie przeprowadzania analizy regresji liniowej wystarczy zapisać reszty niestandaryzowane jako nową zmienną i następnie ocenić ją pod kątem normalności rozkładu, chociażby testem Shapiro-Wilka. Warto wspomnieć, że założenie to nie jest konieczne jeżeli zadbamy o odpowiednio dużą reprezentatywność próby.

Ile obserwacji musimy zebrać do przetestowania naszego modelu regresji? W tym celu najlepiej skorzystać z narzędzia do obliczania wielkości próby przy spodziewanej wielkości efektu R², takiego jak G*Power. Jeżeli jednak ciężko nam oszacować spodziewany efekt, można polegać na wytycznych badaczy (tzw. regułach kciuka), którzy najczęściej proponują dwie drogi:

15 obserwacji na każdą jedną zmienną niezależną w modelu (Stevens, 1996). Przykładowo, jeśli mamy 7 zmiennych wyjaśniających, musielibyśmy przebadać minimum 15*7 = 105 obserwacji.
50 obserwacji + 8 * liczba predyktorów (D’Souza, C i in., 2013), czyli startujemy od 50 osób i później dodajemy 8 za każdy predyktor w modelu. Przykładowo, jeśli mamy 7 zmiennych wyjaśniających, musielibyśmy przebadać minimum 50+8*7=106 obserwacji.

Oba wyniki nie różnią się znacząco (przynajmniej gdy predyktorów nie jest dużo). Jednakże, gdybyśmy do szacowania liczebności próby zastosowali G*Power, okazałoby się, że taka liczebność byłaby właściwa, ale przy założeniu średniej siły efektu i mocy testu wynoszącej 1 – β = 0,80. Warto wziąć pod uwagę, że nie zawsze spodziewany efekt jest umiarkowany, a moc testu wynosząca 0,80 jest stosunkowo niewielka (wielu badaczy oczekiwać będzie większej, np. 0,90 lub 0,95). Stąd warto brać poprawkę na powyżej opisane reguły kciuka, ponieważ sprawdzają się one w ograniczonej liczbie sytuacji.

Kiedy wymagana próba jest właściwie oszacowana, a wspomniane założenia regresji liniowej są spełnione, musimy jeszcze wybrać metodę analizy regresji liniowej, która uwzględnia sposób doboru predyktorów do modelu. Ogólnie, metody te możemy podzielić na celowe lub automatyczne. Jest ich kilka, poniżej zostaną omówione dwie popularne:

Metoda wprowadzania – jest to celowy sposób testowania modelu regresji, w której to badacz z góry podejmuje decyzję co do tego jaką zmienną lub zmienne wyjaśniające włączyć lub wyłączyć z modelu. Kryteria doboru predyktorów mogą być różne, np. na podstawie teorii, na podstawie wyników wcześniejszych analiz (np. analiz korelacji).
Metoda krokowa – podejście zautomatyzowane, opierające się na określonym algorytmie matematycznym. Algorytm ten w kolejnych krokach analizy (stąd nazwa tej metody – krokowa), dobiera predyktory do modelu na podstawie określonego kryterium (zwykle α = 0,05). Jej zaletą jest szybkość analizy w sytuacji dużej liczby predyktorów oraz ich automatyczne uporządkowanie od (względnie) najsilniejszego do najsłabszego.

Poza doborem krokowym istnieje więcej metod automatycznego doboru predyktorów, np. usuwania, eliminacji wstecznej czy selekcji postępującej. Obie te grupy metod można łączyć, np. stosując regresję hierarchiczną w której w pierwszym bloku dobór predyktorów odbywać się będzie metodą wprowadzenia, a w drugim metodą krokową.

Sam proces analizy i interpretacji wyników analizy regresji liniowej nie jest trudny i przypomina rozpakowywanie prezentu na święta, tzn. składa się z kilku warstw, odbywa się w kilku etapach:

W pierwszej kolejności naszym zadaniem jest ogólna ocena modelu regresji, poprzez sprawdzenie wyników dopasowania modelu, której dokonujemy interpretując wyniki analizy wariancji oraz (zwykle skorygowanego) współczynnika R². Wynik analizy wariancji wskazuje na wystarczające (wynik istotny statystycznie) lub niewystarczające (wynik nieistotny statystycznie) dopasowanie modelu do danych, co stanowi o ocenie jego jakości. Wartość R²wskazuje z kolei na to jaki procent wariancji zmiennej zależnej wyjaśnia układ wprowadzonych predyktorów. Wartość R²mieści się w granicach od 0 do 1 (od 0 do 100%), a im większa, tym lepsze jest stopień przewidywania.
Następnie przechodzimy do oceny wyników dla poszczególnych predyktorów, poprzez ocenę współczynników standaryzowanych beta oraz poziomu ich istotności (wartości p). Ocena ta jest bardzo podobna do oceny siły i kierunku współczynnika korelacji Pearsona. Finalnie należy zaraportować poszczególne wyniki, na przykład w standardzie APA 7 (przykład takiego raportowania znajduje się tutaj).
Jeżeli napotykamy problemy z wynikami np. słabe dopasowanie modelu, należy w pierwszej kolejności zweryfikować czy poprawnie odczytaliśmy wyniki współczynnika VIF dla założenia o braku współliniowości oraz czy przypadkiem w naszej bazie danych nie mamy wartości odstających. Po dokonaniu ewentualnej korekty możemy wykonać analizę raz jeszcze.

Podsumowując, analiza regresji liniowej jest doskonałym narzędziem do oceny wzajemnego efektu wielu predyktorów na jedną zmienną zależną, która jest przedmiotem naszego badania. Ponadto jest to analiza łatwa w interpretacji, powszechnie znana i stosowana w pracach badaczy różnych dziedzin. Stanowi rozwinięcie korelacji Pearsona, a także jest początkiem bardziej zaawansowanych analiz, jak modelowanie równań strukturalnych lub mediacje i moderacje.

Na deser: tutaj znajdziecie tutorial video dotyczący przeprowadzania analizy regresji liniowej w SPSS.

Literatura:
Stevens, J. (1996). Applied multivariate statistics for social sciences . Hillsdale, NJ: Lowrence Erlbaum Associates.D’Souza, C., Taghian, M., Sullivan-Mort, G. (2013). Environmentally motivated actions influencing perceptions of environmental corporate reputation. Journal of Strategic Marketing, 21(6), 541-555.

wróć do spisu wszystkich pojęć

Podziel się wiedzą

z innymi

Opinie Klientów

Co o nas sądzą?

Najlepsze co mogło mnie spotkać to współpraca z tą firmą. REWELACJA! Pan Paweł Krasa najlepszy specjalista od statystyki. Fachowiec w każdym calu. Cierpliwie odpowiadal... źródło

Gosia

6 kwietnia 2022

Serdecznie polecam usługi Pogotowia Statystycznego każdemu kto potrzebuje profesjonalnej i sprawnej pomocy. Skontaktowali się ze mną w ciągu kilku minut i udzielili fachowej i zrozumiałej porady, która pomogła mi ... źródło

Michał

07 kwietnia 2022

Najmocniej polecam współprace z Pogotowiem Statystycznym. Szybka realizacja, szczegółowe opracowanie i przystępna cena!

Dziękuję za współprace Gosi, która uporała się w ciągu paru dni z moimi danymi oraz jasno przedstawiła co i jak w filmie ... źródło

Kasia

01 kwietnia 2022

Zdecydowanie polecam!;) Najszybsza i najbardziej profesjonalna pomoc na świecie! Pan Paweł jest bardzo kompetentny i rzetelny. źródło

Sandra B.

16 sierpnia 2016

Polecam! Współpracowałam z Panem Jankiem - analiza zrobiona szybko i profesjonalnie, pięknie opisane wyniki. Ponadto duża odporność na marudzenie i ignorancję klienta. źródło

Agnieszka M.

1 czerwca 2021

Polecam skorzystanie z usług Pogotowia Statystycznego! Profesjonalne podejście, skuteczna komunikacja, szybki czas realizacji, merytoryczne wsparcie i dokładny opis przeprowadzonych analiz. źródło

Ola N.

29 czerwca 2021

Bardzo polecam współpracę z Pogotowiem Statystycznym. Miałam niewątpliwą przyjemność współpracować z Jakubem Kłoszewskim, który bardzo rzetelnie podszedł do tematu. Podoba mi się to, że indywidualnie podszedł do zlecenia, starał się odpowiedzieć na konkretną potrzebę i ponadto zrobił to w błyskawicznym tempie - o wiele szybciej...więcej.

Ewelina N.

17 lipca 2021

Bardzo, bardzo polecam, Pani Kasia wykonała super robotę, wszystko w filmie jasno wyjaśniła, co, gdzie i dlaczego tak ★ 5 gwiazdek bez wahania ?. źródło

Magda B.

2 kwietnia 2021

Bardzo dziękuję za analizę statystyczną do mojej pracy. Szczególnie pragnę podziękować Marcie ,że pomimo braku wolnych terminów przyjęła moje zlecenie i w zaledwie parę dni analiza była gotowa. jestem jej niezmiernie wdzięczna. Polecam Pogotowie Statystyczne. źródło

Małgorzata B.

6 września 2017

Nie każdy musi byś mistrzem statystyki, skoro może skorzystać z mistrzowskiej pomocy. W liczeniu moich badań prowadziła mnie i edukowała Natalia. Zaangażowanie, szukanie rozwiązań i świetna komunikacja! Polecam!!! źródło

Michał M.

12 marca 2018

Bardzo sprawny kontakt. Wycena błyskawiczna. Jestem niezwykle miło zaskoczona profesjonalnym podejściem do klienta. Na swoją analizę statystyczną miałam tylko kilka dni i wszystko udało się wykonać w terminie. Po przesłaniu zapytania dostałam kontakt do osoby, z którą miałam współpracować. Po przesłaniu bazy danych w dwa dni! otrzymałam wyniki z opisem. Błyskawicznie ? oprócz plików z programu spss...więcej.

Katarzyna K.

24 stycznia 2019

Fantastyczne indywidualne podejście do klienta. Fachowo, solidnie i z klasą. Szczególne podziękowania dla Ani Wadelskiej-Kaczmarek za anielską cierpliwość i życzliwość w połączeniu z ogromną merytoryczną wiedzą. Udzielała mi fachowych rad i odpowiadała na pytania od samego początku pracy nad magisterką, co znacznie usprawniło cały proces....więcej.

Agnieszka D.

20 lutego 2019

Bardzo polecam usługi Pogotowia Statystycznego. Ich pomoc okazała się nieoceniona w przypadku utworzenia wyników do mojej pracy magisterskiej. Wszystko było zrealizowane bardzo szybko i do tego w miłej atmosferze, jestem pod wrażeniem przedstawienia wyników w formie filmu. Dzięki temu rozumiem jak interpretować podane wyniki. Najbardziej...więcej.

Joanna W.

18 kwietnia 2019

Bardzo gorąco polecam. Jestem pod wielkim wrażeniem! Wspaniały kontakt, profesjonalizm, życzliwość i cierpliwość. Nawet po przesłaniu obliczeń nie było najmniejszego problemu z uzyskaniem dodatkowych informacji. Tak trzymać! źródło

Magdalena M.

10 marca 2019

Z czystym sumieniem polecam! Współpracowałam z p. Magdą Połom, która w sposób bardzo profesjonalny zaopiekowała się moim projektem. Praca została wykonana bardzo rzetelnie, bez zastrzeżeń. Kontakt natychmiastowy, krótki okres oczekiwania, przejrzysta wycena krok po kroku. Końcowy efekt analizy rewelacyjny! Z całego serca... więcej.

Martyna Ż.

30 kwietnia 2020

Serdecznie polecam Pana Pawła M. ? Świetna współpraca, bardzo szybki kontakt nawet późną porą, wyniki miałam już po tygodniu. Pan Paweł podpowiedział co można jeszcze dodać do obliczeń, wszystko przejrzyście opisane w formie tabel i wykresów. Same plusy ? źródło

Angelika Sz.

4 sierpnia 2020

Przede wszystkim dziękuję za profesjonalną pomoc, szybki kontakt, wyjaśnienie wyników w przygotowanym filmie i dodatkowe sugestie co do sposobu obliczeń mierzonych zmiennych i późniejszego kierunku interpretacji uzyskanych wyników.

Pracowałam z Itą Robakiewicz - BARDZO, BARDZO POLECAM! źródło

Ola A.

17 sierpnia 2020

Zdecydowanie polecam! Opiekowała się mną Ola Kwaśnicka, która miała bardzo profesjonalne podejście do wyznaczonego przeze mnie "zadania". Udzielała mi pomocnych uwag oraz szybko i konkretnie odpowiadała na wiadomości, równie szybko otrzymałam zrealizowany projekt. Ja i moja promotor byłyśmy zaskoczone tak świetnym opracowaniem wyników,...więcej.

Milena Sz.

17 lipca 2019

Pogotowie statystyczne to również statystyczny szpital, ambulatorium oraz poradnia ? Moim "doktorem" był Andrzej Jankowski. Zwróciłam się z prośbą o wsparcie w niewiedzy, ale nieoczekiwanie w relacji z pogotowiem poczułam się mądrzejsza. Trzeba być mądrym (jak Andrzej), żeby umieć wytłumaczyć zawiłości statystyczne prostym jezykiem i nie sprawić by odbiorca...więcej.

Joanna J.

13 stycznia 2020

Współpracowałam z Pogotowiem Statystycznym w ramach analiz do pracy doktorskiej. Jestem pod ogromnym wrażeniem szybkości odpowiedzi, profesjonalizmu, dokładnych analiz, najświeższej wiedzy. Żadne moje pytanie nigdy nie zostało zignorowane, nawet po kilku miesiącach, kiedy przygotowywałam się do obrony i pojawiały się kolejne pytania. Wrócę na pewno niejednokrotnie przy analizach do artykułów :) źródło

Magda P.

6 stycznia 2020

Powiedziałabym, ze ta firma to ewenement na rynku usług w ogóle, o rynku statystycznym nie wspomnę. To mój drugi kontakt z Pogotowiem: polityka firmy, sposób realizacji, dyspozycyjność-wszystko przemyślane i na wysokim poziomie. Paweł Iwankowski właśnie uratował mi 4 litery w trybie pilnym, za co bardzo dziękuje, Andrzej Jankowski ogarnia moje doktoraty-również bez zarzutu. Polecam bez mrugnięcia okiem, niezależnie od... więcej.

Agata N.

19 maja 2019

Miałam skomplikowane badanie w swojej pracy magisterskiej. Było sporo hipotez, sporo analiz i gdyby nie Pani Marta z Pogotowia Statystycznego, to nie skończyłabym swojej pracy. W przeciwieństwie do mojej promotorki, Pani Marta rozumiała temat pracy, dokonała analiz i wszystko wytłumaczyła a na dodatek potem, po uwagach promotorskich dokonywała modyfikacji. Liczne maile, telefony, pytania i zmiany w pracy magisterskiej, Pani Marta... więcej.

Wera W.

6 listopada 2020

Bardzo polecam współpracę z panią Anią Wadelską-Kaczmarek - projekt dostałam przed terminem, na który się umawiałyśmy, a dodatkowo komentarz nagrany przez panią Anię wyjaśnił wszystkie moje wątpliwości i pytania dotyczące skomplikowanego świata statystyki :) Poza tym kontakt z panią Anią błyskawiczny, podobnie jak idealne zrozumienie wszystkich moich pomysłów na analizę. Serdecznie polecam! ? źródło

Aleksandra K.

30 marca 2021

Bardzo polecam pogotowie statystyczne. Analiza pelen profesjonalizm. Przygotowana analiza i tabelki gotowe do wklejenia do doktoratu. Kontakt bezproblemowy, dodatkowe wyliczenia bez dodatkowej opłaty. Szczegolnie polecam Pania Marte Formele - mojego opiekuna statystycznego. Dziekuje za wspolprace i za pomysl budowy takiego zespolu. źródło

Słownik

Regresja liniowa

wróć do spisu wszystkich pojęć

Podziel się wiedzą

z innymi

Opinie Klientów

Co o nas sądzą?

Współpracowaliśmy

między innymi z:

i wiele wiele WIĘCEJ…

Szkoła Główna Handlowa

Szkoła Główna Gospodarstwa Wiejskiego

Katolicki Uniwersytet Lubelski

Uniwersytet Przyrodniczy

Uniwersytet Łódzki

Uniwersytet Marii Curie-Skłodowskiej

Uniwersytet im. Adama Mickiewicza

Uniwersytet Jagielloński

Warszawski Uniwersytet Medyczny

Gdański Uniwersytet Medyczny

Akademia Finansów i Biznesu

Uczelnia Łazarskiego

Akademia Leona Koźmińskiego

Wyższa Szkoła Bankowa

Uniwersytet Wrocławski

Uniwersytet Ekonomiczny

Akademia Pedagogiki Specjalnej

Krakowska Akademia

Uniwersytet Ekonomiczny

Uniwersytet SWPS

Uniwersytet Warszawski

Uniwersytet Gdański

Nasi partnerzy

Pamiętaj! Konsultacje u nas zawsze za darmo!

Szybki kontakt/Social media:

Dane firmowe: