fbpx

Słownik

START | EDUKACJA | SŁOWNIK | Reszty regresji

Reszty regresji

Reszty regresji – różnice między obserwowanymi wartościami zmiennej zależnej a wartościami przewidywanymi przez model regresji, będące miarą błędu oszacowania, który model popełnia przy próbie przewidywania danych na podstawie dopasowanego modelu regresji.

Na rysunku 1 zaprezentowano przykładowe wykresy rozrzutu wraz z dopasowaną linią regresji, które obrazują ideę reszt regresji.

Rysunek 1

Przykład rozkładu reszt w analizie regresji: typowy (rysunek po lewej) vs. idealny (rysunek po prawej)

Rozkład danych po prawej stronie przedstawia idealny model regresji liniowej, czyli taki który perfekcyjnie przewiduje wartości zmiennej zależnej – nie obserwujemy żadnych różnic pomiędzy linią regresji a rzeczywistymi danymi. W takiej sytuacji reszty regresji wynoszą zero. Z kolei rozkład danych po lewej stronie, przedstawia klasyczny rozkład błędów (reszt) – poszczególne punkty nie leżą idealnie na linii regresji, tylko w mniejszym lub większym stopniu od niej odstają. Taka pojedyncza różnica między danym punktem (obserwacją) a linią dopasowania to właśnie reszta regresji.

W praktyce, model regresji nigdy nie jest idealnie dopasowany do danych. Występowanie błędów oszacowania jest czymś naturalnym, ponieważ każdy model statystyczny jest pewnym uproszczeniem (kawałka) rzeczywistości.

Choć obecność reszt regresji jest normalna, to istotnym założeniem analizy regresji liniowej jest normalność ich rozkładu, co możemy przetestować np. testem Shapiro-Wilka. Dodatkowo, analiza reszt może pomóc zidentyfikować obserwacje odstające, których obecność może zmniejszyć precyzję predykcji.

Więcej szczegółowych informacji dotyczących analizy regresji można znaleźć w naszym tutorialu video.

COFNIJ

wróć do spisu wszystkich pojęć

Podziel się wiedzą

z innymi

Opinie Klientów

Co o nas sądzą?

Współpracowaliśmy

między innymi z:

Nasi partnerzy