estymacja przedziałowa

Estymacja przedziałowa, której twórcą (a dokładniej rzecz ujmując tego pojęcia :)) był statystyk polskiego pochodzenia Jerzy Spława-Neyman, to metoda służącą do oszacowania przedziału na podstawie wyników z próby, który prawdopodobnie zawiera prawdziwą wartość z populacji (której nie znamy i zapewne nigdy nie poznamy). Dla ułatwienia zrozumienia tego pojęcia będziemy omawiali przedział ufności dla średniej. Oczywiście przedział ufności możemy wyznaczać dla różnych miar w naszym badaniu lub serii badań – np. dla średniej, mediany, odchylenia standardowego, różnicy dwóch średnich czy współczynnika korelacji.

Przedział ufności jest zakresem, który prawdopodobnie „łapie” prawdziwą wartość estymowanego parametru (np. średniej w populacji). Wyznaczając ten przedział nie informujemy jednak czytelników naszej pracy dyplomowej czy też artykułu naukowego jedynie o możliwej wartości parametru w populacji, ale przede wszystkim o „jakości” naszej procedury badawczej (ze szczególnym naciskiem na dobór próby). Sprawa z estymacją przedziałową i przedziałami ufności jest dość skomplikowana… a jeśli nie jest, to prowadzi do błędnej interpretacji przedziałów ufności. Napisaliśmy już pobieżnie czym jest przedział ufności więc z chęcią podzielę się z Wami wiedzą dotyczącą tego, czym taki przedział nie jest i o czym nie mówi. Dla przykładu wyobraźmy sobie, że z populacji wszystkich ryb z jeziora Mamry wylosowaliśmy (a racze udało nam się złapać:)) 50 ryb. Powiedzmy, że wszystkie je ważymy i obliczamy średnią wagę złowionych ryb, która wynosi M = 1,5 kg. Czy średnia wszystkich ryb w tym jeziorze to 1,5kg? Zapewne nie. Może jest to 1,2 kg a może 2,3kg… a może 700 gram? Nie dowiemy się tego dopóki nie złowimy każdej jednej ryby z jeziora co jest zapewne mało wykonalne. Mimo wszystko możemy wyznaczyć przedział ufności , który prawdopodobnie zawiera prawdziwą średnią z całej populacji ryb z jeziora Mamry (będziemy niebawem pokazywali w tutorialu jak to zrobić). Przyjmijmy, że nasz przedział ufności wyliczony na podstawie złowionych 50 ryb to <1,1kg – 1,9kg>. Czym jest ten przedział i o czym mówi to magiczne 95%?

Mianowicie, 95%-owy przedział ufności mówi o tym, że jeśli całe nasze życie poświęcimy na łowienie 50-cio elementowych grupek ryb, będziemy to powtarzać tyle razy ile tylko nam się uda i za każdym razem wyznaczać przedział ufności (praktycznie zawsze będzie on trochę inny od pozostałych) to 95 takich przedziałów na 100 będzie zawierało prawdziwą średnią z populacji wszystkich ryb z jeziora Mamry.

Pamiętajcie ponad wszystko:   (!!!!!!!!!!!!!)

1. Przedział ufności nie mówi o tym, że na 95% prawdziwa średnia w populacji jest gdzieś pomiędzy 1,1kg a 1,9kg. Prawdziwa średnia waga w populacji ryb jest wartością stała i nieznaną. Nie możemy odnosić się do średniej w populacji mówiąc o jakimkolwiek prawdopodobieństwie jej dotyczącym. Ta wartość wynosi X (nie wiemy ile) KONIEC I KROPKA. Jeśli mówimy, że na 95% średnia wartość w populacji zawiera się w jakimś przedziale to tak jakbyśmy mówili, że raz wynosi tyle, a raz wynosi tyle, że „porusza się” bezustannie i na 95% wpadła nam do naszego przedziału. NIE. Prawdziwa średnia w populacji albo jest w tym przedziale, albo jej tam nie ma. Żadne prawdopodobieństwo nie jest w to zamieszane :)

Wyobraźcie sobie, że jesteście stwórcami tego świata i wiecie, że średnia waga wszystkich ryb w jeziorze Mamry to 1,3kg. Patrzycie z góry na jakiegoś wędkarza, który złowił przez cały tydzień 50 ryb i przez to, że korzystał ze specjalnej przynęty złowił same duuuże, ciężkie ryby. Jego średnia w próbie wyniosła 3,3 kg a przedział ufności wyniósł 95%CI [3kg; 3,6kg]. Czy prawdziwe będzie stwierdzenie mówiące o tym, że prawdziwa średnia wynosząca 1,3kg na 95% jest w jego przedziale? NIE. Jej tam nie ma na 100%. Gdyby złowił mniejsze ryby, a wyliczony przez niego przedział wyniósłby [1kg;1,6kg] to moglibyśmy powiedzieć, że TAK, na 100% prawdziwa średnia jest w jego przedziale.

Pamiętajcie, że to nasze przedziały zmieniają się z badania na badanie, a nie prawdziwa wartość estymowanej średniej w populacji. Ona się nie zmienia dlatego nie możemy mówić o prawdopodobieństwie w nawiązaniu do niej tylko w nawiązaniu do przedziału ufności. 

Nam pozostaje jedynie wierzyć i trzymać mocno kciuki za to, że próba, na podstawie której obliczyliśmy przedział ufności dla jakiejś wartości jest na tyle dobra, że nasz przedział należy do tych 95% przedziałów które zawierają prawdziwą wartość z populacji a nie do tych 5%, które jej nie zawierają.

2. Przedział ufności nie oznacza też, że 95% wszystkich ryb w jeziorze Mamry waży nie mniej niż 1,1kg oraz nie więcej niż 1,9kg. Możliwe, że jakimś dziwnym trafem złowimy 10 malutkich płotek ważących po kilkadziesiąt gram. Może zasadzimy się na suma i złowimy ich kilkanaście, a każdy z nich będzie ważył przynajmniej  20 kilogramów. Nie wiemy gdzie w porównaniu do całej populacji ryb w jeziorze znajduje się nasza próbka. Wiemy tylko, że zapewne zrobiliśmy wszystko co w naszej mocy, żeby była ona reprezentatywną i odpowiednio liczną próbką całej populacji.

Możliwych błędów jest jeszcze kilka, ale z dwoma powyższymi spotkałem się najczęściej. Wszystkim, którzy chcą zgłębić temat bardziej niż pobieżnie polecam wpisanie w googlach „confidence interval misconception” oraz/lub zapoznanie się z wynikami ciekawego badania (choć naszym skromnym zdaniem przeprowadzonym w nienajlepszy sposób)

Hoekstra, R., R. D. Morey, J. N. Rouder, E-J. Wagenmakers, 2014. Robust misinterpretation of confidence intervals. Psychonomic Bulletin Review, w druku.

Na koniec jeszcze jeden przykład bo im jest ich więcej tym lepiej :) Tym razem z tabelą wygenerowaną przez SPSSa.

Oszacowujemy jaki przedział na 95% zawiera w sobie prawdziwy średni wzrost wszystkich ludzi na świecie. Z wyliczonych statystyk wynika, że średni wzrost w naszej 40 elementowej próbie wynosi 175,68cm. Możemy na jego podstawie wnioskować jaki jest średni wzrost w populacji generalnej, z której ową próbę wylosowaliśmy. Zapewne średni wzrost w populacji jest inny od tego w próbie, ale wiemy, że z 95%-owym prawdopodobieństwem nasz przedział zawiera prawdziwą wartość średniego wzrostu w populacji.

Statystyki opisowe (DESCRIPTIVES)                                          N=40
Statystyka Błąd standardowy
Średnia 175,6750 2,02718
95% przedział ufności dla średniej Dolna granica 171,5746
Górna granica 179,7754
5% średnia obcięta 175,6389
Mediana 177,0000
Wariancja 164,379
Odchylenie standardowe 12,82103

 

Poniżej znajduje się prezentacja graficzna przedziału ufności i poziomu istotności. Zaznaczono na niej zarówno górną jak i dolną granicę wzrostu wyliczoną przez SPSS. Na podstawie średniej z próby można było określić przedział, który zapewne zawiera średnią w populacji. Widać również, że po lewej i prawej stronie są dwa niewielkie czerwone pola, które reprezentują poziom istotności. Więcej o tym wspominamy jednak przy okazji opisania testu t Studenta dla jednej próby.

 

estymacja przedzialowa small