fbpx

Słownik

START | EDUKACJA | SŁOWNIK | Kryzys replikacyjny w psychologii

Kryzys replikacyjny w psychologii

Kryzys replikacyjny w psychologii to termin używany do opisania trudności w replikowaniu badań psychologicznych.

Replikacja to proces powtórzenia wcześniej przeprowadzonego badania w celu sprawdzenia, czy uzyskane wyniki są wiarygodne i możliwe do odtworzenia. Polega na powtórzeniu danego badaniu z zastosowaniem takich samych metod, narzędzi i procedur, jakie były użyte w oryginalnym badaniu. Replikacja jest kluczowa dla weryfikacji teorii i zapewnienia solidności naukowej, ponieważ pomaga wykrywać błędy, zwiększać pewność co do wyników oraz budować zaufanie do wiedzy naukowej.

Brzeziński (2023) w swoim artykule przytacza dosyć znane badanie, które dowiodło że spośród wybranych stu badań psychologicznych z czołowych czasopism, replikacji istotnych wyników uzyskano jedynie w 36%, a potwierdzenie uzyskanej siły efektu w niespełna połowie replikacji (47%). Choć wspomniane badania ciężko generalizować z uwagi na to, że próbka pochodziła jedynie z jednego roku i nie dotyczyła wszystkich obszarów psychologii, a skupiła się jedynie na psychologii poznawczej i społecznej, podobne dane uzyskiwane były w innych badaniach tego rodzaju.

Do przyczyn problemu replikowalności najczęściej zalicza się:
1. Efekt szuflady – nadmierny wymóg ze strony czasopism naukowych na nowość, oryginalność i istotność (wartość p < 0,05) wyników w badaniach.
2. Wymagania wobec pracowników naukowych – tzw. publish or perish, czyli nadmierny nacisk na konieczność publikowania w wysoko punktowanych czasopismach, co może częściowo nakłaniać badaczy na mało etyczną manipulację danymi (phacking).
3. Rozrost psychologii – w samej bazie ScienceDirect w ostatnim roku (2023) pojawiło się 26,315 artykułów naukowych z terminem „psychology”, ile z nich zostało przeczytane przez kogoś więcej niż recenzenta?
4. Błędy/braki metodologiczne – nie wszystkie badania są przeprowadzone w sposób prawidłowy metodologicznie, co może prowadzić do błędnych wyników. Z kolei sporo z tych w których metodologia jest prawidłowa, nie opisano jej dokładnie co utrudnia replikację.
5. Małe i homogeniczne próby – zdecydowana większość badań prowadzonych jest na studentach, gdyż stanowią łatwo dostępną próbę dla badacza. Jednak efekty wykrywane na studentach nie zawsze potwierdzają się w innych grupach społecznych.
6. Przecenianie wartości p – w naukach społecznych przeszacowuje się znaczenie wartości p, a ignoruje inne wskaźniki jak moc testu i siła efektu.

Pierwsze trzy problemy związane są bezpośrednio z instytucjami związanymi z dziedziną psychologii, na które pojedynczy badacz będzie miał wpływ raczej niewielki. Choć odpowiedzią społeczności psychologów na kryzys jest niewątpliwie Open Science, dzięki czemu możemy unikać i efektu szuflady, i p-hacking.

Błędy metodologiczne mogą być związane z niezachowaniem kanonu jednej różnicy w badaniach eksperymentalnych lub mało wiarygodniej manipulacji eksperymentalnej, która finalnie nie przynosi zakładanych efektów. Z kolei w badaniach korelacyjnych możemy wykorzystywać słabej jakości narzędzia badawcze. Dodatkowo sama metoda może być niejasno opisana w artykule, co uniemożliwia odtworzenie jej w przyszłości przez innych badaczy.

Próby studenckie można określić jako klątwę badań psychologicznych. Większość powszechnie znanych zjawisk „wykryto” na bazie próby ludzi, którzy tkwią w zawieszeniu między dzieciństwem a dorosłością. W efekcie badania na innych próbach mogą nie przynosić podobnych wniosków.
Przeszacowanie wartości p, każdy student i badacz który spędził chociaż chwilę z psychologią otrzymał jedno jedyne prawo życia naukowego – p < 0,05. Jest to mocno przecenione prawo, które nie powinno być traktowane jako prawda objawiona, a raczej jako wartość wspomagająca wnioskowanie. Więcej na ten temat można przeczytać tutaj.

Niedoszacowanie mocy testu, niewiele czasu w nauce metod statystycznych (o ile w ogóle) poświęca się na moc testu, raczej jest ona wspominana, ale mało prawdopodobne jest jej liczenie na zajęciach. Moc testu chroni nas przed popełnieniem błędu II rodzaju, czyli odrzucenie hipotezy badawczej która jest prawdziwa. Moc testu jest też nierozerwalnie związana z wielkością koniecznej do zbadania próby. Na szczęście braki w wiedzy można uzupełnić przyjemnym i prostym programem G-Power, którego działanie opisujemy tutaj.

Ignorowanie siły efektu zazwyczaj ma miejsce kiedy nadmiernie interesuje nas wartość p. Jest to miara która pozwala nam znacznie lepiej ocenić znaczenie uzyskanych wyników, niż sama ich istotność, a niekiedy może być ona kluczowa kiedy p znajduje się na poziomie granicznym  lub tendencyjnym (0,051-0,100).

Podsumowując, kryzys w psychologii związany jest z trudnością replikowalności, a problem ten znajduje wiele potencjalnych źródeł, poczynając od instytucyjnego przeładowania koniecznością publikowania „dobrych i oryginalnych prac”, aż po niską świadomość metodologiczną i statystyczną samych badaczy.

 

Literatura:
Brzeziński, J. M. (2023). Czy kryzys wiarygodności w psychologii?. Przegląd Psychologiczny, 66(1), 27-47.

 

COFNIJ

wróć do spisu wszystkich pojęć

Podziel się wiedzą

z innymi

Opinie Klientów

Co o nas sądzą?

Współpracowaliśmy

między innymi z:

Nasi partnerzy