Jakie są najczęstsze uprzedzenia dokonywane przez ludzi podczas gromadzenia lub interpretacji danych?


39

Jestem głównym ekonomistą / statkiem. Wiem, że ekonomiści próbowali zmodyfikować swoje założenia dotyczące ludzkiego zachowania i racjonalności, identyfikując sytuacje, w których ludzie nie zachowują się racjonalnie. Załóżmy na przykład, że oferuję 100% szansę na stratę w wysokości 1000 USD lub 50% szansę na stratę w wysokości 2500 USD , ludzie wybierają opcję 2500 USD , mimo że oczekiwana wartość tej drugiej straty jest większa niż gwarantowana 1000 USD utrata. Jest to znane jako „awersja do strat”. Ekonomiści behawioralni badają teraz te wzorce i próbują określić, w jaki sposób ludzie odbiegają od tych aksjomatów, które zwykle uważa się za zachowania „racjonalne”. Tutaj zakładam, że rozsądne jest preferowanie najmniej oczekiwanej straty.

Zastanawiałem się, czy statystycy zidentyfikowali wspólne wzorce gromadzenia danych, które dają stronnicze wyniki w sposobie interpretacji danych przez ludzi. Jeśli istniał zasadniczo „racjonalny” sposób gromadzenia danych, zakładam, że istnieją przykłady, w których ludzie odstępują od tego i wykazują „stronniczość”. Jeśli tak, jakie są najczęstsze uprzedzenia , jakie wywołują ludzie podczas gromadzenia lub interpretacji danych?


5
Jest świetny artykuł Podsakoffa i in. który dokonuje przeglądu powszechnych błędów metod i proponuje zarówno statystyczne, jak i proceduralne środki zaradcze: ln.edu.hk/mkt/staff/gcui/CommonMethodBias.pdf Spójrz na tabelę 2.
ayhan


10
Masz irracjonalne domniemanie irracjonalności. Nie można zastosować funkcji narzędzia do wyniku. W podanym przykładzie załóż, że dana osoba ma 1000 USD i musi ją wykorzystać, aby spłacić pożyczkę gangstera za chwilę, lub zostanie zabity przez gangstera. 100% szansa na 1000 $ straty skutkuje 100% szansą na śmierć, podczas gdy 50% szansa na 2500 $ strat skutkuje tylko 50% szansą na śmierć. Jako ekonomista, powinieneś dostroić się do użyteczności jako punktu wyjścia przed ogłoszeniem irracjonalności.
Mark L. Stone

3
Statystycy zazwyczaj nie prowadzą tego rodzaju badań. Zastanawiam się, czy to Q jest bardziej odpowiednie dla strony Psychology & Neuroscience SE.
Gung - Przywróć Monikę

3
Myślę, że efekt oświetlenia ulicznego - szukanie zagubionych kluczy (danych) pod latarnią, ponieważ tam właśnie jest światło w nocy - jest niezwykle powszechny, szczególnie teraz, z tak łatwymi danymi na dotknięciu. // Nie ma „racjonalnego sposobu” gromadzenia danych, ponieważ ty - badacz, który je gromadzi - nie jesteś losowy.
AS

Odpowiedzi:


23

Myślę, że w środowisku akademickim wartości p są bardzo często źle interpretowane. Ludzie zapominają, że wartość p wyraża prawdopodobieństwo warunkowe. Nawet jeśli eksperyment został doskonale przeprowadzony i wszystkie wymagania wybranego testu statystycznego są spełnione, częstość fałszywych odkryć jest zwykle znacznie wyższa niż poziom istotności alfa. Wskaźnik fałszywych odkryć rośnie wraz ze spadkiem mocy statystycznej i częstością występowania wyników prawdziwie pozytywnych (Colquhoun, 2014; Nuzzo, 2014).

Ponadto ludzie traktują swoje szacunki jako prawdę, a parametr, który oceniają jako losowy (Haller i Kraus, 2002). Na przykład, gdy mówią, że w „95% przypadków ten zidentyfikowany przedział ufności obejmuje parametr” ...

Pomylenie korelacji i związku przyczynowego jest prawdopodobnie również bardzo częstym błędem w interpretacji danych.

Jeśli chodzi o gromadzenie danych, myślę, że częstym błędem jest pobranie najbardziej łatwo dostępnej, a nie najbardziej reprezentatywnej próbki.

Colquhoun, D. (2014). Badanie współczynnika fałszywych odkryć i błędnej interpretacji wartości P. Royal Society Open Science, 1–15.

Nuzzo, R. (2014). Błędy statystyczne: wartości P, „złoty standard” ważności statystycznej, nie są tak wiarygodne, jak wielu naukowców zakłada. Nature, 506, 150–152.

Haller, H. & Kraus, S. (2002): Błędne interpretacje znaczenia: problem, który uczniowie dzielą ze swoimi nauczycielami? Methods of Psychological Research Online, Vol.7, No.1


19

Powiedziałbym, że nie można docenić prawdziwej przypadkowości. Wydaje się, że ludzie oczekują zbyt mało fałszywych wzorców, niż faktycznie występują w sekwencjach przypadkowych zdarzeń. Pokazuje to również, gdy sami próbujemy symulować losowość.

Innym dość powszechnym jest niezrozumienie niezależności, jak w przypadku błędu gracza. Czasami myślimy, że wcześniejsze wydarzenia mogą mieć wpływ na przyszłe, nawet jeśli jest to wyraźnie niemożliwe, jak na przykład poprzedni układ tasowanej talii kart mający wpływ na przyszły.


7

Wskazano już, że wiele zachowań i procesów myślowych określanych przez ekonomistów (behawioralnych) jako „irracjonalnych” lub „tendencyjnych” jest w rzeczywistości wysoce adaptacyjnych i skutecznych w świecie rzeczywistym. Niemniej jednak pytanie OP jest interesujące. Myślę jednak, że opłaca się odwoływać się do bardziej podstawowej, opisowej wiedzy o naszych procesach poznawczych, zamiast szukać konkretnych „uprzedzeń”, które odpowiadają tym omówionym w literaturze ekonomicznej (np. Niechęć do strat, efekt wyposażenia, podstawa zaniedbania itp.).

Na przykład ocena jest z pewnością problemem w analizie danych. Teoria oceny stwierdza, że ​​przeważamy informacje, które uważamy za łatwe do interpretacji lub oceny. Rozważ przypadek współczynnika regresji. Ocena „rzeczywistych” konsekwencji współczynnika może być ciężką pracą. Musimy również rozważyć jednostki zmiennej niezależnej i zależnej, a także rozkłady naszej zmiennej niezależnej i zależnej, aby zrozumieć, czy współczynnik ma znaczenie praktyczne. Z drugiej strony ocena znaczenia współczynnika jest łatwa: po prostu porównuję jego wartość p z moim poziomem alfa. Biorąc pod uwagę lepszą ocenę wartości p w porównaniu z samym współczynnikiem, nie jest zaskakujące, że tak wiele składa się z wartości p.

(Standaryzacja zwiększa ocenę współczynnika, ale może zwiększyć niejednoznaczność : poczucie, że istotne informacje są niedostępne lub ukryte, ponieważ „oryginalna” forma przetwarzanych przez nas danych nie jest dla nas dostępna).

Powiązanym „uprzedzeniem” poznawczym jest zasada konkretności, tendencja do przeważania informacji, która jest „dokładnie tam” w kontekście decyzyjnym i nie wymaga wyszukiwania z pamięci. (Zasada konkretności stwierdza również, że prawdopodobnie będziemy wykorzystywać informacje w formacie, w jakim są podawane, i zwykle unikamy przeprowadzania transformacji). Interpretacji wartości p można dokonać, patrząc jedynie na wynik regresji; nie wymaga ode mnie żadnej wiedzy merytorycznej na temat tego, co modeluję.

Oczekuję, że wiele stronniczości w interpretacji danych statystycznych można prześledzić do ogólnego zrozumienia, że ​​prawdopodobnie pójdziemy łatwą drogą przy rozwiązywaniu problemu lub formułowaniu osądu (patrz „skąpiec poznawczy”, „ograniczona racjonalność” i tak dalej) . W związku z tym robienie czegoś „z łatwością” zwykle zwiększa pewność, z jaką utrzymujemy wynikające z tego przekonania ( teoria płynności ). (Można również wziąć pod uwagę możliwość łatwiejszego wyrażenia danych- dla siebie lub innych - są przeważone w naszych analizach.) Myślę, że staje się to szczególnie interesujące, gdy weźmiemy pod uwagę możliwe wyjątki. Niektóre badania psychologiczne sugerują na przykład, że jeśli uważamy, że problem powinien być trudny do rozwiązania, wówczas możemy preferować podejścia i rozwiązania, które są mniej konkretne i trudniejsze, np. Wybranie bardziej tajemnej metody niż prostej.


7

Największy pojedynczy czynnik, jaki mogę wymyślić, jest ogólnie znany jako „uprzedzenie potwierdzające”. Ustaliwszy, co, jak sądzę, pokażą moje badania, bezkrytycznie akceptuję dane, które prowadzą do tego wniosku, jednocześnie usprawiedliwiając wszystkie punkty danych, które wydają się je odrzucać. Mogę nieświadomie odrzucić jako „oczywisty błąd przyrządu” (lub jakiś równoważny) wszelkie punkty danych, które nie pasują do moich wniosków. W niektórych przypadkach nie będzie to tak oczywiste; zamiast całkowicie wyrzucać te punkty danych, wymyślę jakąś formułę, aby usunąć „błąd”, który wygodnie skieruje wyniki w kierunku potwierdzenia wcześniej ustalonego wniosku.

Nie ma w tym nic szczególnie nikczemnego; tak działa nasz mózg. Odfiltrowanie takich uprzedzeń wymaga dużego wysiłku i jest to jeden z powodów, dla których naukowcy lubią wymyślać badania z podwójnie ślepą próbą, tak aby osoba wykonująca pomiary nie wiedziała, czego oczekuje eksperyment. Wymaga to wówczas ogromnej dyscypliny, by nie korygować tego, co wiernie ocenił.


1
Myślę, że jest to najbardziej niebezpieczne uprzedzenie, ponieważ może już wystąpić na etapie gromadzenia danych, np. Gromadzenie danych w niewielkiej podpróbce, która najprawdopodobniej potwierdzi twoje oczekiwania lub użyje wiodących pytań ankietowych.
stijn

1
Przesądy potwierdzające mogą być naprawdę złe między dyscyplinami, gdzie nawet rzekome fundamentalne podstawy dyscyplin są różne, prowadząc twierdzenia, że ​​„X jest niemożliwe w (używaniu) twojej dyscypliny (za pomocą jej metod wykrywania), ale jest oczywiste w mojej (możemy sens X) ”. np. Jabłka mają powieszać się na drzewach lub leżeć na ziemi; nie mogą „upaść” z własnej woli. Często w naukach fizycznych następuje zmiana podstawy matematycznej, która ukrywa zamieszanie.
Philip Oakley,

6

Liniowość .

Myślę, że powszechnym błędem podczas interpretacji / analizy danych jest to, że ludzie zazwyczaj szybko przyjmują relacje liniowe. Matematycznie model regresji zakłada, że ​​jego składową deterministyczną jest liniowa funkcja predyktorów; niestety nie zawsze tak jest. Niedawno poszedłem na konferencję plakatową na studiach licencjackich, a ilość tępo kwadratowych lub nieliniowych trendów, które widziałem, gdy wyposażono w model liniowy, była co najmniej niepokojąca.

p


2

Interesującym przypadkiem są dyskusje na temat błędu Hazardzistów.

Czy istniejące dane należy uwzględnić czy wykluczyć? Jeśli mam już 6 szóstek, czy te zostaną uwzględnione w mojej serii kilkunastu prób? Wyjaśnij wcześniejsze dane.

Kiedy powinienem zmienić liczby bezwzględne na współczynniki? Przewaga zdobyta podczas początkowej serii zwycięstw zajmuje dużo czasu, aby powrócić do zera (losowy spacer).

0,1% z miliona dolarów może nie być dużym zyskiem dla dużej firmy, ale utrata 1000 dolarów może być życiem i śmiercią dla jedynego przedsiębiorcy (dlatego inwestorzy chcą, aby inwestowali ludzie „napędzani”). Możliwość przejścia do wartości procentowych może być stronnicza.

Nawet statystycy mają uprzedzenia.


2

Polecam „Thinking, Fast and Slow” przez Daniel Kahneman , która wyjaśnia wiele błędów poznawczych w języku świadomym.

Możesz także odnieść się do „ http://www.burns-stat.com/review-thinking-fast-slow-daniel-kahneman/ ”, który podsumowuje niektóre uprzedzenia w powyższej książce.

Aby uzyskać bardziej szczegółowe podsumowanie mądrego rozdziału, możesz przeczytać „ https://erikreads.files.wordpress.com/2014/04/thinking-fast-and-slow-book-summary.pdf ”.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.