Zrozumienie paradoksu Simpsona: przykład Andrew Gelmana z regresją dochodów z seksu i wzrostu


22

Andrew Gelman w jednym ze swoich najnowszych postów na blogu mówi:

  1. Nie sądzę, aby scenariusz Simpsona wymagał działania alternatywnego lub potencjalnych wyników. Mówię to, ponieważ można skonfigurować paradoks Simpsona ze zmiennymi, których nie można manipulować lub dla których manipulacje nie są bezpośrednio interesujące.

  2. Paradoks Simpsona jest częścią bardziej ogólnego problemu, że współczynniki regresji zmieniają się, jeśli dodasz więcej predyktorów, zmiana znaku nie jest tak naprawdę konieczna.

Oto przykład, którego używam w moim nauczaniu, który ilustruje oba punkty:

Potrafię przeprowadzić regresję przewidującą dochody z płci i wzrostu. Uważam, że płeć seksualna wynosi 10 000 USD (tzn. Porównując mężczyznę i kobietę tego samego wzrostu, średnio mężczyzna zarobi 10 000 USD więcej), a współczynnik wzrostu wynosi 500 USD (tj. Porównanie dwóch mężczyzn lub dwóch kobiet o różnych wysokościach, średnio wyższa osoba zarobi 500 USD więcej na cal wysokości).

Jak mogę interpretować te cefy? Wydaje mi się, że cewkę wzrostu można łatwo zinterpretować (łatwo sobie wyobrazić porównanie dwóch osób tej samej płci o różnych wysokościach), w rzeczy samej wydawałoby się, że „źle” jest regresować się na wysokości bez kontroli seksu, podobnie jak większość różnicę między niskimi i wysokimi ludźmi można „wyjaśnić” poprzez różnice między mężczyznami i kobietami. Ale cewka seksu w powyższym modelu wydaje się bardzo trudna do interpretacji: po co na przykład porównywać mężczyznę i kobietę o wzroście 66 cali? To byłoby porównanie niskiego mężczyzny z wysoką kobietą. Całe to rozumowanie wydaje się niejasno przyczynowe, ale nie sądzę, że warto myśleć o tym z wykorzystaniem potencjalnych wyników.

Zastanawiałem się nad tym (a nawet skomentowałem ten post) i myślę, że jest coś, co prosi o zrozumienie tutaj z większą jasnością.

Aż do części dotyczącej interpretacji płci jest w porządku. Ale nie rozumiem, na czym polega problem porównywania niskiego mężczyzny i wysokiej kobiety. Oto moja uwaga: w rzeczywistości ma to jeszcze większy sens (biorąc pod uwagę założenie, że mężczyźni są średnio wyżsi). Nie można porównać „niskiego mężczyzny” i „niskiej” kobiety z dokładnie tego samego powodu, że różnicę w dochodach tłumaczy się po części różnicą wysokości. To samo dotyczy wysokich mężczyzn i wysokich kobiet, a tym bardziej niskich kobiet i wysokich mężczyzn (co, że tak powiem, nie wchodzi w rachubę). Zasadniczo więc wpływ wzrostu jest eliminowany tylko w przypadku porównania niskich mężczyzn i wysokich kobiet (a to pomaga w interpretacji współczynnika płci). Czy nie dzwoni podobnymi koncepcjami leżącymi u podstaw popularnych pasujących modeli?

Idea paradoksu Simpsona polega na tym, że efekt populacji może różnić się od mądrych efektów podgrupy. Jest to w pewnym sensie związane z jego punktem 2 i faktem, że przyznaje on, że wzrost nie powinien być kontrolowany sam (co, jak mówimy, pomija zmienne odchylenie). Nie mogłem jednak odnieść tego do kontrowersji dotyczącej współczynnika płci.

Może będziesz w stanie wyrazić to jaśniej? Lub skomentuj moje zrozumienie?


Weryfikacja krzyżowa analizuje losowe podzbiory populacji, starając się mieć minimalne nadmierne dopasowanie i najlepsze uogólnienie.
EngrStudent - Przywróć Monikę

1
Jeśli dobrze rozumiem twoje obawy, myślę, że możesz skorzystać z patrzenia na paradoks Pana. @article {lord67, autor = {Lord, FM}, tytuł = {Paradoks w interpretacji porównań grupowych}, czasopismo = {Psychological Bulletin}, rok = {1967}, tom = {68}, strony = {304- -305}, słowa kluczowe = {zmień wyniki}} @article {lord69, autor = {Lord, FM}, tytuł = {Korekty statystyczne przy porównywaniu istniejących grup}, czasopismo = {Psychological Biuletyn}, rok = {1969}, tom = {72}, strony = {336--337}, słowa kluczowe = {zmień wyniki}}
mdewey

1
Judea Pearl napisała ostatnio kolejny post na temat paradoksu Simpsona . Jestem prawie pewien, że nie zgadza się z prezentacją Gelmana. Tym razem drugim punktem nie jest „paradoks”. Odwrócenie szacunków w wyniku tego, na czym warunkujesz, jest faktem matematycznym. Potencjalnie paradoksalne jest to, że dokonujesz przyczynowej interpretacji obu oszacowań. Po drugie, dlaczego to ograniczenie do manipulacji powoduje tylko?
NRH

Odpowiedzi:


9

Nie jestem do końca pewien twojego pytania, ale mogę zwrócić uwagę na jego twierdzenia i twoje zamieszanie w przykładowym modelu.

Andrew nie jest do końca jasne, czy zainteresowanie naukowe leży w powiązaniu skorygowanego ze względu na płeć dochodu czy w powiązaniu skorygowanym ze względu na płeć . W modelu przyczynowym seks powoduje wzrost, ale wzrost nie powoduje seksu. Więc jeśli chcemy wpływu seksu, dostosowanie wysokości wprowadziłoby stronniczość mediatora (prawdopodobnie również stronniczość zderzającą, ponieważ bogaci ludzie są wyżsi!). Uważam to za mylące i zabawne, gdy widzę badania stosowane, które interpretują to drugie„zmienne towarzyszące” (pomieszane i zmienne precyzyjne), które są zawarte w modelu. Są nonsensowne, ale po prostu zapewniają odpowiednie rozwarstwienie, aby dokonać koniecznego porównania. Dostosowywanie się do wzrostu, jeśli jesteś zainteresowany wnioskami na temat różnic w dochodach na podstawie płci, jest niewłaściwe .

Zgadzam się, że kontrfaktyczne nie są konieczne do wyjaśnienia paradoksu Simpsona. Mogą być po prostu cechą nieodłączną dla danych. Myślę, że zarówno surowe, jak i skorygowane RR są w pewnym sensie poprawne, ale nie są przyczynowe. Jest to oczywiście bardziej problematyczne, gdy celem jest analiza przyczynowa, a niedostosowanie ujawnia problemy związane z niemożnością zapadnięcia się (co powoduje wzrost OR) i niewystarczającą wielkością próby.

Dla przypomnienia czytelnikom: paradoks Simpsona jest bardzo specyficznym zjawiskiem, które odnosi się do przypadku, w którym skojarzenie zmienia kierunek po kontrolowaniu mylącej zmiennej. Dane dotyczące przyjęć w Berkeley były motywującym przykładem. Tam surowe RR pokazały, że kobiety są mniej skłonne do przyjęcia do Berkeley. Jednak po stratyfikacji według działów , RR wykazały, że kobiety częściej przyjmowane były w każdym dziale . Po prostu częściej stosowali się do trudnych działów, które odrzuciły wiele osób.

Teraz w teorii wnioskowania przyczynowego nie moglibyśmy pomyśleć, że dział, do którego się zastosowaliśmy, powoduje płeć. Płeć jest nieodłączna, prawda? Cóż, tak i nie. Miettenen opowiada się za podejściem opartym na „bazie badawczej” do takich problemów: kim jest populacja? To nie wszyscy kwalifikujący się studenci, to ci, którzy konkretnie odnoszą się do Berkeley. Bardziej konkurencyjne działy przyciągnęły kobiety do aplikowania do Berkeley, gdy inaczej by tego nie zrobiły. Aby rozwinąć: kobieta, która jest głęboko inteligentna, chce dostać się do najlepszego, powiedzmy, programu inżynierskiego. Gdyby Berkeley nie miał świetnego programu inżynierskiego, i tak nie złożyłaby wniosku do Berkeley, ale do MIT lub CalPoly. Zatem w tym świetle populacja „aplikantów” powoduje, że płeć jest przyczyną zamieszania. (zastrzeżenie: jestem studentem pierwszej generacji, więc nie wiem zbyt wiele o tym, z których programów są znane).

Jak więc podsumowujemy te dane? To prawda, że Berkeley chętniej przyznał się do mężczyzny, który złożył podanie, niż do kobiety. I prawdą jest, że departamenty Berkeley częściej przyjmowały kobiety niż mężczyzn. Surowe i stratyfikowane RR są rozsądnymi środkami, nawet jeśli nie mają związku przyczynowego. Podkreśla to, jak ważne jest, aby być precyzyjnym w naszych sformułowaniach statystycznych (skromny autor nie zakłada, że ​​jest zdalnie precyzyjny).

Zamieszanie jest zjawiskiem innym niż brak zapadalności, kolejna forma pomijanego zmiennego nastawienia, ale taka, o której wiadomo, że ma łagodniejszy wpływ na oszacowania. W przeciwieństwie do regresji logistycznej, brak zapadalności nie powoduje błędu w regresji liniowej, a rozważanie ciągłości w przykładzie Gelmana powinno zostać dokładniej opisane.

Interpretacja przez Andrew współczynnika płci w jego modelu dochodu skorygowanym o płeć / wzrost ujawnia naturę założeń modelu: założenia liniowości. Rzeczywiście w modelu liniowym takie porównania między kobietami i mężczyznami są możliwe, ponieważ dla konkretnej kobiety możemy przewidziećile mógł zarobić samiec o podobnej wysokości, nawet jeśli nie był obserwowany. Dzieje się tak również wtedy, gdy pozwala się na modyfikację efektu, tak że nachylenie trendu u kobiet jest inne niż u mężczyzn. Z drugiej strony nie wydaje mi się, żeby szaleństwo wyobrażać sobie mężczyzn i kobiety tej samej wysokości, w rzeczywistości 66 cali byłoby wysoką kobietą i niskim mężczyzną. Wydaje mi się raczej łagodną projekcją niż rażącą ekstrapolacją. Ponadto, ponieważ założenia modelu można jednoznacznie określić, pomaga czytelnikom zrozumieć, że powiązanie między wysokością a wzrostem dochodów zawiera informacje, które są pożyczone lub uśrednione międzypróbki mężczyzn i kobiet. Gdyby takie skojarzenie było przedmiotem wnioskowania, poważny statystyk oczywiście rozważyłby możliwość modyfikacji efektu.


2
Świetna dyskusja. Jako statystyk, irytuje mnie to bez końca, gdy ludzie mówią o wynikach badań, ale nie są pewni, czy mówią o efektach marginalnych czy warunkowych.
Cliff AB

1

„dlaczego na przykład porównywać mężczyznę i kobietę o wzroście 66 cali? To byłoby porównanie niskiego mężczyzny z wysoką kobietą

Model zakłada, że ​​dochód zależy od płci i wzrostu. Jednak sposób, w jaki wzrost generuje wyższy dochód, może nie być taki sam dla mężczyzn i kobiet. Kobiety mogą być uważane za wysokie „wystarczająco” na wysokości, dla której mężczyzna może być nadal uważany za niski.

Przydatne może być uproszczenie modelu w następujący sposób.

Załóżmy, że chcesz zrezygnować z możliwości zatrudnienia jako asystent sklepu w dużych sklepach z odzieżą i rozważ następującą strategię identyfikacji.

Zauważasz, że pracodawcy częściej zatrudniają pracowników, którzy osiągają określony minimalny wzrost, przy czym „minimum” zależy od płci.

Zamiast mierzyć wysokość w cm, załóżmy, że istnieją dwie wartości progowe określające, na jakiej wysokości odpowiednio mężczyzna i kobieta są „wysocy”:> = 180 cm dla mężczyzn i> = 170 cm dla kobiet.

Zakładając, że progi istnieją w rzeczywistości (tj. Pracodawcy robią rzeczywistą wyraźną różnicę między kobietami i wzrostem 169 cm lub 171 cm) i że są one prawidłowe, możesz zbudować manekina definiującego wysokich / niskich mężczyzn i kobiet. Mężczyźni i kobiety o różnym wzroście mogą nadal należeć do tej samej kategorii twojego manekina, a jednocześnie twoja miara jest zgodna z rzeczywistą dynamiką tego konkretnego rynku pracy.


-1

Czy powiedziałbyś (innymi słowy), że typowa walka płciowa mówiąca, że ​​mężczyźni mają większe szanse niż kobiety, ponieważ ich dochody są o% wyższe, byłaby paradoksalnie tendencyjna?

Może o to chodzi. Staramy się widzieć rzeczy, jak wyglądają, a nie analizować leżące u ich podstaw implikacje.

aby wyjść poza paradoks Simpsona, musielibyśmy odpowiedzieć na pytanie „o ile więcej pieniędzy sprawia, że ​​kobieta wykonuje taką samą bezstronną pracę w porównaniu z mężczyzną?” wtedy ktoś mógłby powiedzieć, że muszą zajść w ciążę i wychowywać dzieci bardziej niż ich odpowiedniki, co jest prawdą, ale ważne jest to, że to trochę westchnienie tylko po to, by powiedzieć „kobiety z samego faktu, że są kobietami, mają mniejsze możliwości” i głębokie analiza za pomocą statystyk warunkowych doprowadziłaby nas do stwierdzenia, że ​​w gruncie rzeczy istnieją równe szanse i są to inne czynniki niezwiązane z seksem, co sprawia, że ​​statystyki wyglądają na dyskryminację związaną z kwestiami seksualnymi.


Przydatne może być zrozumienie, że taka analiza niekoniecznie musi być przyczynowa ani objaśniająca, ale opisowa dla istniejącego zjawiska.
AdamO,
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.