Efekt krańcowy modelu Probit i Logit

12

Czy ktoś może wyjaśnić, jak obliczyć marginalny efekt modelu Probit i Logit w kategoriach laika?

Jestem nowy w statystyce i jestem zdezorientowany co do tych dwóch modeli.

— znak
źródło

Zauważ, że liczby wychodzące z modeli Probit i Logit wyglądają tak, jakby mierzyły mniej więcej to samo, ale często różnią się liczbowo. Kiedy tłumaczysz je z powrotem na prawdziwe życie, różnica między nimi zwykle staje się znacznie mniejsza.

— Henry

15

Myślę, że lepszym sposobem, aby zobaczyć marginalny wpływ danej zmiennej, powiedzmy , jest wytworzenie wykres punktowy przewidywanego prawdopodobieństwa na osi pionowej, a także do na osi poziomej. Jest to najbardziej „laicki” sposób, w jaki mogę wymyślić, jak wpływowa jest dana zmienna. Bez matematyki, tylko zdjęcia. Jeśli masz dużo punktów danych, wówczas wykres pudełkowy lub gładszy wykres rozrzutu może pomóc zobaczyć, gdzie znajduje się większość danych (w przeciwieństwie do tylko chmury punktów). $X_j$ $X_j$

Nie jestem pewien, jak „Layman” jest następną sekcją, ale może ci się przydać.

$m_j$ $g(p)=\sum_kX_k\beta_k$

m_{j} = \frac{\partial p}{\partial X_{j}} = \frac{β_{j}}{g^{'} [g^{- 1} (X^{T} β)]} = \frac{β_{j}}{g^{'} (p)}

$m_j=\frac{\partial p}{\partial X_j}=\frac{\beta_j}{g'\left[g^{-1}(X^T\beta)\right]}=\frac{\beta_j}{g'(p)}$

$g'(p)$ $\frac{\partial g^{-1}(z)}{\partial z}=\frac{1}{g'\left[g^{-1}(z)\right]}$ $z=g\left[g^{-1}(z)\right]$ $g^{-1}(X^T\beta)=p$ $g(p)=\log(p)-\log(1-p)\implies g'(p)=\frac{1}{p}+\frac{1}{1-p}=\frac{1}{p(1-p)}$

m_{j}^{l o g i t} = β_{j} p (1 - p)

$m_j^{logit}=\beta_jp(1-p)$

$p(1-p)$ $p=0$ $p=1$ $0.25$ $p=0.5$ $0.5$ $p$ $0$ $1$ $p(1-p)$ $X_j$ $p$ $X_k,\;k\neq j$

$g(p)=\Phi^{-1}(p)\implies g'(p)=\frac{1}{\phi\left[\Phi^{-1}(p)\right]}$ $\Phi(.)$ $\phi(.)$

m_{j}^{p r o b i t} = β_{j} ϕ [Φ^{- 1} (p)]

$m_j^{probit}=\beta_j\phi\left[\Phi^{-1}(p)\right]$

$m_j^{logit}$ $0.5$ $g(p)=tan(\frac{\pi}{2}[2p-1])$ $p$ $0.5$ $0$ $1$ $\frac{1}{\sqrt{2\pi}}\approx 0.4$ $0.25$

— prawdopodobieństwo prawdopodobieństwa
źródło

effectsOpakowanie R można łatwo wytworzyć takie wykresy przewidywaną na pionowej osi vs X na osi poziomej. Zobacz socserv.socsci.mcmaster.ca/jfox/Misc/effects/index.html

— landroni

Zobacz także: stats.stackexchange.com/questions/18814/…

— landroni

5

Modele logit i probit są zwykle używane do ustalenia prawdopodobieństwa, że zmienna zależna y wynosi 0 lub 1 na podstawie wielu zmiennych wejściowych.

Po angielsku: załóżmy, że próbujesz przewidzieć wartość binarną, taką jak to, czy ktoś rozwinie chorobę serca w ciągu swojego życia. Masz wiele zmiennych wejściowych, takich jak ciśnienie krwi, wiek, niezależnie od tego, czy są palaczami, ich BMI, miejsce zamieszkania itp. Itp. Wszystkie te zmienne mogą w pewien sposób przyczynić się do szansy na rozwój choroby serca.

Efekt marginalny pojedynczej zmiennej wejściowej jest taki, że jeśli podniesiesz ją nieco, jak to wpłynie na prawdopodobieństwo wystąpienia choroby serca? Załóżmy, że ciśnienie krwi wzrośnie nieznacznie, jak to zmienia szanse na chorobę serca? A jeśli podniesiesz wiek o rok?

Niektóre z tych efektów mogą być również nieliniowe: nieznaczne zwiększenie BMI może mieć zupełnie inny efekt dla kogoś, kto ma bardzo zdrowy BMI niż dla kogoś, kto go nie ma.

— robbrit
źródło

1

Nadal chciałbyś, aby twój laik znał rachunek różniczkowy, ponieważ efekt krańcowy jest pochodną dopasowanego prawdopodobieństwa w odniesieniu do zmiennej zainteresowania. Ponieważ dopasowanym prawdopodobieństwem jest funkcja łączenia (logit, probit lub cokolwiek innego) zastosowana do dopasowanych wartości, do obliczenia potrzebna jest reguła łańcuchowa. Tak więc w modelach z indeksem liniowym (gdzie parametry wprowadzane są jako coś w rodzaju X'b) jest on równy estymacji parametru razy pochodna funkcji łączenia. Ponieważ pochodna jest różna dla różnych wartości regresorów (w przeciwieństwie do modelu liniowego), musisz zdecydować, gdzie ocenić efekt krańcowy. Naturalnym wyborem byłyby średnie wartości wszystkich regresorów. Innym podejściem byłoby oszacowanie efektu dla każdej obserwacji, a następnie uśrednienie ich. Interpretacja różni się odpowiednio.

— Alex
źródło