Jakie są założenia zastosowania modelu regresji Tobit?


9

Moja (bardzo podstawowa) wiedza na temat modelu regresji Tobiasza nie pochodzi z klasy, tak jak wolałbym. Zamiast tego zbierałem tu i ówdzie informacje przez kilka wyszukiwań w Internecie. Moje najlepsze przypuszczenia dotyczące założeń regresji skróconej są takie, że są one bardzo podobne do zwykłych założeń dotyczących najmniejszych kwadratów (OLS). Nie mam jednak pojęcia, czy to prawda.

Stąd moje pytanie: jakie założenia powinienem sprawdzić, wykonując regresję Tobita?

Uwaga: Oryginalna forma tego pytania odnosiła się do regresji skróconej, która nie była modelem, którego używałem lub o który pytałem. Poprawiłem pytanie.


1
Nie powinieneś używać regresji skróconej tylko dlatego, że wypaczyłeś lub ograniczyłeś dane. Dotyczy to zwłaszcza sytuacji, w których wartości poniżej progu (np. Wartości ujemne) są możliwe, ale z jakiegoś powodu nie byłyby przestrzegane. Czy masz taką sytuację?
Aniko,

@Aniko, ujemne wartości zmiennej zależnej tak naprawdę nie mają sensu (oznaczałoby to zarabianie za otrzymanie usługi), ale słyszałem, że Wooldridge (w ekonometrycznej analizie przekroju i danych panelowych , 2002) zalecił obcięcie lub modele regresji ocenzurowanej zamiast OLS, gdy jeszcze jest ciągłą zmienną losową powyżej wartości dodatnich. P(Y=0)>0Y
Firefeather,

Ogromny błąd; Zrozumiałem, że przez cały czas miałem na myśli regresję Tobiasza , a nie regresję obciętą . Właśnie zmieniłem pytanie, aby odzwierciedlić ten błąd.
Firefeather

Odwołanie Wooldridge wciąż jest poprawnym odniesieniem; oznacza to regresję Tobiasza.
Firefeather

Aniko ma rację, że tobit może nie być najlepszym wyborem. Zapoznaj się z poniższymi informacjami, aby dowiedzieć się o alternatywach: ideas.repec.org/p/boc/bost10/2.html

Odpowiedzi:


6

Jeśli skorzystamy z prostej odpowiedzi, fragment książki Wooldridge (strona 533) jest bardzo odpowiedni:

... zarówno heteroskedastyczność, jak i nienormalność powodują, że estymator Tobita jest niespójny dla . Ta niespójność występuje, ponieważ gęstość pochodna dla zależy głównie od . Ta brak wiarygodności estymatora Tobita pokazuje, że cenzura danych może być bardzo kosztowna: w przypadku braku cenzury ( ) można konsekwentnie oszacować przy [lub nawet ].β^βyxy|xNormal(xβ,σ2)y=yβE(u|x)=0E(xu)=0

Notacje w tym fragmencie pochodzą z modelu Tobita:

y=xβ+u,u|xN(0,σ2)y=max(y,0)
gdzie obserwowane są i .yx

Podsumowując różnicę między regułą najmniejszych kwadratów a regresją Tobita jest nieodłącznym założeniem normalności w tym drugim.

Zawsze też myślałem, że oryginalny artykuł Amemyi był całkiem dobry w ustanowieniu teoretycznych podstaw regresji Tobiasza.


Łał! Dzięki za znalezienie widocznej referencji - nie pomyślałem o Google Books, kiedy szukam kopii książki Wooldridge.
Firefeather

4

Aby powtórzyć komentarz Aniko: Podstawowym założeniem jest istnienie obcięcia. To nie to samo założenie, co dwie inne możliwości, które sugeruje mi Twój post: ograniczoność i dobór próby.

Jeśli masz zasadniczo ograniczoną zmienną zależną zamiast ściętego jeden może chcesz przenieść się do uogólnionego modelu liniowego ramy z jednym z wybranych (rzadziej) rozkładów dla Y np log-normalny, wykładniczy, gamma, itp, które to szacunek Dolna granica.

Alternatywnie możesz zadać sobie pytanie, czy uważasz, że proces, który generuje zerowe obserwacje w twoim modelu, jest taki sam, jak ten, który generuje wartości ściśle dodatnie - myślę, że ceny w twojej aplikacji. Jeśli tak nie jest, to może być odpowiednie coś z klasy modeli doboru próby (np. Modele Heckmana). W takim przypadku byłbyś w sytuacji, gdybyś określił jeden model gotowości do zapłacenia jakiejkolwiek ceny, a drugi model ceny, jaką zapłaciliby ci pacjenci, gdyby chcieli coś zapłacić.

Krótko mówiąc, prawdopodobnie chcesz przejrzeć różnicę między zakładaniem obciętych, ocenzurowanych, ograniczonych i próbkujących wybranych zmiennych zależnych. Który chcesz pochodzić ze szczegółów Twojej aplikacji. Po stworzeniu pierwszego najważniejszego założenia możesz łatwiej określić, czy podoba Ci się konkretne założenia dowolnego modelu w wybranej klasie. Niektóre przykładowe modele wyboru mają założenia, które są raczej trudne do sprawdzenia ...


3

@Firefeather: Czy twoje dane zawierają (i mogą naprawdę tylko zawierać) tylko wartości dodatnie? Jeśli tak, zamodeluj go za pomocą uogólnionego modelu liniowego z błędem gamma i łączem logarytmicznym. Jeśli zawiera zera, można rozważyć dwa etapy (regresja logistyczna dla prawdopodobieństwa zera i regresja gamma dla wartości dodatnich). Ten ostatni scenariusz można również modelować jako pojedynczą regresję przy użyciu nadmuchanej zera gamma. Kilka świetnych wyjaśnień na ten temat podano kilka lat temu na liście SAS. Rozpocznij tutaj, jeśli jesteś zainteresowany, i wyszukaj dalsze informacje. tekst linku

Może pomóc skierować cię w innym kierunku, jeśli okrojona regresja okaże się nieprawdopodobna.


2

Jak wspomnieli inni, głównym zastosowaniem regresji tobit jest cenzura danych. Tobit jest szeroko stosowany w połączeniu z analizą Data Envelopment Analysis (DEA) i przez ekonomistę. W DEA wynik wydajności mieści się w przedziale od 0 do 1, co oznacza, że ​​zmienna zależna jest ocenzurowana przy 0 od lewej i 1 od prawej. Dlatego zastosowanie regresji liniowej (OLS) nie jest możliwe.

Tobit to połączenie regresji probitowej i okrojonej. Należy zachować ostrożność, różnicując cenzurę i obcinanie:

  • Ocenzurowanie: gdy obserwacje graniczne są w próbce. Wartości zmiennych zależnych uderzają w granicę w lewo lub w prawo.
  • Obcięcie: obserwacja, w której pewien zakres wartości zależnych nie jest uwzględniony w badaniu. Na przykład tylko wartości dodatnie. Obcięcie powoduje większą utratę informacji niż cenzura.

Tobit = Probit + regresja obcięcia

Model Tobita zakłada normalność, podobnie jak model probit.

Kroki:

  1. Model Probit decyduje, czy zmienna zależna ma wartość 0 czy 1. Jeśli zmienna zależna wynosi 1, to o ile (zakładając, że cenzura wynosi 0) .

    (Discreet decision)P(y>0)=Φ(xβ)
  2. (Continuous decision)E(yy>0)=xβ+σλ(xβσ)

Współczynnik jest taki sam dla obu modeli decyzyjnych. to termin korygujący służący do dostosowania wartości ocenzurowanych (zer). βσλ(xβσ)

Sprawdź także model Cragga, w którym możesz użyć różnych na każdym kroku.β


Witamy na stronie @Amarnayak. Zredagowałem twój post, aby użyć formatowania typu . Upewnij się, że nadal mówi, czego chcesz. LATEX
gung - Przywróć Monikę
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.