Nieliniowy vs. uogólniony model liniowy: jak odnosisz się do regresji logistycznej, Poissona itp.?


23

Mam pytanie dotyczące semantyki, na które chciałbym poznać opinie innych statystyk.

Wiemy, że modele takie jak logistyka, Poisson itp. Mieszczą się w zasięgu uogólnionych modeli liniowych. Model zawiera nieliniowe funkcje parametrów, które z kolei mogą być modelowane przy użyciu szkieletu modelu liniowego przy użyciu odpowiedniej funkcji łączenia.

Zastanawiam się, czy bierzesz pod uwagę (uczyć?) Sytuacje takie jak regresja logistyczna jako:

  1. Model nieliniowy, biorąc pod uwagę formę parametrów
  2. Model liniowy, ponieważ łącze przekształca nas w szkielet modelu liniowego
  3. Jednocześnie (1) i (2): „Zaczyna się” jako model nieliniowy, ale można z nim pracować w taki sposób, który pozwala nam myśleć o nim jako o modelu liniowym

Chciałbym skonfigurować prawdziwą ankietę ...

Odpowiedzi:


24

To świetne pytanie.

Wiemy, że modele takie jak logistyka, Poisson itp. Mieszczą się w zasięgu uogólnionych modeli liniowych.

Cóż, tak i nie. Biorąc pod uwagę kontekst pytania, musimy dość ostrożnie sprecyzować, o czym mówimy - a same „logistyka” i „Poisson” nie są wystarczające, aby opisać, co jest zamierzone.

(i) „Poisson” jest rozkładem. Jako opis rozkładu warunkowego, nie jest on liniowy (a zatem nie GLM), chyba że podasz model liniowy (w parametrach) do opisania średniej warunkowej (tj. Nie wystarczy po prostu powiedzieć „Poisson”). Kiedy ludzie określają „regresję Poissona”, prawie zawsze zamierzają stworzyć model, który ma parametry liniowe, a zatem jest GLM. Ale sam „Poisson” może być dowolną liczbą rzeczy *.

(ii) „Logistyka” z drugiej strony odnosi się do opisu średniej (że średnia jest logistyczna w predyktorach). To nie jest GLM, chyba że połączysz go z rozkładem warunkowym należącym do rodziny wykładniczej. Z drugiej strony, kiedy ludzie mówią „ regresja logistyczna ”, prawie zawsze mają na myśli model dwumianowy z łączem logit - to znaczy, że logistycznie jest w predyktorach, model ma parametry liniowe i należy do rodziny wykładniczej, podobnie jak GLM.

Model zawiera funkcje nieliniowe parametrów,

Cóż, znowu tak i nie.

η=sol(μ)η=Xβ

które z kolei mogą być modelowane przy użyciu szkieletu modelu liniowego przy użyciu odpowiedniej funkcji łączenia.

Poprawny

Zastanawiam się, czy bierzesz pod uwagę (uczyć?) Sytuacje takie jak regresja logistyczna jako:

(Zmieniam tutaj kolejność twojego pytania)

Model liniowy, ponieważ łącze przekształca nas w szkielet modelu liniowego

Właśnie z tego powodu konwencjonalne jest nazywanie GLM „liniowym”. Rzeczywiście, jest całkiem jasne, że jest to konwencja, ponieważ jest tam właśnie w nazwie .

Model nieliniowy, biorąc pod uwagę formę parametrów

Musimy tu być bardzo ostrożni, ponieważ „nieliniowy” ogólnie odnosi się do modelu, który ma parametry nieliniowe. Kontrast regresji nieliniowej z uogólnionymi modelami liniowymi.

Więc jeśli chcesz użyć terminu „nieliniowy” do opisu GLM, ważne jest, aby dokładnie określić, co masz na myśli - ogólnie rzecz biorąc, że średnia nie jest liniowo powiązana z predyktorami.

Rzeczywiście, jeśli użyjesz „nieliniowego” w odniesieniu do GLM, napotkasz trudności nie tylko z konwencją (i prawdopodobnie będziesz źle rozumiany), ale także, gdy będziesz próbował mówić o uogólnionych modelach nieliniowych . Trudno wyjaśnić to rozróżnienie, jeśli już scharakteryzowałeś GLM jako „modele nieliniowe”!

sol(μ)

YPoisson(μx)

xYxμxx

μx=α+exp(βx).

xα

Tutaj pierwszy termin oznacza stałą śmiertelność z powodu (powiedzmy) wypadków (lub innych skutków niewiele związanych z wiekiem), podczas gdy drugi termin ma rosnącą śmiertelność z powodu wieku. Taki model może być czasem wykonalny w krótkich przedziałach wiekowych, ale nie w wieku dojrzałym; jest to zasadniczo prawo Makehama (przedstawione jako funkcja hazardu, ale dla którego roczna stopa byłaby rozsądnym przybliżeniem).

To uogólniony model nieliniowy.


Dzięki za wkład. Właśnie do tego staram się dotrzeć. Oczywiście „liniowy” to nazwa GLM. Próbuję sklasyfikować te modele, które są z natury nieliniowe ( nieliniowe w parametrach), ale „transformowalnie liniowe”, a zatem mieszczą się w ramach GLM. Chyba właśnie odpowiedziałem na moje pytanie - najlepszym sposobem na odniesienie się do nich jest „transformowalnie nieliniowe”.
Meg

1
Bardziej powszechnym sposobem odwoływania się do modelu, który można przekształcić w parametry liniowe za pomocą transformacji, jest „linearyzowalny” (w przeciwieństwie do „instrumentalnie nieliniowego”). Myślę, że musimy omówić model, który jest liniowy (w porównaniu z tym, co nieliniowe), podczas omawiania modelu, a być może powinniśmy również wyjaśnić, w jaki sposób takie rzeczy są konwencjonalnie nazywane, ponieważ ludzie muszą być w stanie zlokalizować informacje, a także zrozumieć podczas ich omawiania. Ktoś, kto mówi o GLM jako „nieliniowych”, prawdopodobnie zostanie źle zrozumiany, chyba że dodadzą odpowiednie kwalifikatory, które jasno wyrażą ich znaczenie.
Glen_b

Zgadzam się. Po prostu widzę, że klasyfikuje się ją w tekstach jako regresję nieliniową, a moi profesorowie nauczyli mnie, że jest nieliniowa. Osobiście uważam to za mylące, ponieważ zajmujemy się tym w ramach GLM, ale mogę (przynajmniej) wczuć się w nazywanie go. Myślę, że przechodzę do linearyzowalnej / transformowalnej liniowej i dyskusji na temat tego, jak przechodzimy od punktu A do punktu B (tj. Jak zaczynamy od funkcji nieliniowej i przekształcamy ją w szkielet liniowy).
Meg

Tak, całkowicie rozumiem. Chociaż również rozumiem ich impuls, aby to zrobić, gdybym miał ich ucho, przestrzegałbym ich przed praktyką nazywania ich modelami nieliniowymi (przynajmniej nie zawsze bez kwalifikowania terminu), z powodów, które przedstawiłem powyżej. To duża część tego, dlaczego uważam, że jest to tak ważne pytanie - ludzie czasami nazywają je nieliniowymi, co moim zdaniem jest w porządku, o ile mamy jasność co do tego, co nazywamy nieliniowym, ponieważ nie jest to najbardziej konwencjonalny sposób odnoszą się do modeli - kiedy przeciwstawiamy się konwencjom, powinniśmy to robić ostrożnie i celowo.
Glen_b
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.