Pytania otagowane jako regression

Techniki analizy zależności między jedną (lub więcej) zmiennymi „zależnymi” a zmiennymi „niezależnymi”.


1
Przekształcanie znormalizowanych bet z powrotem w oryginalne zmienne
Zdaję sobie sprawę, że jest to prawdopodobnie bardzo proste pytanie, ale po przeszukaniu nie mogę znaleźć odpowiedzi, której szukam. Mam problem, w którym muszę ustandaryzować zmienne uruchamiające (regresję grzbietu), aby obliczyć szacunki grzbietu bet. Następnie muszę przekonwertować je z powrotem do oryginalnej skali zmiennych. Ale jak to zrobić? Znalazłem wzór …

1
Usuwanie wartości odstających na podstawie „2,5-krotności RMSE”
W Kahneman i Deaton (2010) autorzy piszą:††^\dagger Ta regresja wyjaśnia 37% wariancji, z pierwiastkowym średnim błędem kwadratowym (RMSE) wynoszącym 0,67852. Aby wyeliminować wartości odstające i nieprawdopodobne dochody, porzuciliśmy obserwacje, w których wartość bezwzględna różnicy między przychodem z dziennika a jego prognozą przekroczyła 2,5-krotność RMSE. Czy to powszechna praktyka? Jaka jest …

4
Jaki jest sens regresji jednowymiarowej przed regresją wielowymiarową?
Obecnie pracuję nad problemem, w którym mamy niewielki zestaw danych i interesuje mnie wpływ przyczynowy leczenia na wynik. Mój doradca polecił mi wykonać regresję jednowymiarową na każdym predyktorze z wynikiem jako odpowiedzią, a następnie przypisaniem leczenia jako odpowiedzią. Tzn. Poproszono mnie o dopasowanie regresji do jednej zmiennej na raz i …


2
Dlaczego najlepszy wybór podzbiorów nie jest preferowany w porównaniu z lasso?
Czytam o najlepszym wyborze podzbiorów w książce Elementy statystycznego uczenia się. Jeśli mam 3 predyktory , tworzę podzbiorów:2 3 = 8x1, x2), x3)x1,x2,x3x_1,x_2,x_32)3)= 823=82^3=8 Podzbiór bez predyktorów podzbiór z predyktoremx1x1x_1 podzbiór z predyktoremx2)x2x_2 podzbiór z predyktoremx3)x3x_3 podzbiór z predyktoramix1, x2)x1,x2x_1,x_2 podzbiór z predyktoramix1, x3)x1,x3x_1,x_3 podzbiór z predyktoramix2), x3)x2,x3x_2,x_3 podzbiór z …

2
Dlaczego naukowcy z ekonomii używają regresji liniowej do zmiennych binarnych?
Ostatnio musiałem przeczytać kilka artykułów z ekonomii (dziedzina, której nie znam zbyt dobrze). Zauważyłem jedną rzecz, że nawet gdy zmienna odpowiedzi jest binarna, modele regresji liniowej dopasowane za pomocą OLS są wszechobecne. Moje pytanie brzmi zatem: Dlaczego preferuje się regresję liniową, na przykład regresję logistyczną w dziedzinie ekonomii? Czy jest …

3
Co się stało ze znaczeniem statystycznym w regresji, gdy rozmiar danych jest gigantyczny?
Czytałem to pytanie dotyczące regresji na dużą skalę ( link ), gdzie whuber wskazał interesujący punkt w następujący sposób: „Prawie każdy test statystyczny, który przeprowadzisz, będzie tak potężny, że prawie na pewno zidentyfikujesz„ znaczący ”efekt. Musisz skupić się bardziej na znaczeniu statystycznym, takim jak wielkość efektu, a nie na znaczeniu”. …

4
Norms - Co jest specjalnego w ?
normą jest unikalny (przynajmniej częściowo), ponieważ znajduje się na granicy między uwypuklony i wypukłe. normą jest „najbardziej rzadki” norma wypukły (prawda?). p = 1 L 1L1L1L_1p=1p=1p=1L1L1L_1 Rozumiem, że norma euklidesowa ma korzenie w geometrii i ma jasną interpretację, gdy wymiary mają te same jednostki. Ale nie rozumiem, dlaczego jest stosowany …


2
Co r, r kwadrat i resztkowe odchylenie standardowe mówią nam o zależności liniowej?
Małe tło Pracuję nad interpretacją analizy regresji, ale bardzo się mylę co do znaczenia r, r do kwadratu i resztkowego odchylenia standardowego. Znam definicje: Charakteryzacje r mierzy siłę i kierunek liniowej zależności między dwiema zmiennymi na wykresie rozrzutu Kwadrat R jest statystyczną miarą tego, jak blisko są dane do dopasowanej …

3
Dlaczego istnieją duże współczynniki dla wielomianu wyższego rzędu
W książce Bishopa o uczeniu maszynowym omawia problem dopasowania krzywej funkcji wielomianu do zestawu punktów danych. Niech M będzie rzędem dopasowanego wielomianu. Tak to stwierdza Widzimy, że wraz ze wzrostem M wielkość współczynników zwykle rośnie. W szczególności dla wielomianu M = 9 współczynniki zostały precyzyjnie dostrojone do danych poprzez opracowanie …

5
Dlaczego warto studiować regresję liniową?
Biorąc pod uwagę dwie zmienne losowe i \ eta , możemy obliczyć ich „współczynnik korelacji” c i utworzyć linię najlepszego dopasowania między tymi dwiema zmiennymi losowymi. Moje pytanie brzmi: dlaczego?η cξξ\xiηη\etadocc 1) Istnieją zmienne losowe, ξξ\xi i ηη\eta które są zależne w najgorszy możliwy sposób, tj. ξ= f( η)ξ=f(η)\xi = …
13 regression 

1
Dlaczego Daniel Wilks (2011) twierdzi, że regresja głównego składnika „będzie tendencyjna”?
W Metodach statystycznych w naukach atmosferycznych Daniel Wilks zauważa, że ​​wielokrotna regresja liniowa może prowadzić do problemów, jeśli między predyktorami występują bardzo silne wzajemne korelacje (wydanie trzecie, strona 559-560): Patologia, która może wystąpić w wielokrotnej regresji liniowej, polega na tym, że zestaw zmiennych predykcyjnych o silnych wzajemnych korelacjach może skutkować …
13 regression  pca  bias 

3
Definicja i delimitacja modelu regresji
Żenująco proste pytanie - ale wydaje się, że nie zostało wcześniej zadane w Cross Validated: Jaka jest definicja modelu regresji? Także pytanie pomocnicze, Co to nie jest model regresji? Jeśli chodzi o to drugie, interesują mnie trudne przykłady, w których odpowiedź nie jest od razu oczywista, np. ARIMA lub GARCH.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.