Statystyki i duże zbiory danych regression

5

Czy koszt entropii krzyżowej ma sens w kontekście regresji?

Czy koszt entropii krzyżowej ma sens w kontekście regresji (w przeciwieństwie do klasyfikacji)? Jeśli tak, czy możesz podać przykład zabawki za pośrednictwem TensorFlow? Jeśli nie, dlaczego nie? Czytałem o entropii krzyżowej w sieciach neuronowych i głębokim uczeniu się Michaela Nielsena i wydaje się, że można to naturalnie wykorzystać do regresji …

14 regression entropy tensorflow cross-entropy

1

Przekształcanie znormalizowanych bet z powrotem w oryginalne zmienne

Zdaję sobie sprawę, że jest to prawdopodobnie bardzo proste pytanie, ale po przeszukaniu nie mogę znaleźć odpowiedzi, której szukam. Mam problem, w którym muszę ustandaryzować zmienne uruchamiające (regresję grzbietu), aby obliczyć szacunki grzbietu bet. Następnie muszę przekonwertować je z powrotem do oryginalnej skali zmiennych. Ale jak to zrobić? Znalazłem wzór …

14 regression standard-error standardization predictor centering

1

Usuwanie wartości odstających na podstawie „2,5-krotności RMSE”

W Kahneman i Deaton (2010) autorzy piszą:††^\dagger Ta regresja wyjaśnia 37% wariancji, z pierwiastkowym średnim błędem kwadratowym (RMSE) wynoszącym 0,67852. Aby wyeliminować wartości odstające i nieprawdopodobne dochody, porzuciliśmy obserwacje, w których wartość bezwzględna różnicy między przychodem z dziennika a jego prognozą przekroczyła 2,5-krotność RMSE. Czy to powszechna praktyka? Jaka jest …

13 regression outliers

4

Jaki jest sens regresji jednowymiarowej przed regresją wielowymiarową?

Obecnie pracuję nad problemem, w którym mamy niewielki zestaw danych i interesuje mnie wpływ przyczynowy leczenia na wynik. Mój doradca polecił mi wykonać regresję jednowymiarową na każdym predyktorze z wynikiem jako odpowiedzią, a następnie przypisaniem leczenia jako odpowiedzią. Tzn. Poproszono mnie o dopasowanie regresji do jednej zmiennej na raz i …

13 regression multivariate-analysis model-selection causality univariate

2

Czy przyczyną regresji jest brak pominiętych zmiennych?

Regresję yyy w xxx nie musi być przyczynowy, jeżeli pominięto zmienne, które mają wpływ zarówno xxx i yyy . Ale jeśli nie w przypadku pominiętych zmiennych i błędu pomiaru, to czy regresja jest przyczyną? To znaczy, czy regresja obejmuje każdą możliwą zmienną?

13 regression bias causality

2

Dlaczego najlepszy wybór podzbiorów nie jest preferowany w porównaniu z lasso?

Czytam o najlepszym wyborze podzbiorów w książce Elementy statystycznego uczenia się. Jeśli mam 3 predyktory , tworzę podzbiorów:2 3 = 8x1, x2), x3)x1,x2,x3x_1,x_2,x_32)3)= 823=82^3=8 Podzbiór bez predyktorów podzbiór z predyktoremx1x1x_1 podzbiór z predyktoremx2)x2x_2 podzbiór z predyktoremx3)x3x_3 podzbiór z predyktoramix1, x2)x1,x2x_1,x_2 podzbiór z predyktoramix1, x3)x1,x3x_1,x_3 podzbiór z predyktoramix2), x3)x2,x3x_2,x_3 podzbiór z …

13 regression feature-selection lasso bias-variance-tradeoff

2

Dlaczego naukowcy z ekonomii używają regresji liniowej do zmiennych binarnych?

Ostatnio musiałem przeczytać kilka artykułów z ekonomii (dziedzina, której nie znam zbyt dobrze). Zauważyłem jedną rzecz, że nawet gdy zmienna odpowiedzi jest binarna, modele regresji liniowej dopasowane za pomocą OLS są wszechobecne. Moje pytanie brzmi zatem: Dlaczego preferuje się regresję liniową, na przykład regresję logistyczną w dziedzinie ekonomii? Czy jest …

13 regression logistic econometrics

3

Co się stało ze znaczeniem statystycznym w regresji, gdy rozmiar danych jest gigantyczny?

Czytałem to pytanie dotyczące regresji na dużą skalę ( link ), gdzie whuber wskazał interesujący punkt w następujący sposób: „Prawie każdy test statystyczny, który przeprowadzisz, będzie tak potężny, że prawie na pewno zidentyfikujesz„ znaczący ”efekt. Musisz skupić się bardziej na znaczeniu statystycznym, takim jak wielkość efektu, a nie na znaczeniu”. …

13 regression statistical-significance

4

Norms - Co jest specjalnego w ?

normą jest unikalny (przynajmniej częściowo), ponieważ znajduje się na granicy między uwypuklony i wypukłe. normą jest „najbardziej rzadki” norma wypukły (prawda?). p = 1 L 1L1L1L_1p=1p=1p=1L1L1L_1 Rozumiem, że norma euklidesowa ma korzenie w geometrii i ma jasną interpretację, gdy wymiary mają te same jednostki. Ale nie rozumiem, dlaczego jest stosowany …

13 regression regularization sparse

4

Dlaczego w regresji liniowej zmienna odpowiedzi musi być ciągła?

Wiem, że w regresji liniowej zmienna odpowiedzi musi być ciągła, ale dlaczego tak jest? Nie mogę znaleźć w Internecie niczego, co wyjaśniałoby, dlaczego nie mogę używać dyskretnych danych dla zmiennej odpowiedzi.

13 regression linear

2

Co r, r kwadrat i resztkowe odchylenie standardowe mówią nam o zależności liniowej?

Małe tło Pracuję nad interpretacją analizy regresji, ale bardzo się mylę co do znaczenia r, r do kwadratu i resztkowego odchylenia standardowego. Znam definicje: Charakteryzacje r mierzy siłę i kierunek liniowej zależności między dwiema zmiennymi na wykresie rozrzutu Kwadrat R jest statystyczną miarą tego, jak blisko są dane do dopasowanej …

13 r regression regression-coefficients linear pearson-r

3

Dlaczego istnieją duże współczynniki dla wielomianu wyższego rzędu

W książce Bishopa o uczeniu maszynowym omawia problem dopasowania krzywej funkcji wielomianu do zestawu punktów danych. Niech M będzie rzędem dopasowanego wielomianu. Tak to stwierdza Widzimy, że wraz ze wzrostem M wielkość współczynników zwykle rośnie. W szczególności dla wielomianu M = 9 współczynniki zostały precyzyjnie dostrojone do danych poprzez opracowanie …

13 regression least-squares curve-fitting polynomial

5

Dlaczego warto studiować regresję liniową?

Biorąc pod uwagę dwie zmienne losowe i \ eta , możemy obliczyć ich „współczynnik korelacji” c i utworzyć linię najlepszego dopasowania między tymi dwiema zmiennymi losowymi. Moje pytanie brzmi: dlaczego?η cξξ\xiηη\etadocc 1) Istnieją zmienne losowe, ξξ\xi i ηη\eta które są zależne w najgorszy możliwy sposób, tj. ξ= f( η)ξ=f(η)\xi = …

13 regression

1

Dlaczego Daniel Wilks (2011) twierdzi, że regresja głównego składnika „będzie tendencyjna”?

W Metodach statystycznych w naukach atmosferycznych Daniel Wilks zauważa, że wielokrotna regresja liniowa może prowadzić do problemów, jeśli między predyktorami występują bardzo silne wzajemne korelacje (wydanie trzecie, strona 559-560): Patologia, która może wystąpić w wielokrotnej regresji liniowej, polega na tym, że zestaw zmiennych predykcyjnych o silnych wzajemnych korelacjach może skutkować …

13 regression pca bias

3

Definicja i delimitacja modelu regresji

Żenująco proste pytanie - ale wydaje się, że nie zostało wcześniej zadane w Cross Validated: Jaka jest definicja modelu regresji? Także pytanie pomocnicze, Co to nie jest model regresji? Jeśli chodzi o to drugie, interesują mnie trudne przykłady, w których odpowiedź nie jest od razu oczywista, np. ARIMA lub GARCH.

13 regression linear-model model terminology definition

Pytania otagowane jako regression