Statystyki i duże zbiory danych regression

9

Dlaczego możliwe jest uzyskanie istotnej statystyki F (p <0,001), ale nieistotnych testów t regresora?

Dlaczego w wielokrotnej regresji liniowej możliwe jest uzyskanie bardzo istotnej statystyki F (p <0,001), ale bardzo wysokich wartości p we wszystkich testach t regresora? W moim modelu jest 10 regresorów. Jeden ma wartość p 0,1, a reszta jest powyżej 0,9 Aby poradzić sobie z tym problemem, patrz pytanie uzupełniające .

70 hypothesis-testing regression t-test multicollinearity

2

Kształt przedziału ufności dla przewidywanych wartości w regresji liniowej

Zauważyłem, że przedział ufności dla przewidywanych wartości w regresji liniowej jest zwykle wąski wokół średniej predyktora, a tłuszcz wokół minimalnych i maksymalnych wartości predyktora. Można to zobaczyć na wykresach tych 4 regresji liniowych: Początkowo myślałem, że dzieje się tak, ponieważ większość wartości predyktorów była skoncentrowana wokół średniej predyktora. Zauważyłem jednak, …

69 regression confidence-interval linear-model standard-error prediction-interval

4

Czym różni się współczynnik korelacji od nachylenia regresji?

Spodziewałbym się, że współczynnik korelacji będzie taki sam jak nachylenie regresji (beta), jednak po porównaniu obu tych wartości są one różne. Czym się różnią - jakie różne informacje podają?

69 regression correlation

7

Czy wszystkie warunki interakcji wymagają indywidualnych warunków w modelu regresji?

Właśnie recenzuję manuskrypt, w którym autorzy porównują modele regresji logit 5-6 z AIC. Jednak niektóre modele mają warunki interakcji bez uwzględnienia poszczególnych warunków zmiennych towarzyszących. Czy ma to kiedykolwiek sens? Na przykład (nie dotyczy modeli rejestrujących): M1: Y = X1 + X2 + X1*X2 M2: Y = X1 + X2 …

68 regression modeling interaction aic

10

Co jest złego w ekstrapolacji?

Pamiętam, jak siedziałem na kursach statystycznych jako studium słuchaczy o tym, dlaczego ekstrapolacja była złym pomysłem. Ponadto istnieje wiele źródeł online, które komentują to. Jest też wzmianka o niej tutaj . Czy ktoś może mi pomóc zrozumieć, dlaczego ekstrapolacja jest złym pomysłem? Jeśli tak, to dlaczego techniki prognozowania nie są …

68 regression time-series forecasting

1

Jaka korelacja czyni macierz osobliwością i jakie są implikacje osobliwości lub bliskości osobliwości?

Robię obliczenia na różnych macierzach (głównie w regresji logistycznej) i często pojawia się błąd „Matryca jest pojedyncza”, gdzie muszę wrócić i usunąć skorelowane zmienne. Moje pytanie brzmi: co uważasz za „wysoce” skorelowaną macierz? Czy istnieje wartość progowa korelacji reprezentująca to słowo? Na przykład, jeśli zmienna była skorelowana z 0,97 względem …

67 regression correlation matrix multicollinearity singular

5

Ujednolicony pogląd na kurczenie się: jaka jest relacja (jeśli występuje) między paradoksem Steina, regresją grzbietu i efektami losowymi w modelach mieszanych?

Rozważ następujące trzy zjawiska. Paradoks Steina: biorąc pod uwagę niektóre dane z wielowymiarowego rozkładu normalnego w Rn,n≥3Rn,n≥3\mathbb R^n, \: n\ge 3 , średnia próbki nie jest bardzo dobrym estymatorem prawdziwej średniej. Można uzyskać oszacowanie z niższym średnim błędem do kwadratu, jeśli zmniejsza się wszystkie współrzędne średniej próbki w kierunku zera …

64 regression mixed-model ridge-regression shrinkage steins-phenomenon

4

W jaki sposób dodanie 2. IV może sprawić, że 1. IV będzie znaczący?

Mam pytanie, które jest prawdopodobnie proste, ale teraz mnie to zaskakuje, więc mam nadzieję, że możesz mi pomóc. Mam model regresji metodą najmniejszych kwadratów, z jedną zmienną niezależną i jedną zmienną zależną. Związek nie jest znaczący. Teraz dodaję drugą zmienną niezależną. Teraz związek między pierwszą zmienną niezależną a zmienną zależną …

64 regression multiple-regression power suppressor

5

Wyjaśnij różnicę między regresją wielokrotną a regresją wielowymiarową przy minimalnym użyciu symboli / matematyki

Czy regresja wielokrotna i wielowymiarowa jest naprawdę inna? Co to jest i tak wariant?

63 regression multiple-regression terminology multivariate-regression

7

Regresja z wieloma zmiennymi zależnymi?

Czy możliwe jest równanie regresji (wielokrotnej) z dwiema lub więcej zmiennymi zależnymi? Jasne, możesz uruchomić dwa oddzielne równania regresji, po jednym dla każdego DV, ale to nie wydaje się, że uchwyciłoby to jakąkolwiek zależność między dwoma DV?

61 regression

15

Dlaczego statystyka parametryczna miałaby być zawsze lepsza od statystyki nieparametrycznej?

Czy ktoś może mi wyjaśnić, dlaczego ktoś miałby wybrać parametryczną zamiast nieparametrycznej metody statystycznej do testowania hipotez lub analizy regresji? W moim umyśle, to jak pójście do raftingu i wybierając odporny zegarek bez wody, bo może nie dostać mokre. Dlaczego nie skorzystać z narzędzia, które działa na każdą okazję?

60 regression hypothesis-testing mathematical-statistics estimation nonparametric

9

Jakie są wady używania lassa do wyboru zmiennych do regresji?

Z tego, co wiem, użycie lasso do wyboru zmiennych rozwiązuje problem skorelowanych danych wejściowych. Ponadto, ponieważ jest równoważny regresji metodą najmniejszego kąta, nie jest powolny obliczeniowo. Jednak wiele osób (na przykład osoby, które znam, które wykonują biot statystykę) nadal wydaje się faworyzować stopniowy lub stopniowy wybór zmiennych. Czy są jakieś …

60 regression feature-selection lasso

3

Dlaczego ocena grzbietu staje się lepsza niż OLS poprzez dodanie stałej do przekątnej?

Rozumiem, że oszacowanie regresji grzbietu to która minimalizuje resztkową sumę kwadratu i kara za rozmiarββ\betaββ\beta βridge=(λID+X′X)−1X′y=argmin[RSS+λ∥β∥22]βridge=(λID+X′X)−1X′y=argmin⁡[RSS+λ‖β‖22]\beta_\mathrm{ridge} = (\lambda I_D + X'X)^{-1}X'y = \operatorname{argmin}\big[ \text{RSS} + \lambda \|\beta\|^2_2\big] Jednak nie do końca rozumiem znaczenie faktu, że βridgeβridge\beta_\text{ridge} różni się od βOLSβOLS\beta_\text{OLS} , dodając jedynie małą stałą do przekątnej X′XX′XX'X . W …

59 regression least-squares ridge-regression shrinkage

6

Zasada zwijania zmiennych jakościowych na wielu poziomach?

Jakie techniki są dostępne do zwijania (lub łączenia) wielu kategorii do kilku, w celu wykorzystania ich jako danych wejściowych (predyktorów) w modelu statystycznym? Rozważ zmienną taką jak kierunek studiów studenckich (dyscyplina wybrana przez studenta). Jest nieuporządkowany i kategoryczny, ale potencjalnie może mieć dziesiątki różnych poziomów. Powiedzmy, że chcę użyć major …

58 regression categorical-data dimensionality-reduction feature-construction many-categories

6

Co to jest „nasycony” model?

Co należy rozumieć, gdy mówimy, że mamy model nasycony?

58 modeling regression

Pytania otagowane jako regression