Pytania otagowane jako multicollinearity

Sytuacja, w której istnieje silna zależność liniowa między zmiennymi predykcyjnymi, tak że ich macierz korelacji staje się (prawie) pojedyncza. Ten „zły stan” utrudnia określenie unikalnej roli, jaką odgrywa każdy z predyktorów: pojawiają się problemy z oszacowaniem i zwiększają się standardowe błędy. Dwukrotnie bardzo wysokie skorelowane predyktory są jednym przykładem wielokoliniowości.


2
Jakościowe kodowanie zmiennych w regresji prowadzi do „osobliwości”
Mam niezależną zmienną o nazwie „jakość”; ta zmienna ma 3 tryby odpowiedzi (zła jakość; średnia jakość; wysoka jakość). Chcę wprowadzić tę zmienną niezależną do mojej wielokrotnej regresji liniowej. Kiedy mam binarną zmienną niezależną (zmienną fikcyjną, mogę kodować 0/ 1), łatwo jest wprowadzić ją do modelu wielokrotnej regresji liniowej. Ale przy …

1
Regresja logistyczna - obawy / pułapki związane z wielokoliniowością
Czy w logistycznej regresji trzeba być tak samo zaniepokojonym wielokoliniowością, jak w przypadku regresji OLS? Na przykład, w przypadku regresji logistycznej, w której występuje wielokoliniowość, czy trzeba być ostrożnym (podobnie jak w przypadku regresji OLS) przy wyciąganiu wniosków ze współczynników Beta? W przypadku regresji OLS jedną „poprawką” wysokiej wielokoliniowości jest …

3
Kiedy możemy mówić o kolinearności
W modelach liniowych musimy sprawdzić, czy istnieje relacja między zmiennymi objaśniającymi. Jeśli korelują one zbyt mocno, występuje kolinearność (tzn. Zmienne częściowo się wyjaśniają). Właśnie patrzę właśnie na korelację par pomiędzy każdą z zmiennych objaśniających. Pytanie 1: Co klasyfikuje jako zbyt dużą korelację? Na przykład, czy korelacja Pearsona o 0,5 jest …

1
Dlaczego ta regresja NIE zawodzi z powodu doskonałej wielokoliniowości, chociaż jedna zmienna jest liniową kombinacją innych?
Dzisiaj bawiłem się małym zestawem danych i wykonałem prostą regresję OLS, która, jak się spodziewałem, zawiodła z powodu doskonałej wielokoliniowości. Jednak tak się nie stało. Oznacza to, że moje rozumienie wielokoliniowości jest błędne. Moje pytanie brzmi: gdzie się mylę? Myślę, że mogę pokazać, że jedna z moich zmiennych jest liniową …

1
Jaka intuicja kryje się za wymiennymi próbkami pod hipotezą zerową?
Testy permutacyjne (zwane również testem randomizacji, testem ponownej randomizacji lub testem dokładnym) są bardzo przydatne i przydają się, gdy t-testnie jest spełnione założenie o rozkładzie normalnym wymagane na przykład i gdy transformacja wartości przez ranking test nieparametryczny, Mann-Whitney-U-testktóry prowadziłby do utraty większej ilości informacji. Jednak nie należy zapominać o jednym …
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

2
VIF, indeks stanu i wartości własne
Obecnie oceniam wielokoliniowość w moich zestawach danych. Jakie wartości progowe VIF i wskaźnika stanu poniżej / powyżej sugerują problem? VIF: Słyszałem, że VIF jest problemem.≥ 10≥10\geq 10 Po usunięciu dwóch zmiennych problemowych VIF wynosi dla każdej zmiennej. Czy zmienne wymagają dalszego leczenia, czy też ten VIF wydaje się w porządku?≤ …

1
Dlaczego regresja Ridge'a działa dobrze w obecności wielokoliniowości?
Uczę się o regresji grzbietu i wiem, że regresja kalenicy działa lepiej w obecności wielokoliniowości. Zastanawiam się, dlaczego to prawda? Odpowiedź intuicyjna lub matematyczna byłaby satysfakcjonująca (oba typy odpowiedzi byłyby jeszcze bardziej satysfakcjonujące). Wiem też, że zawsze można uzyskać, ale jak dobrze regresja kalenicy działa w obecności dokładnej kolinearności (jedna …

3
Czy muszę usunąć zmienne, które są skorelowane / współliniowe przed uruchomieniem kmeans?
Prowadzę kmeans, aby zidentyfikować klastry klientów. Mam około 100 zmiennych do identyfikacji klastrów. Każda z tych zmiennych reprezentuje% wydatków klienta na kategorię. Tak więc, jeśli mam 100 kategorii, mam te 100 zmiennych, więc suma tych zmiennych wynosi 100% dla każdego klienta. Teraz te zmienne są ściśle ze sobą skorelowane. Czy …

4
Czy należy martwić się o wiele kolinearność przy stosowaniu modeli nieliniowych?
Powiedzmy, że mamy problem z klasyfikacją binarną z cechami głównie kategorycznymi. Do nauki tego używamy jakiegoś modelu nieliniowego (np. XGBoost lub Losowe lasy). Czy należy nadal martwić się wielokulturowością? Dlaczego? Jeśli odpowiedź na powyższe pytanie jest prawdziwa, jak należy z tym walczyć, biorąc pod uwagę, że używa się tego rodzaju …

2
Regresja liniowa, gdy znasz tylko
Załóżmy, że .Xβ=YXβ=YX\beta =Y Nie wiemy dokładnie, tylko jego korelację z każdego czynnika prognostycznego, .YYYXtYXtYX^\mathrm{t}Y Zwykłym rozwiązaniem najmniejszych kwadratów (OLS) jest i nie ma problemu.β=(XtX)−1XtYβ=(XtX)−1XtY\beta=(X^\mathrm{t} X)^{-1} X^\mathrm{t}Y Załóżmy jednak, że jest bliskie liczbie pojedynczej (wielokoliniowość) i musisz oszacować optymalny parametr grzbietu. Wszystkie metody wydaje się potrzeba dokładnych wartości .XtXXtXX^\mathrm{t}XYYY Czy …

2
Co to są testy porcji?
W odpowiedzi na pytanie o wybór modelu w obecności Współliniowość , Frank Harrell zaproponował : Umieść wszystkie zmienne w modelu, ale nie testuj wpływu jednej zmiennej skorygowanej o skutki zmiennych konkurujących ... Testy fragmentów zmiennych konkurencyjnych są potężne, ponieważ zmienne współliniowe łączą siły w ogólnym teście asocjacji wielokrotnego stopnia swobody …

6
Wielokoliniowość, gdy poszczególne regresje są znaczące, ale VIF są niskie
Mam 6 zmiennych ( ), których używam do przewidywania . Podczas przeprowadzania analizy danych najpierw wypróbowałem wielokrotną regresję liniową. Z tego tylko dwie zmienne były znaczące. Kiedy jednak przeprowadziłem regresję liniową, porównując każdą zmienną indywidualnie z wartością , wszystkie oprócz jednej były znaczące ( wszędzie od mniej niż 0,01 do …

3
Jak poradzić sobie z niestabilnymi oszacowaniami
Stabilność beta w regresji liniowej z wysoką wielokolinearnością? Powiedzmy, że w regresji liniowej zmienne i mają wysoką wielokoliniowość (korelacja wynosi około 0,9).x 2x1x1x_1x2)x2x_2 Jesteśmy zaniepokojony stabilności współczynnika więc musimy traktować multi-kolinearność.ββ\beta Rozwiązaniem podręcznika byłoby po prostu wyrzucenie jednej ze zmiennych. Ale nie chcemy stracić przydatnych informacji, po prostu wyrzucając zmienne. …

2
Radzenie sobie z wielokoliniowością
Nauczyłem się, że stosując vif()metodę carpakietu, możemy obliczyć stopień wielokoliniowości danych wejściowych w modelu. Z wikipedii , jeśli vifwartość jest większa niż 5wtedy, możemy uznać, że dane wejściowe cierpią z powodu problemu wielokoliniowości. Na przykład opracowałem model regresji liniowej przy użyciu lm()metody i vif()daje on następujące wyniki. Jak widzimy, wejścia …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.