Pytania otagowane jako r-squared

Współczynnik determinacji, zwykle symbolizowany przez R2), to odsetek całkowitej wariancji odpowiedzi wyjaśnionej przez model regresji. Może być również stosowany do różnych proponowanych pseudo-kwadratów R, na przykład do regresji logistycznej (i innych modeli).

6
Czy użyteczny czy niebezpieczny?
Przeglądałem notatki z wykładu Cosmy Shalizi (w szczególności rozdział 2.1.1 drugiego wykładu ) i przypomniano mi, że możesz uzyskać bardzo niskie nawet jeśli masz całkowicie liniowy model.R2R2R^2 Parafrazując przykład Shaliziego: załóżmy, że masz model , gdzie znany jest . Następnie \ newcommand {\ Var} {\ mathrm {Var}} \ Var [Y] …


2
Usuwanie istotnej statystycznie perspektywie przechwytujący zwiększa
W prostym modelu liniowym z jedną zmienną objaśniającą αi=β0+β1δi+ϵiαi=β0+β1δi+ϵi\alpha_i = \beta_0 + \beta_1 \delta_i + \epsilon_i Znaleźć że usunięcie termin przechwytujący znacznie poprawia dopasowanie (wartość R2R2R^2 przechodzi od 0,3 do 0,9). Jednak pojęcie przechwytywania wydaje się istotne statystycznie. Z przechwyceniem: Call: lm(formula = alpha ~ delta, data = cf) Residuals: …

3
Kiedy R jest kwadratem ujemne?
Mi się, że nie mogą być ujemne, jak to jest kwadratem R. Jednakże uruchomiony prostą regresję liniową w SPSS z jedną zmienną niezależną i zmienną zależną. Moje wyjście SPSS dają mi ujemną wartość R 2 . Jeśli nie było obliczyć tego ręką z R wówczas R 2 to pozytywny. Co …

7
Który pseudo
Mam SPSSdane wyjściowe dla modelu regresji logistycznej. Dane wyjściowe zgłaszają dwie miary dopasowania modelu Cox & Snelloraz Nagelkerke. Więc z reguły, które z tych mierników jako pasujące do modelu?R2R²R^² Lub który z tych dopasowanych wskaźników jest zwykle zgłaszany w czasopismach? Niektóre tło: Regresja próbuje przewidzieć obecność lub nieobecność ptaka (głuszca) …

3
Interpretacja predyktora i / lub odpowiedzi transformowanej logarytmicznie
Zastanawiam się, czy ma to znaczenie w interpretacji, czy transformowane są tylko zmienne zależne, zależne i niezależne, czy tylko zmienne niezależne. Rozważ przypadek log(DV) = Intercept + B1*IV + Error Mogę interpretować IV jako wzrost procentowy, ale jak to się zmienia, kiedy mam log(DV) = Intercept + B1*log(IV) + Error …
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

5
Powiązania pomiędzy
Powiedzmy, że mam dwie tablice 1-wymiarowe, za1a1a_1 i za2)a2a_2 . Każdy zawiera 100 punktów danych. 1 jest rzeczywiste dane i 2 jest przewidywania modelu. W tym przypadku, R 2 wartość będzie: R 2 = 1 - S S r e sza1a1a_1za2)a2a_2R2)R2R^2R2)= 1 - S.S.r e sS.S.t o t ( 1 …

1
Ręcznie obliczone
Wiem, że jest to dość specyficzne Rpytanie, ale mogę myśleć o wariancji proporcji wyjaśnionej, , niepoprawnie. Tutaj idzie.R2R2R^2 Próbuję użyć Rpakietu randomForest. Mam trochę danych treningowych i danych testowych. Po dopasowaniu losowego modelu lasu randomForestfunkcja umożliwia wprowadzenie nowych danych testowych do przetestowania. Następnie podaje procent wariancji wyjaśniony w tych nowych …


1
Jaka jest różnica między „współczynnikiem determinacji” a „średnim kwadratowym błędem”?
W przypadku problemu z regresją widziałem, jak ludzie używają „współczynnika determinacji” (inaczej R do kwadratu), aby dokonać wyboru modelu, np. Znajdując odpowiedni współczynnik kary dla uregulowania. Jednak często stosuje się „średni błąd kwadratowy” lub „średni błąd kwadratowy” jako miarę dokładności regresji. Więc jaka jest główna różnica między tymi dwoma? Czy …

5
Jak radzić sobie z hierarchicznymi / zagnieżdżonymi danymi w uczeniu maszynowym
Wyjaśnię mój problem na przykładzie. Załóżmy, że chcesz przewidzieć dochód danej osoby na podstawie niektórych atrybutów: {Wiek, płeć, kraj, region, miasto}. Masz taki zestaw danych szkoleniowych train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) train CountryID RegionID CityID …
29 regression  machine-learning  multilevel-analysis  correlation  dataset  spatial  paired-comparisons  cross-correlation  clustering  aic  bic  dependent-variable  k-means  mean  standard-error  measurement-error  errors-in-variables  regression  multiple-regression  pca  linear-model  dimensionality-reduction  machine-learning  neural-networks  deep-learning  conv-neural-network  computer-vision  clustering  spss  r  weighted-data  wilcoxon-signed-rank  bayesian  hierarchical-bayesian  bugs  stan  distributions  categorical-data  variance  ecology  r  survival  regression  r-squared  descriptive-statistics  cross-section  maximum-likelihood  factor-analysis  likert  r  multiple-imputation  propensity-scores  distributions  t-test  logit  probit  z-test  confidence-interval  poisson-distribution  deep-learning  conv-neural-network  residual-networks  r  survey  wilcoxon-mann-whitney  ranking  kruskal-wallis  bias  loss-functions  frequentist  decision-theory  risk  machine-learning  distributions  normal-distribution  multivariate-analysis  inference  dataset  factor-analysis  survey  multilevel-analysis  clinical-trials 


2
Jaki jest rozkład w regresji liniowej pod hipotezą zerową? Dlaczego jego tryb nie jest ustawiony na zero, gdy ?
Jaki jest rozkład współczynnika determinacji, czyli R do kwadratu, , w regresji wielokrotnej liniowej jednowymiarowej z regresją zerową ?R2R2R^2H0:β=0H0:β=0H_0:\beta=0 Jak to zależy od liczby predyktorów i liczby próbek ? Czy istnieje sposób wyrażenia w formie zamkniętej dla trybu tej dystrybucji?kkkn>kn>kn>k W szczególności mam wrażenie, że dla prostej regresji (z jednym …

9
Pomiar dokładności modelu opartego na regresji logistycznej
Mam wyszkolony model regresji logistycznej, który stosuję do testowanego zestawu danych. Zmienna zależna jest binarna (boolean). Dla każdej próbki w zestawie danych testowych stosuję model regresji logistycznej, aby wygenerować% prawdopodobieństwa, że ​​zmienna zależna będzie prawdziwa. Następnie rejestruję, czy wartość rzeczywista była prawdziwa, czy fałszywa. Ja próbuje obliczyć lub regulowane R …

1
Interpretacja geometryczna wielokrotnego współczynnika korelacji
Interesuje mnie geometryczne znaczenie wielokrotnej korelacji RRR i współczynnik determinacji w regresji lub w notacji wektorowej,R2R2R^2yi=β1+β2x2,i+⋯+βkxk,i+ϵiyi=β1+β2x2,i+⋯+βkxk,i+ϵiy_i = \beta_1 + \beta_2 x_{2,i} + \dots + \beta_k x_{k,i} + \epsilon_i y=Xβ+ϵy=Xβ+ϵ\mathbf{y} = \mathbf{X \beta} + \mathbf{\epsilon} Tutaj macierz projektowa ma wierszyXX\mathbf{X}nnnkkk kolumn, z których pierwszą jest , wektor 1s, który odpowiada przecięciu …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.