Pytania otagowane jako association-measure

Miary związku między zmiennymi, pojęcie bardziej ogólne niż korelacja

3
Przykład: regresja LASSO z użyciem glmnet dla wyniku binarnego
Zaczynam bawić sięglmnet za pomocą regresji LASSO, gdzie moje wyniki zainteresowania są dychotomiczne. Poniżej utworzyłem małą próbną ramkę danych: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, 0.91, …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 





1
Jaka jest właściwa miara asocjacji zmiennej ze składnikiem PCA (na biplocie / wykresie ładowania)?
Używam FactoMineRdo zredukowania mojego zestawu danych pomiarów do ukrytych zmiennych. Powyższa mapa zmiennych jest dla mnie jasna do interpretacji, ale jestem zdezorientowany, jeśli chodzi o powiązania między zmiennymi a składnikiem 1. Patrząc na mapę zmiennych ddpi covjest ona bardzo blisko komponentu na mapie i ddpAbsjest nieco dalej z dala. Ale …

2
Możliwość zastosowania testu chi-kwadrat, jeżeli wiele komórek ma częstotliwości mniejsze niż 5
Aby znaleźć związek między wsparciem rówieśnika (zmienna niezależna) a satysfakcją z pracy (zmienna zależna), chcę zastosować test chi-kwadrat. Wsparcie rówieśników to kategorie w czterech grupach według stopnia wsparcia: 1 = bardzo mniej, 2 = do pewnego stopnia, 3 = w dużym stopniu i 4 = w bardzo dużym stopniu. Zadowolenie …

2
Nieparametryczna miara siły powiązania między porządkową i ciągłą zmienną losową
Rzucam tutaj problem tak, jak go otrzymałem. Mam dwie zmienne losowe. Jeden z nich jest ciągły (Y), a drugi dyskretny i zostanie przyjęty jako porządkowy (X). Umieściłem poniżej wątku, który otrzymałem wraz z zapytaniem. Osoba, która przesłała mi dane, chce zmierzyć siłę powiązania między X i Y. Poszukuję pomysłów, które …

1
Jaka jest optymalna funkcja odległości dla osób, gdy atrybuty są nominalne?
Nie wiem, jakiej funkcji odległości między osobami należy użyć w przypadku nominalnych (nieuporządkowanych atrybutów kategorialnych). Czytałem jakiś podręcznik i sugerują one funkcję Simple Matching, ale niektóre książki sugerują, że powinienem zmienić atrybuty nominalne na binarne i użyć współczynnika Jaccard . Co jednak, jeśli wartości atrybutu nominalnego nie wynoszą 2? co …

3
Jakich metod statystycznych mogę użyć do znalezienia popularnych lub powszechnych kombinacji zmiennych kategorialnych?
Robię badania nad używaniem wielu narkotyków. Mam zestawy danych o 400 narkomanach, którzy stwierdzili, że używają narkotyków. Istnieje ponad 10 leków, a więc istnieją duże możliwe kombinacje. Przekodowałem większość spożywanych przez siebie narkotyków na zmienne binarne (tj. Heroina wynosi 1, jeśli narkoman nadużywał heroiny w innym przypadku 0). Chciałbym znaleźć …

2
Korelacja między zmienną dychotomiczną i zmienną ciągłą
Próbuję znaleźć korelację między zmienną dychotomiczną i zmienną ciągłą. Na podstawie moich prac nad tym stwierdziłem, że muszę zastosować niezależny test t, a warunkiem tego jest, aby rozkład zmiennej był normalny. Przeprowadziłem test Kołmogorowa-Smirnowa w celu przetestowania normalności i stwierdziłem, że zmienna ciągła jest nienormalna i jest wypaczona (dla około …

13
Jeśli „B jest bardziej prawdopodobne, że otrzyma A”, to „A jest bardziej prawdopodobne, że otrzyma B”
Próbuję uzyskać jaśniejszy intuicji tyle: „Jeśli sprawia bardziej prawdopodobne, następnie sprawia bardziej prawdopodobne”, czyliZAAAbBBbBBZAAA Niech oznaczają wielkość przestrzeni, w której i są, po czymn ( S)n(S)n(S)ZAAAbBB Twierdzenie: soP.( B | A ) > P( B )P(B|A)>P(B)P(B|A)>P(B)n ( A B ) / n ( A ) > n ( B ) …

3
Obliczanie Jaccarda lub innego współczynnika asocjacji dla danych binarnych przy użyciu mnożenia macierzy
Chcę wiedzieć, czy istnieje jakikolwiek sposób obliczenia współczynnika Jaccard przy użyciu mnożenia macierzy. Użyłem tego kodu jaccard_sim <- function(x) { # initialize similarity matrix m <- matrix(NA, nrow=ncol(x),ncol=ncol(x),dimnames=list(colnames(x),colnames(x))) jaccard <- as.data.frame(m) for(i in 1:ncol(x)) { for(j in i:ncol(x)) { jaccard[i,j]= length(which(x[,i] & x[,j])) / length(which(x[,i] | x[,j])) jaccard[j,i]=jaccard[i,j] } } …

2
Parametryczne, półparametryczne i nieparametryczne ładowanie początkowe dla modeli mieszanych
Z tego artykułu pochodzą następujące przeszczepy . Jestem nowicjuszem w bootstrapie i próbuję zaimplementować parametryczne, semiparametryczne i nieparametryczne bootstrapowanie dla liniowego modelu mieszanego z R bootpakietem. Kod R. Oto mój Rkod: library(SASmixed) library(lme4) library(boot) fm1Cult <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=Cultivation) fixef(fm1Cult) boot.fn <- function(data, …
9 r  mixed-model  bootstrap  central-limit-theorem  stable-distribution  time-series  hypothesis-testing  markov-process  r  correlation  categorical-data  association-measure  meta-analysis  r  anova  confidence-interval  lm  r  bayesian  multilevel-analysis  logit  regression  logistic  least-squares  eda  regression  notation  distributions  random-variable  expected-value  distributions  markov-process  hidden-markov-model  r  variance  group-differences  microarray  r  descriptive-statistics  machine-learning  references  r  regression  r  categorical-data  random-forest  data-transformation  data-visualization  interactive-visualization  binomial  beta-distribution  time-series  forecasting  logistic  arima  beta-regression  r  time-series  seasonality  large-data  unevenly-spaced-time-series  correlation  statistical-significance  normalization  population  group-differences  demography 
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.