Pytania otagowane jako ordinal-data

Dane z wartościami kategorialnymi, które można uporządkować według wielkości, ale dokładna odległość (odstępy) między kategoriami jest nieokreślona lub nieznana.


8
Czy kiedykolwiek ma sens traktowanie danych kategorycznych jako ciągłych?
Odpowiadając na to pytanie dotyczące danych dyskretnych i ciągłych , uprzejmie stwierdziłem, że rzadko ma sens traktowanie danych kategorycznych jako ciągłych. Na pierwszy rzut oka wydaje się to oczywiste, ale intuicja jest często kiepskim przewodnikiem statystycznym, a przynajmniej moim. Zastanawiam się teraz: czy to prawda? A może istnieją ustalone analizy, …


6
Czy „średnia ocena” Amazon jest myląca?
Jeśli dobrze rozumiem, oceny książek w skali 1-5 to wyniki Likerta. Oznacza to, że 3 dla mnie niekoniecznie musi być 3 dla kogoś innego. To IMO w skali porządkowej. Tak naprawdę nie należy uśredniać skal porządkowych, ale zdecydowanie można wybrać tryb, medianę i percentyle. Czy więc „w porządku” jest naginanie …

7
Wykres zależności między dwiema zmiennymi porządkowymi
Jaki jest odpowiedni wykres ilustrujący związek między dwiema zmiennymi porządkowymi? Kilka opcji, o których mogę myśleć: Wykres rozproszenia z dodanym drganiami losowymi, aby zatrzymać ukrywanie się punktów. Niby standardowa grafika - Minitab nazywa to „wykresem wartości indywidualnych”. Moim zdaniem może to być mylące, ponieważ wizualnie zachęca do pewnego rodzaju interpolacji …

1
Czy istnieje analiza czynnikowa lub PCA dla danych porządkowych lub binarnych?
Ukończyłem analizę głównych składników (PCA), eksploracyjną analizę czynnikową (EFA) i potwierdzającą analizę czynnikową (CFA), traktując dane za pomocą skali Likerta (odpowiedzi 5-stopniowe: brak, trochę, trochę ...) jako ciągłe zmienna. Następnie, używając Lavaana, powtórzyłem CFA, definiując zmienne jako kategoryczne. Chciałbym wiedzieć, jakie typy analiz byłyby odpowiednie i byłyby równoważne PCA i …

6
Różnice grupowe dla pięciopunktowego elementu Likerta
W następstwie tego pytania : Wyobraź sobie, że chcesz sprawdzić różnice w tendencji centralnej między dwiema grupami (np. Mężczyznami i kobietami) w 5-punktowym elemencie Likerta (np. Zadowolenie z życia: niezadowolony z zadowolonego). Myślę, że test t byłby wystarczająco dokładny dla większości celów, ale że test ładowania początkowego różnic między średnimi …

1
Jak skonfigurować sieć neuronową do generowania danych porządkowych?
Mam sieć neuronową skonfigurowaną do przewidywania czegoś, gdzie zmienna wyjściowa jest porządkowa. Opiszę poniżej, używając trzech możliwych wyjść A <B <C. Jest całkiem oczywiste, jak używać sieci neuronowej do generowania danych kategorycznych: dane wyjściowe to tylko softmax ostatniej (zwykle w pełni połączonej) warstwy, jednej na kategorię, a przewidywana kategoria to …

4
Oblicz średnią zmiennej porządkowej
Czytałem w wielu miejscach, że obliczanie średniej zmiennej porządkowej jest niewłaściwe. Próbuję uzyskać intuicję, dlaczego może to być nieodpowiednie. Myślę, że dzieje się tak, ponieważ generalnie zmienna porządkowa nie jest normalnie rozkładana, a zatem obliczenie średniej da niedokładną reprezentację. Czy ktoś mógłby podać bardziej szczegółowe uzasadnienie, dlaczego obliczanie średniej zmiennej …


3
Jak obsługiwać porządkową zmienną kategorialną jako zmienną niezależną
Korzystam z modelu logit. Moja zmienna zależna jest binarna. Jednak mam niezależną zmienną, która jest kategoryczne i zawiera odpowiedzi: 1.very good, 2.good, 3.average, 4.poor and 5.very poor. Jest to więc porządkowe („ilościowe jakościowe”). Nie jestem pewien, jak sobie z tym poradzić w modelu. Używam gretl. [Uwaga z @ttnphns: Chociaż pytanie …


4
Dokładność maszyny zwiększającej gradient zmniejsza się wraz ze wzrostem liczby iteracji
Eksperymentuję z algorytmem maszyny do zwiększania gradientu za pośrednictwem caretpakietu w R. Korzystając z małego zestawu danych o przyjęciach na studia, uruchomiłem następujący kod: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

1
Jaka intuicja kryje się za wymiennymi próbkami pod hipotezą zerową?
Testy permutacyjne (zwane również testem randomizacji, testem ponownej randomizacji lub testem dokładnym) są bardzo przydatne i przydają się, gdy t-testnie jest spełnione założenie o rozkładzie normalnym wymagane na przykład i gdy transformacja wartości przez ranking test nieparametryczny, Mann-Whitney-U-testktóry prowadziłby do utraty większej ilości informacji. Jednak nie należy zapominać o jednym …
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

1
Jak poprawnie ocenić korelację między zmienną porządkową a zmienną ciągłą?
Chciałbym oszacować korelację między: Zmienna porządkowa: badani proszeni są o ocenę swoich preferencji dla 6 rodzajów owoców w skali 1-5 (od bardzo obrzydliwych do bardzo smacznych) Średnio badani używają tylko 3 punktów skali. Ciągła zmienna: ci sami badani proszeni są o szybką identyfikację tych owoców, co daje średnią dokładność dla …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.