Pytania otagowane jako reliability

Mówi się, że środek ma wysoką niezawodność, jeśli daje podobne wyniki w stałych warunkach. NIE myl niezawodności z trafnością (zobacz tag wiki). NIE WOLNO używać w celu zapewnienia wiarygodności między oceniającymi, które mają swój własny tag

1
Obliczanie wariancji Kappa Cohena (i standardowych błędów)
Statystyka Kappa ( ) została wprowadzona w 1960 roku przez Cohena [1] w celu zmierzenia zgodności między dwoma wskaźnikami. Ta wariancja była jednak źródłem sprzeczności od dłuższego czasu.κκ\kappa Moje pytanie dotyczy tego, które jest najlepsze obliczenie wariancji do zastosowania z dużymi próbkami. Jestem skłonny wierzyć, że ten przetestowany i zweryfikowany …


1
Obliczanie powtarzalności efektów z modelu Lmer
Właśnie natknąłem się na ten artykuł , który opisuje, jak obliczyć powtarzalność (aka niezawodność, aka korelacja wewnątrzklasowa) pomiaru za pomocą modelowania efektów mieszanych. Kod R byłby następujący: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute the unadjusted repeatability …
28 mixed-model  reliability  intraclass-correlation  repeatability  spss  factor-analysis  survey  modeling  cross-validation  error  curve-fitting  mediation  correlation  clustering  sampling  machine-learning  probability  classification  metric  r  project-management  optimization  svm  python  dataset  quality-control  checking  clustering  distributions  anova  factor-analysis  exponential  poisson-distribution  generalized-linear-model  deviance  machine-learning  k-nearest-neighbour  r  hypothesis-testing  t-test  r  variance  levenes-test  bayesian  software  bayesian-network  regression  repeated-measures  least-squares  change-scores  variance  chi-squared  variance  nonlinear-regression  regression-coefficients  multiple-comparisons  p-value  r  statistical-significance  excel  sampling  sample  r  distributions  interpretation  goodness-of-fit  normality-assumption  probability  self-study  distributions  references  theory  time-series  clustering  econometrics  binomial  hypothesis-testing  variance  t-test  paired-comparisons  statistical-significance  ab-test  r  references  hypothesis-testing  t-test  normality-assumption  wilcoxon-mann-whitney  central-limit-theorem  t-test  data-visualization  interactive-visualization  goodness-of-fit 

2
Czy „Hunting of the Snark” Joela Spolsky'ego zawiera poprawną analizę treści statystycznych?
Jeśli ostatnio czytałeś biuletyny społecznościowe, prawdopodobnie widziałeś The Hunting of the Snark, post na oficjalnym blogu StackExchange autorstwa Joela Spolsky'ego, CEO sieci StackExchange. Omawia analizę statystyczną przeprowadzoną na próbie komentarzy SE w celu oceny ich „przyjazności” z perspektywy użytkownika zewnętrznego. Komentarze zostały losowo pobrane z StackOverflow, a analitycy treści byli …

2
Niezawodność między oceniającymi dla danych porządkowych lub przedziałowych
Jakie metody wiarygodności między oceniającymi są najbardziej odpowiednie dla danych porządkowych lub przedziałowych? Uważam, że „wspólne prawdopodobieństwo porozumienia” lub „Kappa” są przeznaczone dla danych nominalnych. Chociaż można użyć „Pearson” i „Spearman”, są one głównie używane w przypadku dwóch wskaźników pomiarowych (chociaż można je stosować w więcej niż dwóch wskaźnikach). Jakie …

2
Ocena wiarygodności kwestionariusza: wymiarowość, problematyczne elementy i czy użyć alfa, lambda6 lub jakiegoś innego indeksu?
Analizuję wyniki podane przez uczestników biorących udział w eksperymencie. Chcę oszacować wiarygodność mojego kwestionariusza, który składa się z 6 pozycji, mających na celu oszacowanie stosunku uczestników do produktu. Obliczyłem alfa Cronbacha traktującego wszystkie elementy jako pojedynczą skalę (alfa wynosiła około 0,6) i usuwając jeden element na raz (maksymalna alfa wynosiła …

2
Dokładność vs. pole pod krzywą ROC
Skonstruowałem krzywą ROC dla systemu diagnostycznego. Pole pod krzywą zostało następnie oszacowane nieparametrycznie na AUC = 0,89. Kiedy próbowałem obliczyć dokładność przy optymalnym ustawieniu progu (punkt najbliższy punktowi (0, 1)), dostałem dokładność układu diagnostycznego na 0,8, czyli mniej niż AUC! Kiedy sprawdziłem dokładność przy innym ustawieniu progu, który jest daleki …


4
Jakie są studia przypadków w badaniach polityki zdrowia publicznego, w których nieuczciwe / mylone / nieprawidłowe badania lub modele były niewłaściwie wykorzystywane?
Przygotowuję przegląd literatury na temat aktualnego problemu zdrowia publicznego, w którym dane są pomieszane: Jakie są typowe historyczne studia przypadków wykorzystywane w edukacji zdrowotnej / epidemiologicznej, w których nieważne lub zakłócone relacje lub wnioski były celowo lub błędnie stosowane w polityce i ustawodawstwie w zakresie zdrowia publicznego? Fala fatality samochodowe …

1
Caret glmnet vs cv.glmnet
Wydaje się, że istnieje wiele zamieszania w porównaniu używania glmnetwewnątrz w caretcelu znalezienia optymalnej lambdy i korzystania cv.glmnetz tego samego zadania. Zadano wiele pytań, np .: Model klasyfikacji train.glmnet vs. cv.glmnet? Jaki jest właściwy sposób używania glmnet z karetką? Cross-validation `glmnet` za pomocą` caret` ale nie udzielono odpowiedzi, co może …

2
Interrater niezawodność dla zdarzeń w szeregu czasowym z niepewnością co do czasu zdarzenia
Mam wielu niezależnych programistów, którzy próbują zidentyfikować zdarzenia w szeregu czasowym - w tym przypadku oglądam wideo rozmowy twarzą w twarz i szukam określonych zachowań niewerbalnych (np. Skinienie głową) oraz kodują czas i kategorię każdego z nich zdarzenie. Dane te można rozsądnie potraktować jako szereg dyskretny w czasie o wysokiej …

2
Identyfikacja bezużytecznych pytań z kwestionariusza
Opracowuję kwestionariusz. Aby poprawić jego niezawodność i aktualność, chcę zastosować metody statystyczne. Chcę wyeliminować pytania, których odpowiedzi są zawsze takie same. Oznacza to, że prawie wszyscy uczestnicy udzielili takich samych odpowiedzi na te pytania. Teraz moje pytania to: Jaki jest termin techniczny na takie bezużyteczne pytania, których odpowiedzi są zawsze …

2
Jak zmniejszyć liczbę elementów za pomocą analizy czynnikowej, spójności wewnętrznej i teorii odpowiedzi na element w połączeniu?
Jestem w trakcie empirycznego opracowywania kwestionariusza i użyję dowolnych liczb w tym przykładzie do zilustrowania. Dla kontekstu opracowuję kwestionariusz psychologiczny mający na celu ocenę wzorców myślenia powszechnie identyfikowanych u osób z zaburzeniami lękowymi. Element może wyglądać tak: „Muszę wielokrotnie sprawdzać piekarnik, ponieważ nie jestem pewien, czy jest wyłączony ”. Mam …

3
Niezawodność dopasowanej krzywej?
Chciałbym oszacować niepewność lub wiarygodność dopasowanej krzywej. Celowo nie wymieniam dokładnej wielkości matematycznej, której szukam, ponieważ nie wiem, co to jest. Tutaj (energia) jest zmienną zależną (odpowiedź), a (objętość) jest zmienną niezależną. Chciałbym znaleźć krzywą energia-objętość, , jakiegoś materiału. Wykonałem więc obliczenia za pomocą komputerowego programu chemii kwantowej, aby uzyskać …

2
Jak dokładny jest IQR w wykrywaniu wartości odstających
Piszę skrypt analizujący czasy uruchamiania procesów. Nie jestem pewien ich dystrybucji, ale chcę wiedzieć, czy proces działa „za długo”. Do tej pory korzystałem z 3 standardowych odchyleń czasów ostatniego uruchomienia (n> 30), ale powiedziano mi, że nie zapewnia to niczego użytecznego, jeśli dane nie są normalne (co nie wydaje się …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.