Pytania otagowane jako rule-of-thumb

Doradza w zakresie analiz statystycznych, które są często przydatne w praktyce (ale nie zawsze gwarantują działanie).

24
Praktyczne zasady dla „nowoczesnych” statystyk
Lubię książkę G van Belle'a na temat statystycznych reguł kciuka oraz, w mniejszym stopniu, typowych błędów w statystyce (i jak ich uniknąć) autorstwa Phillipa I Gooda i Jamesa W. Hardina. Odnoszą się do typowych problemów podczas interpretacji wyników badań eksperymentalnych i obserwacyjnych oraz dostarczają praktycznych zaleceń dotyczących wnioskowania statystycznego lub …

8
Obliczanie optymalnej liczby pojemników na histogramie
Interesuje mnie znalezienie możliwie optymalnej metody określania, ile pojemników powinienem użyć na histogramie. Moje dane powinny mieścić się w przedziale od 30 do 350 obiektów, a w szczególności staram się stosować próg (taki jak metoda Otsu), w którym „dobre” obiekty, których powinienem mieć mniej i które powinny być bardziej rozproszone, …

7
Praktyczne zasady dotyczące minimalnej wielkości próby dla regresji wielokrotnej
W kontekście propozycji badań w naukach społecznych zadano mi następujące pytanie: Zawsze ustalałem minimalną wielkość próby dla regresji wielokrotnej o 100 + m (gdzie m jest liczbą predyktorów). Czy to jest właściwe? Często otrzymuję podobne pytania, często o różnych regułach. Często czytałem takie praktyczne zasady w różnych podręcznikach. Czasami zastanawiam …

4
Jakie odniesienia należy przytoczyć, aby poprzeć użycie 30 jako wystarczająco dużej próbki?
Wielokrotnie czytałem / słyszałem, że wielkość próbki co najmniej 30 jednostek jest uważana za „dużą próbkę” (założenia dotyczące normalności środków zwykle w przybliżeniu zachowują się z powodu CLT, ...). Dlatego w moich eksperymentach zwykle generuję próbki 30 jednostek. Czy możesz podać mi odniesienie, które należy zacytować, gdy używasz próbki o …

2
Dobry zasób online z poradami na temat graficznego powiązania dwóch zmiennych numerycznych w różnych warunkach
Kontekst: Przez ten czas zyskałem zestaw heurystyk, jak efektywnie wykreślić powiązanie między dwiema zmiennymi numerycznymi. Wyobrażam sobie, że większość ludzi pracujących z danymi miałaby podobny zestaw reguł. Przykładami takich reguł mogą być: Jeśli jedna ze zmiennych jest dodatnio wypaczona, rozważ wykreślenie tej osi na skali logarytmicznej. Jeśli istnieje wiele punktów …

4
Jak rzutować nowy wektor na przestrzeń PCA?
Po przeprowadzeniu analizy głównego składnika (PCA) chcę rzutować nowy wektor na przestrzeń PCA (tzn. Znaleźć jego współrzędne w układzie współrzędnych PCA). Mam obliczony PCA w języku R użyciu prcomp. Teraz powinienem być w stanie pomnożyć mój wektor przez macierz obrotu PCA. Czy główne elementy tej macierzy powinny być ułożone w …
21 r  pca  r  variance  heteroscedasticity  misspecification  distributions  time-series  data-visualization  modeling  histogram  kolmogorov-smirnov  negative-binomial  likelihood-ratio  econometrics  panel-data  categorical-data  scales  survey  distributions  pdf  histogram  correlation  algorithms  r  gpu  parallel-computing  approximation  mean  median  references  sample-size  normality-assumption  central-limit-theorem  rule-of-thumb  confidence-interval  estimation  mixed-model  psychometrics  random-effects-model  hypothesis-testing  sample-size  dataset  large-data  regression  standard-deviation  variance  approximation  hypothesis-testing  variance  central-limit-theorem  kernel-trick  kernel-smoothing  error  sampling  hypothesis-testing  normality-assumption  philosophical  confidence-interval  modeling  model-selection  experiment-design  hypothesis-testing  statistical-significance  power  asymptotics  information-retrieval  anova  multiple-comparisons  ancova  classification  clustering  factor-analysis  psychometrics  r  sampling  expectation-maximization  markov-process  r  data-visualization  correlation  regression  statistical-significance  degrees-of-freedom  experiment-design  r  regression  curve-fitting  change-point  loess  machine-learning  classification  self-study  monte-carlo  markov-process  references  mathematical-statistics  data-visualization  python  cart  boosting  regression  classification  robust  cart  survey  binomial  psychometrics  likert  psychology  asymptotics  multinomial 

3
lub
Czy ktoś używa metryk L1L1L_1 lub L.5L.5L_.5 do grupowania, a nie L2L2L_2 ? Aggarwal i wsp., O zaskakującym zachowaniu wskaźników odległości w przestrzeni wielowymiarowej powiedział (w 2001) jest konsekwentnie bardziej preferowany niż metryczny euklidesowy wskaźnik odległości L 2 dla aplikacji eksploracji danych o dużych wymiarachL1L1L_1L2L2L_2 i twierdził, że lub L …


1
Wielkość próbki wymagana do ustalenia, który zestaw reklam ma najwyższy współczynnik klikalności
Z zawodu jestem projektantem oprogramowania i pracuję nad projektem dla klienta i chciałbym upewnić się, że moja analiza jest statystycznie wiarygodna. Zastanów się, co następuje: Mamy n reklam (n <10) i chcemy po prostu wiedzieć, która reklama jest najskuteczniejsza. Nasz serwer reklam losowo wyświetli jedną z tych reklam. Sukces polega …

4
MANOVA i korelacje między zmiennymi zależnymi: jak silny jest zbyt silny?
Zmienne zależne w MANOVA nie powinny być „zbyt silnie skorelowane”. Ale jak silna korelacja jest zbyt silna? Interesujące byłoby uzyskanie opinii ludzi na ten temat. Na przykład, czy kontynuowałbyś MANOVA w następujących sytuacjach? Y1 i Y2 są skorelowane z ip &lt; 0,005r = 0,3r=0.3r=0.3p &lt; 0,005p&lt;0.005p<0.005 Y1 i Y2 są …


1
Histogram z pojemnikami jednolitymi vs niejednorodnymi
To pytanie opisuje podstawową różnicę między histogramem jednolitym i niejednorodnym. I to pytanie omawia ogólną zasadę wybierania liczby pojemników jednolitego histogramu, który optymalizuje (w pewnym sensie) stopień, w jakim histogram reprezentuje rozkład, z którego zostały pobrane próbki danych. Nie mogę znaleźć takiego samego rodzaju „optymalności” dyskusji na temat histogramów jednolitych …

1
Jak sformalizować wcześniejszy rozkład prawdopodobieństwa? Czy istnieją zasady praktyczne lub wskazówki, których należy używać?
Chociaż lubię myśleć, że dobrze rozumiem pojęcie wcześniejszych informacji w bayesowskiej analizie statystycznej i podejmowaniu decyzji, często mam problem z otuleniem się o jej zastosowanie. Mam na myśli kilka sytuacji, które są przykładami moich zmagań i uważam, że nie zostały one właściwie omówione w bayesowskich podręcznikach statystycznych, które do tej …
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.