Statystyki i duże zbiory danych

Pytania i odpowiedzi dla osób zainteresowanych statystyką, uczeniem maszynowym, analizą danych, eksploracją danych i wizualizacją danych

16
Jakie niewłaściwie użyte warunki statystyczne warto poprawić?
Statystyka jest wszędzie; powszechne stosowanie terminów statystycznych jest jednak często niejasne. Terminy prawdopodobieństwo i szanse są używane zamiennie w świeckim języku angielskim, pomimo ich dobrze zdefiniowanych i różnych wyrażeń matematycznych. Nie oddzielanie terminu prawdopodobieństwo od rutynowo dezorientuje lekarzy próbujących oszacować prawdopodobieństwo raka piersi, biorąc pod uwagę pozytywną mammografię: „Och, jakie …
103 terminology 

19
Jak zirytować sędziego statystycznego?
Niedawno zadałem pytanie dotyczące ogólnych zasad dotyczących przeglądu statystyk w artykułach . Chciałbym teraz zapytać o to, co szczególnie irytuje cię podczas recenzowania artykułu, czyli jaki jest najlepszy sposób, aby naprawdę zirytować sędziego statystycznego! Poproszę jeden przykład na odpowiedź.


2
Usuwanie istotnej statystycznie perspektywie przechwytujący zwiększa
W prostym modelu liniowym z jedną zmienną objaśniającą αi=β0+β1δi+ϵiαi=β0+β1δi+ϵi\alpha_i = \beta_0 + \beta_1 \delta_i + \epsilon_i Znaleźć że usunięcie termin przechwytujący znacznie poprawia dopasowanie (wartość R2R2R^2 przechodzi od 0,3 do 0,9). Jednak pojęcie przechwytywania wydaje się istotne statystycznie. Z przechwyceniem: Call: lm(formula = alpha ~ delta, data = cf) Residuals: …


8
ASA omawia ograniczenia wartości
Mamy już wiele wątków oznaczonych jako wartości p, które ujawniają wiele nieporozumień na ich temat. Dziesięć miesięcy temu mieliśmy wątek o czasopiśmie psychologicznym, który „zakazał” wartości ppp , obecnie Amerykańskie Stowarzyszenie Statystyczne (2016) mówi, że dzięki naszej analizie „nie powinniśmy kończyć się obliczeniem wartości ”.ppp Amerykańskie Stowarzyszenie Statystyczne (ASA) uważa, …



25
Lokalizowanie swobodnie dostępnych próbek danych
Pracowałem nad nową metodą analizy i analizy zestawów danych w celu identyfikacji i izolacji podgrup populacji bez uprzedniej wiedzy o cechach podgrup. Chociaż metoda działa wystarczająco dobrze ze sztucznymi próbkami danych (tj. Zestawami danych utworzonymi specjalnie w celu identyfikacji i segregacji podzbiorów populacji), chciałbym spróbować przetestować ją z danymi na …

9
Czy tak naprawdę działają wartości p? Czy milion artykułów naukowych rocznie może być oparty na czystej przypadkowości?
Jestem bardzo nowy w statystyce i dopiero uczę się rozumieć podstawy, w tym wartości . Ale teraz mam w głowie ogromny znak zapytania i mam nadzieję, że moje zrozumienie jest błędne. Oto mój proces myślowy:ppp Czy wszystkie badania na świecie nie przypominają małp w „twierdzeniu o nieskończonej małpie”? Weź pod …

1
Drzewa wnioskowania warunkowego a tradycyjne drzewa decyzyjne
Czy ktoś może wyjaśnić podstawowe różnice między drzewami wnioskowania warunkowego ( ctreez partypakietu w R) w porównaniu do bardziej tradycyjnych algorytmów drzewa decyzyjnego (takich jak rpartw R)? Co wyróżnia drzewa CI? Mocne i słabe strony? Aktualizacja: Przejrzałem artykuł Horthorna i wsp., Do którego Chi odwołuje się w komentarzach. Nie byłem …



3
Intuicyjne wyjaśnienie rdzenia jednostki
Jak wyjaśniłbyś intuicyjnie, czym jest root root, w kontekście testu root root? Zastanawiam się nad wytłumaczeniem, tak jak założyłem to pytanie . Przypadek z pierwiastkiem jednostkowym jest taki, że wiem (przy okazji, mało), że test pierwiastka jednostkowego służy do testowania stacjonarności w szeregu czasowym, ale to po prostu to. Jak …


Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.