Statystyki i duże zbiory danych methodology

6

Używając analizy skupień w zbiorze danych do grupowania podobnych przypadków, należy wybierać spośród wielu metod grupowania i miar odległości. Czasami jeden wybór może wpływać na drugi, ale istnieje wiele możliwych kombinacji metod. Czy ktoś ma jakieś zalecenia dotyczące wyboru różnych algorytmów / metod grupowania i pomiarów odległości ? W jaki …

73 clustering distance-functions methodology

4

Kiedy używać frameworka Fisher i Neyman-Pearson?

Ostatnio dużo czytałem o różnicach między metodą testowania hipotez Fishera a szkołą myślenia Neymana-Pearsona. Moje pytanie brzmi, ignorując na chwilę obiekcje filozoficzne; kiedy powinniśmy zastosować podejście Fishera do modelowania statystycznego, a kiedy należy zastosować metodę poziomów istotności i tak dalej Neymana-Pearsona? Czy istnieje praktyczny sposób decydowania, który punkt widzenia poprzeć …

73 hypothesis-testing p-value methodology

30

Najbardziej znani statystycy

Jakie są najważniejsze statystyki i co sprawiło, że stali się sławni? (Odpowiedz tylko na jednego naukowca na odpowiedź).

53 methodology history

2

Określanie wielkości próbki niezbędnej dla metody ładowania początkowego / proponowanej metody

Wiem, że jest to dość gorący temat, na który nikt tak naprawdę nie jest w stanie udzielić prostej odpowiedzi. Niemniej jednak zastanawiam się, czy poniższe podejście nie byłoby przydatne. Metoda ładowania początkowego jest użyteczna tylko wtedy, gdy twoja próbka odpowiada mniej więcej (dokładnie odczytać) tej samej dystrybucji, co pierwotna populacja. …

33 bootstrap sample-size methodology

2

Czy „Hunting of the Snark” Joela Spolsky'ego zawiera poprawną analizę treści statystycznych?

Jeśli ostatnio czytałeś biuletyny społecznościowe, prawdopodobnie widziałeś The Hunting of the Snark, post na oficjalnym blogu StackExchange autorstwa Joela Spolsky'ego, CEO sieci StackExchange. Omawia analizę statystyczną przeprowadzoną na próbie komentarzy SE w celu oceny ich „przyjazności” z perspektywy użytkownika zewnętrznego. Komentarze zostały losowo pobrane z StackOverflow, a analitycy treści byli …

25 reliability agreement-statistics methodology

3

Pięć najlepszych klasyfikatorów do wypróbowania w pierwszej kolejności

Poza oczywistymi cechami klasyfikatora, takimi jak koszt obliczeniowy, oczekiwane typy danych funkcji / etykiet i przydatność do określonych rozmiarów i wymiarów zbiorów danych, jakich pięciu najlepszych (lub 10, 20?) klasyfikatorów wypróbowuje najpierw na nowym zbiorze danych , o którym jeszcze niewiele wiadomo (np. semantyka i korelacja poszczególnych cech)? Zwykle wypróbowuję …

25 machine-learning classification methodology

1

Czy analiza mocy a priori jest zasadniczo bezużyteczna?

W zeszłym tygodniu uczestniczyłem w spotkaniu Towarzystwa Osobowości i Psychologii Społecznej, gdzie widziałem przemówienie Uri Simonsohna z założeniem, że zastosowanie analizy mocy a priori w celu ustalenia wielkości próby było zasadniczo bezużyteczne, ponieważ jej wyniki są tak wrażliwe na założenia. Oczywiście, twierdzenie to jest sprzeczne z tym, czego nauczono mnie …

23 hypothesis-testing power-analysis effect-size power methodology

2

Wybór metody rozkładu sezonowego

Dostosowanie sezonowe jest kluczowym etapem wstępnego przetwarzania danych do dalszych badań. Badacz ma jednak wiele opcji rozkładu sezonowego w cyklu trendu. Najczęstszymi (sądząc po liczbie cytowań w literaturze empirycznej) rywalizującymi metodami rozkładu sezonowego są X-11 (12) -ARIMA, Tramo / Seats (oba zaimplementowane w Demetra + ) i 's stl . …

20 time-series data-transformation methodology seasonality

1

Jak wizualizować funkcję gęstości 3D?

Jaki jest najlepszy sposób graficznej wizualizacji funkcji gęstości 3D? Jak w chciałbym wizualizować ?z= fX, Y( x , y)z=faX,Y(x,y)z=f_{X,Y}(x,y) Nie jest to konieczne, ale Rkod do tego byłby świetny.

19 r data-visualization methodology

1

Obiektywne a subiektywne paradygmaty bayesowskie

Jaka jest różnica między obiektywnymi a subiektywnymi paradygmatami bayesowskimi? Jakie obiekty lub procedury definiują lub interpretują inaczej? Czy jest jakaś różnica w wyborze metod?

12 bayesian methodology

4

Przykłady kosztownych konsekwencji niewłaściwego użycia narzędzi statystycznych

Podejrzewam, że większość użytkowników narzędzi statystycznych to użytkownicy pomocniczy (ludzie, którzy nie mieli formalnego szkolenia statystycznego). Bardzo kuszące jest, aby badacze i inni profesjonaliści zastosowali metody statystyczne do swoich danych po prostu dlatego, że widzieli to „wcześniej” w recenzowanych artykułach, szarej literaturze, Internecie lub na konferencji. Jednak zrobienie tego bez …

12 dataset methodology

2

Czy warto publikować na odnośnej wiki StatProb.com? [Zamknięte]

Zamknięte . To pytanie jest oparte na opiniach . Obecnie nie przyjmuje odpowiedzi. Chcesz poprawić to pytanie? Zaktualizuj pytanie, aby można było na nie odpowiedzieć faktami i cytatami, edytując ten post . Zamknięte 7 miesięcy temu . tło O StatProb.com czytam z komentarza na blogu Andrew Gelmana . Według strony …

11 probability references methodology

1

Jakie są dobre ramy wyboru metod?

Patrzyłem na teoretyczne ramy wyboru metod (uwaga: nie wybór modelu) i znalazłem bardzo mało systematycznej, motywowanej matematycznie pracy. Pod pojęciem „wybór metody” rozumiem strukturę umożliwiającą rozróżnienie odpowiedniej (lub lepszej, optymalnej) metody w odniesieniu do problemu lub rodzaju problemu. To, co znalazłem, jest znaczące, jeśli fragmentaryczne, pracuje nad poszczególnymi metodami i …

11 machine-learning methodology theory

3

Jakie są kryteria i podejmowane decyzje dotyczące nieliniowości w modelach statystycznych?

Mam nadzieję, że poniższe ogólne pytanie ma sens. Należy pamiętać, że do celów tego konkretnego pytania nie interesują mnie teoretyczne (domena przedmiotowa) powody wprowadzenia nieliniowości. Dlatego sformułuję pełne pytanie w następujący sposób: Jakie są logiczne ramy ( kryteria i, jeśli to możliwe, proces decyzyjny ) dla wprowadzenia nieliniowości do modeli …

10 nonlinear-regression methodology nonlinear regression-strategies

5

Czy można najpierw dopasować model Bayesa, a następnie zacząć osłabiać priory?

Podczas częstych statystyk istnieje długa lista dużych „no-nosów”, takich jak przeglądanie wyników testów statystycznych przed podjęciem decyzji o zebraniu większej ilości danych. Zastanawiam się na ogół, czy istnieje podobna lista numerów zerowych dla metodologii stosowanych w statystyce bayesowskiej, a konkretnie, czy jedna z nich jest następująca. Niedawno zdałem sobie sprawę, …

10 bayesian methodology

Pytania otagowane jako methodology