Statystyki i duże zbiory danych

Pytania i odpowiedzi dla osób zainteresowanych statystyką, uczeniem maszynowym, analizą danych, eksploracją danych i wizualizacją danych


6
Jaką metodę można zastosować do wykrycia sezonowości danych?
Chcę wykryć sezonowość w danych, które otrzymuję. Znalazłem kilka metod, takich jak wykres sezonowych podserii i wykres autokorelacji, ale chodzi o to, że nie rozumiem, jak czytać wykres, czy ktoś mógłby pomóc? Inną kwestią jest to, czy istnieją inne metody wykrywania sezonowości z końcowym wynikiem na wykresie lub bez?


8
Po co nadal uczyć i stosować testowanie hipotez (gdy dostępne są przedziały ufności)?
Po co dalej uczyć i stosować testowanie hipotez (ze wszystkimi jego trudnymi pojęciami i które należą do najbardziej statystycznych grzechów) w przypadku problemów, w których istnieje estymator przedziałów (pewność, bootstrap, wiarygodność lub cokolwiek innego)? Jakie jest najlepsze wyjaśnienie (jeśli w ogóle) dla studentów? Tylko tradycja? Widoki będą bardzo mile widziane.

13
Jakie są przełomy w statystykach z ostatnich 15 lat?
Wciąż pamiętam dokument Annals of Statistics o Boostingu autorstwa Friedmana-Hastie-Tibshirani oraz komentarze innych autorów na ten temat (w tym Freunda i Schapire'a). W tamtym czasie wyraźnie wzmocnienie było postrzegane jako przełom pod wieloma względami: wykonalne obliczeniowo, metoda złożona, z doskonałym, ale tajemniczym wykonaniem. Mniej więcej w tym samym czasie SVM …




5
Jak dokładnie „model efektów losowych” w ekonometrii odnosi się do modeli mieszanych poza ekonometrią?
Kiedyś myślałem, że „model efektów losowych” w ekonometrii odpowiada „modelowi mieszanemu z przypadkowym przechwytywaniem” poza ekonometrią, ale teraz nie jestem pewien. Czy to? Ekonometria używa terminów takich jak „efekty stałe” i „efekty losowe” nieco inaczej niż w literaturze na temat modeli mieszanych, co powoduje notoryczne zamieszanie. Rozważmy prostą sytuację, w …

8
Jak symulować dane spełniające określone ograniczenia, takie jak posiadanie określonej średniej i odchylenia standardowego?
To pytanie jest motywowane moim pytaniem dotyczącym metaanalizy . Ale wyobrażam sobie, że przydałoby się to również w nauczaniu kontekstów, w których chcesz utworzyć zestaw danych, który dokładnie odzwierciedla istniejący opublikowany zestaw danych. Wiem, jak generować losowe dane z danej dystrybucji. Na przykład, jeśli przeczytam o wynikach badania, które: średnio …

2
Bardziej ostateczne omówienie wyboru zmiennych
tło Prowadzę badania kliniczne w medycynie i odbyłem kilka kursów statystycznych. Nigdy nie publikowałem pracy z wykorzystaniem regresji liniowej / logistycznej i chciałbym prawidłowo dokonywać wyboru zmiennych. Interpretowalność jest ważna, więc nie ma wymyślnych technik uczenia maszynowego. Podsumowałem moje rozumienie wyboru zmiennych - czy ktoś mógłby rzucić światło na jakieś …

2
Dlaczego skurcz działa?
W celu rozwiązania problemów związanych z wyborem modelu, szereg metod (LASSO, regresja kalenicy itp.) Zmniejszy współczynniki zmiennych predykcyjnych w kierunku zera. Szukam intuicyjnego wyjaśnienia, dlaczego poprawia to zdolność przewidywania. Jeśli prawdziwy efekt zmiennej był w rzeczywistości bardzo duży, dlaczego skurczenie parametru nie spowoduje gorszej prognozy?

10
Jakie są przykłady praktyk anachronicznych w statystyce?
Mam na myśli praktyki, które nadal utrzymują swoją obecność, mimo że problemy (zwykle obliczeniowe), z którymi zostały zaprojektowane, zostały w większości rozwiązane. Na przykład wymyślono korektę ciągłości Yatesa w celu przybliżenia dokładnego testu Fishera za pomocą testu , ale nie jest to już praktyczne, ponieważ oprogramowanie może teraz obsługiwać test …

1
Test Walda na regresję logistyczną
O ile rozumiem test Walda w kontekście regresji logistycznej służy do ustalenia, czy określona zmienna predykcyjna jest znacząca, czy nie. Odrzuca hipotezę zerową odpowiadającego współczynnikowi równego zero.XXX Test polega na podzieleniu wartości współczynnika przez błąd standardowy .σσ\sigma Mylę się, że jest również znany jako Z-score i wskazuje, jak prawdopodobne jest, …


Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.