Jak tytuł mówi, czy ktoś wie o dobrej, aktualnej książce, która ogólnie obejmuje wstępne przetwarzanie danych, a szczególnie techniki wykrywania wartości odstających? Książka nie musi skupiać się wyłącznie na tym, ale powinna wyczerpująco omawiać wyżej wymienione tematy - nie byłbym zadowolony z czegoś, co stanowi punkt wyjścia i cytuje listę …
Jakie są dobre zasoby online lub offline, które dają przegląd historii statystyk i główny przełom w statystyce do tej pory? Przeczytałem stronę o historii statystyki na Wikipedii .
Czy możesz polecić jakieś książki, artykuły, eseje, samouczki / kursy online itp., Które byłyby interesujące i użyteczne dla epidemiologa / biostatysty do poznania filozofii przyczynowości / wnioskowania przyczynowego? Wiem sporo na temat wnioskowania przyczynowego z frameworku epi i biostatów, ale chciałbym dowiedzieć się czegoś o filozofii, która leży u podstaw …
Przeczytałem kilka publikacji próbujących uzasadnić zastosowanie modelu efektów stałych z oświadczeniami w stylu „wybrano model efektów stałych, ponieważ heterogeniczność była niska”. Obawiam się jednak, że nadal może to być niewłaściwe podejście do analizy danych. Czy istnieją powody lub publikacje, które dyskutują, czy i dlaczego może to być błąd?
Twierdzenie Pitmana-Koopmana-Darmois mówi, że jeśli próbka iid ze sparametryzowanej rodziny rozkładów prawdopodobieństwa dopuszcza wystarczającą statystykę, której liczba składników skalarnych nie rośnie wraz z wielkością próbki, to jest to rodzina wykładnicza. Czy jakieś podręczniki lub zwykłe dokumenty ekspozycyjne dają dowody? Dlaczego nazywa się te trzy osoby?
W kilku odpowiedziach widziałem, jak użytkownicy CrossValidated sugerują OP znaleźć wczesne artykuły na temat Lasso, Ridge i Elastic Net. Dla potomnych, jakie są przełomowe prace na temat Lasso, Ridge i Elastic Net?
Jestem pracującym naukowcem danych z dużym doświadczeniem w regresji, innych algorytmach uczenia maszynowego i programowaniu (zarówno w zakresie analizy danych, jak i ogólnego opracowywania oprogramowania). Większość mojego życia zawodowego koncentruje się na budowaniu modeli w celu zapewnienia dokładności predykcyjnej (praca przy różnych ograniczeniach biznesowych) oraz budowaniu potoków danych w celu …
Czytam przykład podany w książce Machine Learning for Hackers . Najpierw rozwinę ten przykład, a następnie omówię moje pytanie. Przykład : Pobiera zestaw danych na 10 lat z 25 cenami akcji. Uruchamia PCA w cenie 25 akcji. Porównuje główny składnik z indeksem Dow Jones. Obserwuje bardzo silne podobieństwo między PC …
W przeszłości zadawano mi wiele pytań dotyczących opublikowanych artykułów w wielu obszarach, w których regresję (i powiązane modele, takie jak modele panelowe lub GLM) stosuje się na danych obserwacyjnych (tj. Danych niepochodzących z kontrolowanego eksperymentu , w wielu przypadkach - ale nie zawsze - danych obserwowanych w czasie), ale nie …
Jestem prawie pewien, że widziałem już następujący wynik w statystykach, ale nie pamiętam gdzie. Jeżeli jest dodatnią zmienną losową i E ( X ) < ∞ następnie ε F - 1 ( 1 - ε ) → 0 gdy ε → 0 + , gdzie M jest CDF X .XXXE …
Na przykład w podręczniku BUGS lub nadchodzącej książce Lee i Wagenmakers ( pdf ) oraz w wielu innych miejscach stosowany jest rodzaj zapisu, który wydaje mi się bardzo elastyczny, ponieważ można go użyć do zwięzłego opisu większości modeli statystycznych. Przykładem tego zapisu jest: yi∼Binomial(pi,ni)log(pi1−pi)=bibi∼Normal(μp,σp)yi∼Binomial(pi,ni)log(pi1−pi)=bibi∼Normal(μp,σp) y_i \sim \text{Binomial}(p_i,n_i) \\ \log(\frac{p_i}{1 - …
Interesuje mnie dobre odniesienie do wyników dotyczących właściwości asymptotycznych estymatorów maksymalnego prawdopodobieństwa. Rozważ model gdzie jest gęstością wymiarową, a to MLE oparty na próbce z gdzie jest „prawdziwą” wartością . Interesują mnie dwie nieprawidłowości.f n ( x | θ ) n θ n X 1 , ... , X N …
Przeprowadzam regresję logistyczną z wynikiem binarnym (start i start). Moja kombinacja predyktorów to zmienne ciągłe lub dychotomiczne. Stosując podejście Box-Tidwell, jeden z moich ciągłych predyktorów potencjalnie narusza założenie liniowości logit. Ze statystyk dotyczących dobroci dopasowania nie wynika, że dopasowanie jest problematyczne. Następnie ponownie uruchomiłem model regresji, zastępując pierwotną zmienną ciągłą: …
Dla prostego przykładu załóżmy, że istnieją dwa modele regresji liniowej 1 Model posiada trzy czynniki prognostyczne, x1a, x2b, ix2c Model 2 ma trzy predyktory z modelu 1 i dwa dodatkowe predyktory x2aorazx2b Istnieje równanie regresji populacji, w którym wyjaśniona wariancja populacji wynosi ρ2(1)ρ(1)2\rho^2_{(1)} dla Modelu 1 i ρ2(2)ρ(2)2\rho^2_{(2)} dla Modelu …
Studiuję ograniczoną maszynę Boltzmanna (RBM) i mam pewne problemy ze zrozumieniem obliczeń prawdopodobieństwa dziennika w odniesieniu do parametrów RBM. Mimo że opublikowano wiele prac naukowych na temat RBM, nie ma szczegółowych kroków na temat pochodnych. Po przeszukaniu online udało mi się je znaleźć w tym dokumencie: Fischer, A., i Igel, …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.