Z wykształcenia nie jestem statystykiem, jestem inżynierem oprogramowania. Jednak statystyki pojawiają się bardzo często. W rzeczywistości pytania dotyczące błędu typu I i typu II pojawiają się bardzo często w trakcie moich studiów do certyfikowanego stowarzyszenia Software Development Associate (matematyka i statystyka to 10% egzaminu). Zawsze mam problem z prawidłowymi definicjami …
Pracuję z dużą ilością szeregów czasowych. Te szeregi czasowe są w zasadzie pomiarami sieci przychodzącymi co 10 minut, a niektóre z nich są okresowe (tj. Przepustowość), a inne nie (tj. Wielkość ruchu routingu). Chciałbym prosty algorytm do przeprowadzania online „wykrywania wartości odstających”. Zasadniczo chcę zachować w pamięci (lub na dysku) …
Jeśli ponownie dopasowujemy się do blasku, możemy otrzymać ostrzeżenie, które mówi nam, że model ma trudności z konwergencją ... np. >Warning message: In checkConv(attr(opt, "derivs"), opt$par, ctrl = control$checkConv, : Model failed to converge with max|grad| = 0.00389462 (tol = 0.001) innym sposobem sprawdzenia zbieżności omówionym w tym wątku przez …
Dopasowanie regresji logistycznej za pomocą lme4 kończy się na Error in mer_finalize(ans) : Downdated X'X is not positive definite. Prawdopodobną przyczyną tego błędu jest najwyraźniej brak rangi. Co to jest niedobór rang i jak go rozwiązać?
Wiem, że k-średnie nie jest nadzorowane i jest używane do grupowania itp. I że k-NN jest nadzorowany. Ale chciałem poznać konkretne różnice między nimi?
Biorąc pod uwagę, że oprogramowanie potrafi obecnie tak łatwo obliczać dokładne testy Fishera , czy istnieją jakieś okoliczności, w których teoretycznie lub praktycznie lepiej jest wykonać test chi-kwadrat niż dokładny test Fishera? Zalety dokładnego testu Fishera obejmują: skalowanie do tabel nieprzewidzianych większych niż 2x2 (tj. dowolna tabela r x c …
Załóżmy, że mam zestaw przykładowych danych z nieznanego lub złożonego rozkładu i chcę przeprowadzić wnioskowanie na temat statystyki TTT danych. Domyślną nachylenia jest tylko generować kilka próbek bootstrap z wymianą i obliczyć moje statystyki TTT na każdej próbce bootstrap stworzyć szacunkowy podział dla TTT . Jakie są przykłady, w których …
Z grubsza i nieformalnie wiem, jaki jest przedział ufności. Wydaje mi się jednak, że nie mogę owinąć głowy jednym ważnym punktem: według Wikipedii: Przedział ufności nie przewiduje, że prawdziwa wartość parametru ma szczególne prawdopodobieństwo, że znajdzie się w przedziale ufności, biorąc pod uwagę faktycznie uzyskane dane. Widziałem również podobne uwagi …
Wiki omawia problemy, które powstają, gdy wielokoliniowość jest problemem regresji liniowej. Podstawowym problemem jest to, że wielokoliniowość powoduje niestabilne oszacowanie parametrów, co bardzo utrudnia ocenę wpływu zmiennych niezależnych na zmienne zależne. Rozumiem techniczne przyczyny problemów (może nie być w stanie odwrócić , źle warunkowane itp.), Ale szukam bardziej intuicyjnego (być …
Czy kiedykolwiek jest uzasadnione włączenie dwukierunkowej interakcji do modelu bez uwzględnienia głównych efektów? Co jeśli twoja hipoteza dotyczy tylko interakcji, czy nadal musisz uwzględnić główne efekty?
Lubię książkę G van Belle'a na temat statystycznych reguł kciuka oraz, w mniejszym stopniu, typowych błędów w statystyce (i jak ich uniknąć) autorstwa Phillipa I Gooda i Jamesa W. Hardina. Odnoszą się do typowych problemów podczas interpretacji wyników badań eksperymentalnych i obserwacyjnych oraz dostarczają praktycznych zaleceń dotyczących wnioskowania statystycznego lub …
Wszyscy wiemy, że mantra „korelacja nie implikuje związku przyczynowego”, która jest wniknięta we wszystkich studentów pierwszego roku statystyki. Istnieje kilka ciekawych przykładów tutaj ilustrujące ideę. Czasami jednak korelacja nie implikuje związku przyczynowego. Poniższy przykład pochodzi z tej strony Wikipedii Na przykład można przeprowadzić eksperyment na identycznych bliźniakach, o których wiadomo, …
Muszę zmieścić kilka modeli efektów mieszanych (zwłaszcza modele wzdłużny) używając lme4w Rale chciałby naprawdę opanować modeli i kod, który jedzie z nimi. Zanim jednak zanurzę się obiema stopami (i kupię książki), chcę mieć pewność, że uczę się odpowiedniej biblioteki. Przyzwyczaiłem lme4się do tej pory, ponieważ po prostu uważałem, że jest …
Wiadomo, że mediana jest odporna na wartości odstające. Jeśli tak jest, kiedy i dlaczego mielibyśmy użyć tego środka w pierwszej kolejności? Jedną rzeczą, o której mogę pomyśleć, może być zrozumienie obecności wartości odstających, tj. Jeśli mediana jest daleka od średniej, wówczas rozkład jest wypaczony i być może dane muszą zostać …
Jestem nowy w uczeniu maszynowym i starałem się dowiedzieć, jak zastosować sieć neuronową do prognozowania szeregów czasowych. Znalazłem zasoby związane z moim zapytaniem, ale nadal wydaje mi się, że jestem trochę zagubiony. Myślę, że podstawowe wyjaśnienie bez zbyt wielu szczegółów pomogłoby. Powiedzmy, że mam kilka cen na każdy miesiąc w …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.