Jest to ogólnie pytanie, które nie jest specyficzne dla żadnej metody ani zestawu danych. Jak radzimy sobie z problemem nierównowagi klas w uczeniu maszynowym nadzorowanym, w którym liczba 0 wynosi około 90%, a liczba 1 wynosi około 10% w zbiorze danych. Jak optymalnie szkolimy klasyfikatora. Jednym ze sposobów, które stosuję, …
Na str. 34 ze swojego PRNN Brian Ripley komentuje, że „AIC został nazwany przez Akaike (1974) jako„ Kryterium informacyjne ”, chociaż wydaje się, że powszechnie uważa się, że A oznacza Akaike”. Rzeczywiście, wprowadzając statystyki AIC, Akaike (1974, s. 719) wyjaśnia to "IC stands for information criterion and A is added …
Pomijając rozważania dotyczące mocy obliczeniowej, czy istnieją jakiekolwiek powody, by sądzić, że zwiększenie liczby fałdów w walidacji krzyżowej prowadzi do lepszego wyboru / walidacji modelu (tj. Że im wyższa liczba fałdów, tym lepiej)? Mówiąc skrajnie, czy wykluczająca się krzyżowa walidacja niekoniecznie prowadzi do lepszych modeli niż krzyżowa walidacja -krotnie?KKK Podstawowe …
Przeczytałem tutaj wystarczająco dużo wątków na temat QQplots, aby zrozumieć, że QQplot może być bardziej pouczający niż inne testy normalności. Jednak nie mam doświadczenia w interpretacji QQplots. Dużo googlowałem; Znalazłem wiele wykresów nietypowych wykresów QQ, ale nie ma jasnych zasad ich interpretacji, poza tym, co wydaje się być porównaniem ze …
Zrobiłem to po wykonaniu testu normalności Shapiro-Wilka. Test wykazał, że populacja jest zwykle podzielona. Jak jednak zobaczyć to „zachowanie” na tej fabule? AKTUALIZACJA Prosty histogram danych: AKTUALIZACJA Test Shapiro-Wilka mówi:
Mój problem : Niedawno spotkałem statystykę, który poinformował mnie, że splajny są przydatne tylko do eksploracji danych i podlegają nadmiernemu dopasowaniu, a zatem nie są przydatne w przewidywaniu. Wolał odkrywać za pomocą prostych wielomianów ... Ponieważ jestem wielkim fanem splajnów, a to wbrew mojej intuicji, jestem zainteresowany ustaleniem, jak ważne …
Jeśli mam zestaw danych, który tworzy wykres, taki jak poniżej, w jaki sposób algorytmicznie określiłbym wartości x pokazanych pików (w tym przypadku trzech z nich):
Dzisiaj natknąłem się na nowy temat zatytułowany Oczekiwanie matematyczne. Książka, którą obserwuję, mówi: oczekiwanie jest średnią arytmetyczną zmiennej losowej pochodzącej z dowolnego rozkładu prawdopodobieństwa. Ale definiuje oczekiwanie jako sumę iloczynu niektórych danych i prawdopodobieństwa ich wystąpienia. Jak te dwie wartości (średnia i oczekiwanie) mogą być takie same? W jaki sposób …
Dopasowuję dwumianową rodzinę glm w R i mam całą grupę zmiennych objaśniających i muszę znaleźć najlepsze (R-kwadrat jako miara jest w porządku). Krótko po napisaniu skryptu do przechodzenia między losowymi różnymi kombinacjami zmiennych objaśniających, a następnie nagraniu, które działa najlepiej, naprawdę nie wiem, co robić. Wydaje się, że leapsfunkcja przeskakiwania …
Próbuję przyspieszyć w statystykach bayesowskich. Mam trochę tła statystyk (STAT 101), ale nie za dużo - myślę, że mogę zrozumieć wcześniejsze, późniejsze i prawdopodobieństwo: D. Nie chcę jeszcze czytać podręcznika bayesowskiego. Wolałbym czytać ze źródła (preferowana strona internetowa), który szybko mnie przyspieszy. Coś w tym stylu , ale ma więcej …
Planuję zacząć pisać paczki R. Pomyślałem, że dobrze byłoby przestudiować kod źródłowy istniejących pakietów, aby poznać konwencje budowy pakietów. Moje kryteria dobrych pakietów do nauki: Proste pomysły statystyczne / techniczne : Chodzi o poznanie mechaniki konstrukcji opakowań. Zrozumienie pakietu nie powinno wymagać szczegółowej wiedzy ściśle związanej z domeną na temat …
My, statystycy, używamy wielu słów w nieco inny sposób niż wszyscy inni. Powoduje to wiele problemów, gdy uczymy lub wyjaśniamy, co robimy. Rozpocznę listę (a teraz dodam kilka definicji, w komentarzach): Moc to zdolność do prawidłowego odrzucenia fałszywej hipotezy zerowej. Zwykle oznacza to prawidłowe powiedzenie „coś się dzieje”. Odchylenie - …
Mam dane dotyczące sprzedaży dla szeregu punktów sprzedaży i chcę je kategoryzować na podstawie kształtu ich krzywych w czasie. Dane wyglądają mniej więcej tak (ale oczywiście nie są losowe i brakuje niektórych danych): n.quarters <- 100 n.stores <- 20 if (exists("test.data")){ rm(test.data) } for (i in 1:n.stores){ interval <- runif(1, …
Wydaje się, że kiedy spełnione jest założenie jednorodności wariancji, wyniki skorygowanego testu t Welcha i standardowego testu t są w przybliżeniu takie same. Dlaczego po prostu nie zawsze używać dostosowanego t Welch?
Moje obecne rozumienie pojęcia „przedziału ufności z poziomem ufności ” jest to, że jeśli będziemy próbowali obliczyć przedział ufności wiele razy (za każdym razem świeżą próbkę), będzie ona zawierać poprawny parametr z czas.1 - α1−α1−α1 - \alpha1−α1−α1 - \alpha Chociaż zdaję sobie sprawę, że to nie to samo, co „prawdopodobieństwo, …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.