Winsorizing danych oznacza zastąpienie ekstremalnych wartości zestawu danych pewną wartością percentyla z każdego końca, natomiast przycinanie lub obcinanie wymaga usunięcia tych ekstremalnych wartości. Zawsze widzę obie metody omawiane jako realną opcję zmniejszenia efektu wartości odstających podczas obliczania statystyk, takich jak średnia lub odchylenie standardowe, ale nie widziałem, dlaczego można wybrać …
W książce Modele statystyczne i metody dożywotnich danych napisano: Ocenzurowanie: Gdy obserwacja jest niekompletna z jakiejś przypadkowej przyczyny. Obcinanie: gdy niekompletny charakter obserwacji wynika z systematycznego procesu selekcji właściwego dla projektu badania. Co rozumie się przez „systematyczny proces selekcji nieodłączny od projektu badania” w definicji skrótu? Jaka jest różnica między …
Rozważmy NNN niezależnych próbek SSS otrzymano z losowej zmiennej XXX , który jest przyjmowany śledzić skróconą dystrybucji (np obcięty rozkład normalny ) znanego (Finite) minimalne i maksymalne wartości aaa i bbb , lecz z nieznanych parametrów μμ\mu i σ2σ2\sigma^2 . Jeśli XXX następnie non-obcięte rozkładzie estymatorów największej wiarygodności ľ i …
Tutaj „obcięcie” oznacza zmniejszenie precyzji liczb losowych i nie obcinanie serii liczb losowych. Na przykład, jeśli mam liczb rzeczywistych losowych (narysowanych z dowolnego rozkładu, np. Normalnego, jednolitego itp.) Z dowolną precyzją i obcinam wszystkie liczby, aby w końcu otrzymać zestaw liczb, z których każda zawiera dokładnie 2 cyfry po przecinku. …
W artykule badawczym na temat analizy wrażliwości modelu równania różniczkowego zwyczajnego układu dynamicznego autor podał rozkład parametru modelu jako Rozkład normalny (średnia = 1e-4, std = 3e-5) obcięty do zakresu [0,5e -4 1,5e-4]. Następnie wykorzystuje próbki z tego obciętego rozkładu do symulacji modelu. Co to znaczy mieć obcięty rozkład i …
to jest mój pierwszy post. Jestem naprawdę wdzięczny za tę społeczność. Usiłuję analizować dane zliczania wzdłużnego, które są obcinane przez zero (prawdopodobieństwo, że zmienna odpowiedzi = 0 wynosi 0), a średnia! = Wariancja, więc wybrano ujemny rozkład dwumianowy nad poissonem. Funkcje / polecenia, które wykluczyłem: R Funkcja gee () w …
Jak powinienem efektywnie próbkować z następującej dystrybucji? x∼B(α,β), x>kx∼B(α,β), x>k x \sim B(\alpha, \beta),\space x > k Jeśli kkk nie jest zbyt duże, próbowanie odrzucenia może być najlepszym podejściem, ale nie jestem pewien, jak postępować, gdy kkk jest duże. Być może istnieje jakieś asymptotyczne przybliżenie, które można zastosować?
Mam pytanie, jak dopasować problem cenzury do JAGS. Obserwuję normalną dwuwymiarową mieszaninę, w której wartości X mają błąd pomiaru. Chciałbym zamodelować prawdziwe podstawowe „średnie” zaobserwowanych wartości cenzurowanych. ⌈ xt r u e+ ϵ ⌉ = xo b s e r v e d ε ~ N( 0 , s d= …
Próbuję dopasować model czasu dyskretnego do R, ale nie jestem pewien, jak to zrobić. Czytałem, że możesz zorganizować zmienną zależną w różnych wierszach, po jednym dla każdej obserwacji czasu, i użyć glmfunkcji z łączem logit lub cloglog. W tym sensie, mam trzy kolumny: ID, Event(1 lub 0, w każdym okresie …
Chcę symulować z normalnej gęstości (powiedzmy średnią = 1, sd = 1), ale chcę tylko dodatnich wartości. Jednym ze sposobów jest symulacja z wartości normalnej i przyjęcie wartości bezwzględnej. Myślę o tym jak o złożonej normalności. Widzę w R, że istnieją funkcje do generowania skróconych zmiennych losowych. Jeśli wykonuję symulację …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.