Mediana jest wartością, poniżej której leży połowa danych lub rozkład prawdopodobieństwa - gdy wielkość próby jest nieparzysta, mediana jest wartością „środkową” uporządkowanej próbki.
Wiadomo, że mediana jest odporna na wartości odstające. Jeśli tak jest, kiedy i dlaczego mielibyśmy użyć tego środka w pierwszej kolejności? Jedną rzeczą, o której mogę pomyśleć, może być zrozumienie obecności wartości odstających, tj. Jeśli mediana jest daleka od średniej, wówczas rozkład jest wypaczony i być może dane muszą zostać …
Jeśli obliczę medianę wystarczająco dużej liczby obserwacji pochodzących z tego samego rozkładu, to czy centralne twierdzenie graniczne stwierdza, że rozkład median będzie zbliżony do rozkładu normalnego? Rozumiem, że dotyczy to dużej liczby próbek, ale czy dotyczy to również median? Jeśli nie, jaki jest podstawowy rozkład przykładowych median?
Szukam dobrego algorytmu (co oznacza minimalne obliczenia, minimalne wymagania dotyczące miejsca do przechowywania), aby oszacować medianę zestawu danych, który jest zbyt duży, aby go zapisać, tak aby każdą wartość można było odczytać tylko raz (chyba że jawnie zapiszesz tę wartość). Dane nie mają granic, które można założyć. Przybliżenia są w …
Jeśli spojrzysz na Wolfram Alpha Lub ta strona w Wikipedii Lista krajów według mediany wieku Wyraźnie mediana wydaje się być statystyką wyboru, jeśli chodzi o wiek. Nie jestem w stanie wyjaśnić sobie, dlaczego średnia arytmetyczna byłaby gorszą statystyką. Dlaczego tak jest Pierwotnie opublikowane tutaj, ponieważ nie wiedziałem, że ta strona …
Jeśli tak to co? Jeśli nie, dlaczego nie? W przypadku próbki w linii mediana minimalizuje całkowite odchylenie bezwzględne. Wydaje się naturalne, aby rozszerzyć definicję na R2 itp., Ale nigdy jej nie widziałem. Ale od dłuższego czasu jestem na lewym polu.
Na podstawowych kursach statystyki poniżej stopnia uczniowie (zwykle?) Uczą się testowania hipotez dla średniej populacji. Dlaczego skupia się na średniej, a nie na środkowej? Domyślam się, że łatwiej jest przetestować średnią ze względu na centralne twierdzenie graniczne, ale chciałbym przeczytać kilka wykształconych wyjaśnień.
Bardzo wypaczone rozkłady, takie jak log-normal, nie dają dokładnych przedziałów ufności ładowania. Oto przykład pokazujący, że lewy i prawy obszar ogona są dalekie od idealnego 0,025 bez względu na to, jaką metodę ładowania początkowego wypróbujesz w R: require(boot) n <- 25 B <- 1000 nsim <- 1000 set.seed(1) which <- …
Mój problem: randomizowane badanie równoległe w grupie z bardzo skośnym rozkładem pierwotnego wyniku. Nie chcę zakładać normalności i używać opartych na normach 95% CI (tj. Używając 1,96 X SE). Bez problemu wyrażam miarę tendencji centralnej jako mediany, ale moje pytanie brzmi: jak skonstruować 95% CI różnicy w medianach między dwiema …
Wiem, że jeśli mediana i średnia są w przybliżeniu równe, oznacza to rozkład symetryczny, ale w tym konkretnym przypadku nie jestem pewien. Średnia i mediana są dość bliskie (różnica tylko 0,487 m / galon), co doprowadziłoby mnie do stwierdzenia, że istnieje rozkład symetryczny, ale patrząc na wykres pudełkowy, wygląda na …
Sekcja 1.7.2 odkrywania statystyk za pomocą R autorstwa Andy Fieldsa i innych, wymieniając zalety średniej i mediany, stwierdza: ... średnia jest stabilna w różnych próbkach. Wyjaśnia to wiele zalet mediany, np ... Na medianę nie mają wpływu ekstremalne wyniki na obu końcach rozkładu ... Biorąc pod uwagę fakt, że na …
Muszę od razu wyjaśnić, że jestem praktykującym programistą, a nie statystykiem, a moja klasa statystyk z college'u była bardzo dawno temu… To powiedziawszy, chciałbym wiedzieć, czy istnieje metoda gromadzenia zestawu statystyk opisowych, które można by następnie wykorzystać do stworzenia wykresu pudełkowego, który nie pociąga za sobą przechowywania wielu pojedynczych próbek? …
Natknąłem się na uwagę w The Chemical Statistician, że mediana próbki może być często wyborem wystarczającej statystyki, ale poza oczywistym przypadkiem jednej lub dwóch obserwacji, w których jest równa średniej próbki, nie mogę wymyślić innej nietrywialnej i iid przypadek, w którym mediana próbki jest wystarczająca.
Po przeprowadzeniu analizy głównego składnika (PCA) chcę rzutować nowy wektor na przestrzeń PCA (tzn. Znaleźć jego współrzędne w układzie współrzędnych PCA). Mam obliczony PCA w języku R użyciu prcomp. Teraz powinienem być w stanie pomnożyć mój wektor przez macierz obrotu PCA. Czy główne elementy tej macierzy powinny być ułożone w …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.