Mam kilka wartości odstających w moich danych i chciałem je wykluczyć, aby zobaczyć, czy to zmieni wyniki. Twoim zdaniem, do jakiej maksymalnej liczby wartości odstających należy się ograniczyć?
Dzięki!
Mam kilka wartości odstających w moich danych i chciałem je wykluczyć, aby zobaczyć, czy to zmieni wyniki. Twoim zdaniem, do jakiej maksymalnej liczby wartości odstających należy się ograniczyć?
Dzięki!
Odpowiedzi:
Nie ma wartości maksymalnej ani minimalnej. Wartości odstające należy usunąć, jeśli są złymi danymi lub istnieją inne istotne powody ich usunięcia. Jeśli nie ma istotnych powodów, sugeruję stosowanie metod odpornych na wartości odstające. Nie usunęłbym wartości odstających tylko dlatego, że są nieco oddalone od innych punktów.
Chciałbym podkreślić coś, co zostało powiedziane w innej odpowiedzi i komentarzach (myślę, że odpowiedzi @Peter Flom są dokładne i że EdM ma rację, jeśli chodzi o pomiary).
Analizowanie danych należy wykonać ostrożnie. Musisz być bardzo świadomy znaczenia wartości odstających w swoim kontakcie. Na przykład, zakładając, że twoja procedura pomiaru została wykonana „poprawnie” (to znaczy, nie wprowadziłeś uprzedzeń, twój sprzęt został skalibrowany, osoba czytająca instrument zrobiła to poprawnie, itp.), Niektóre wartości odstające mogą powiedzieć coś interesującego i czasami bardzo ważne.
Oto wymyślony przykład, bądź pobłażliwy (zaznacz je w komentarzach), jeśli nie jest w 100% poprawny we wszystkich aspektach. ;)
Powiedz, że ktoś testuje efekt zastosowania pewnej ilości substancji w niektórych kulturach (populacjach) bakterii. Teraz „ogólnie” efektem jest ustabilizowanie liczby bakterii w populacji, ale istnieją różnice między poszczególnymi kulturami.
Wyobraź sobie, że wszystkie wartości odstające wskazują sytuacje, w których wszystkie bakterie są martwe. Lub że wszystkie wartości odstające reprezentują kultury, w których populacje bakterii wyrosły spod kontroli.
Chcę podkreślić, że natura twoich postrzeganych wartości odstających może mieć znaczenie, a konsekwencje każdego z nich są inne. Możesz znajdować się w sytuacji, gdy niedopuszczalne jest zwiększenie lub zmniejszenie liczby bakterii.
Oczywiście, jeśli zauważysz, że niektóre populacje zostały wymazane przez substancję, prawdopodobnie zbadałbyś tę sprawę, ponieważ jest to sytuacja łatwo rozpoznawalna. Ale nie wszystkie zjawiska są łatwe do wykrycia.
Podsumowując, pojęcie wartości odstających jest nieco arbitralne, ale ich znaczenie jest różnorodne i ma różne znaczenie. Mam nadzieję, że sprawi, że pomyślisz w tej sprawie ... :)