1) Przedstawione wydają się (pogrupowane) ciągłe dane narysowane jako wykres słupkowy.
Można dość bezpiecznie stwierdzić, że jest nie rozkładem Poissona.
Zmienna losowa Poissona przyjmuje wartości 0, 1, 2, ... i ma najwyższy pik przy 0 tylko wtedy, gdy średnia jest mniejsza niż 1. Jest używana do danych zliczania; jeśli narysujesz podobny wykres danych Poissona, może on wyglądać jak na poniższych wykresach:
Pierwszy to Poisson, który wykazuje podobną skośność do twojej. Widać, że jego średnia jest dość mała (około 0,6).
Drugi to Poissona, który oznacza podobny (w bardzo szorstkim przypuszczeniu) do twojego. Jak widać, wygląda całkiem symetrycznie.
Możesz mieć skośność lub dużą średnią, ale nie oba jednocześnie.
2) (i) Nie można ustawić normalnych danych dyskretnych -
Dzięki zgrupowanym danym, za pomocą dowolnej transformacji monotonicznej, przeniesiesz wszystkie wartości w grupie w to samo miejsce, więc najniższa grupa nadal będzie miała najwyższy szczyt - patrz wykres poniżej. W pierwszym wykresie przesuwamy pozycje wartości x, aby ściśle pasowały do normalnego cdf:
Na drugim wykresie widzimy funkcję prawdopodobieństwa po transformacji. Naprawdę nie możemy osiągnąć czegoś takiego jak normalność, ponieważ jest ona zarówno dyskretna, jak i pochylona; duży skok pierwszej grupy pozostanie dużym skokiem, bez względu na to, czy popchniesz go w lewo czy w prawo.
(ii) Ciągłe wypaczone dane mogą zostać przekształcone, aby wyglądać na względnie normalne. Jeśli masz surowe (niepogrupowane) wartości i nie są one zbyt dyskretne, możesz coś zrobić, ale nawet wtedy, gdy ludzie próbują przekształcić swoje dane, jest to albo niepotrzebne, albo ich podstawowy problem można rozwiązać w inny (ogólnie lepszy) sposób . Czasami transformacja jest dobrym wyborem, ale zwykle odbywa się z niezbyt dobrych powodów.
Więc ... dlaczego chcesz to przekształcić?