Mam minimum, średnią i maksimum niektórych zbiorów danych, powiedzmy 10, 20 i 25. Czy istnieje sposób na:
utworzyć dystrybucję na podstawie tych danych oraz
Istnieje nieskończona liczba możliwych rozkładów, które byłyby zgodne z tymi wielkościami próbek.
wiedzieć, jaki procent populacji prawdopodobnie leży powyżej lub poniżej średniej
Przy braku pewnych prawdopodobnych nieuzasadnionych założeń, nie ogólnie - przynajmniej nie z dużym wyczuciem, że będzie to miało sens. Wyniki zależeć będą w dużej mierze od twoich założeń (same wartości nie zawierają zbyt wielu informacji, chociaż niektóre konkretne ustalenia dostarczają użytecznych informacji - patrz poniżej).
Nie jest trudno wymyślić sytuacje, w których odpowiedzi na pytanie proporcjonalne mogą być bardzo różne. Kiedy istnieją bardzo różne możliwe odpowiedzi zgodne z informacjami, skąd miałbyś wiedzieć, w jakiej jesteś sytuacji?
Więcej szczegółów może dać pomocne wskazówki, ale w obecnej postaci (nawet bez próby, choć prawdopodobnie wynosi co najmniej 2 lub 3, jeśli średnia nie znajduje się w połowie drogi między punktami końcowymi *), niekoniecznie będziesz miał dużą wartość w tym pytaniu . Możesz próbować uzyskać granice, ale w wielu przypadkach nie zawężą one zbyt wiele.
* w rzeczywistości, jeśli średnia jest zbliżona do jednego punktu końcowego, można uzyskać dolną granicę wielkości próby. Na przykład, jeśli zamiast 10,20,25 dla min / średniej / maksimum miałeś 10 24 25, to musiałoby wynosić co najmniej 15, i sugerowałoby to również, że większość populacji była powyżej 24; to jest coś. Ale jeśli powiedzmy 10,18,25, znacznie trudniej jest uzyskać użyteczne pojęcie o wielkości próbki, nie mówiąc już o proporcji poniżej średniej.n