Jaka jest różnica między populacją a próbą? Jakie wspólne zmienne i statystyki są używane dla każdej z nich i jak się one ze sobą wiążą?
Jaka jest różnica między populacją a próbą? Jakie wspólne zmienne i statystyki są używane dla każdej z nich i jak się one ze sobą wiążą?
Odpowiedzi:
Populacja jest zbiorem badanych podmiotów. Na przykład średni wzrost mężczyzn. Jest to hipotetyczna populacja, ponieważ obejmuje wszystkich mężczyzn, którzy żyli, żyją i będą żyć w przyszłości. Podoba mi się ten przykład, ponieważ dowodzi, że my, analitycy, wybieramy populację, którą chcemy badać. Zazwyczaj niemożliwe jest zbadanie / zmierzenie całej populacji, ponieważ nie wszyscy członkowie są obserwowalni (np. Mężczyźni, którzy będą istnieć w przyszłości). Jeśli można wyliczyć całą populację, jest to często kosztowne i zajmuje dużo czasu. W powyższym przykładzie mamy populację „mężczyzn” i parametr będący przedmiotem zainteresowania, ich wzrost.
Zamiast tego możemy wziąć podzbiór tej populacji zwany próbką i użyć tej próbki do wyciągnięcia wniosków na temat badanej populacji, pod pewnymi warunkami. W ten sposób moglibyśmy zmierzyć średni wzrost mężczyzn w próbie populacji, którą nazywamy statystyką, i wykorzystać to do wyciągnięcia wniosków na temat parametru zainteresowania w populacji. Jest to wnioskowanie, ponieważ wystąpi niepewność i niedokładność związana z wyciąganiem wniosków na temat populacji na podstawie próby. To powinno być oczywiste - w naszej próbie jest mniej członków niż w naszej populacji, dlatego straciliśmy trochę informacji.
Istnieje wiele sposobów wyboru próbki, a badanie tego nazywa się teorią pobierania próbek. Powszechnie stosowana metoda nosi nazwę Simple Random Sampling (SRS). W SRS każdy członek populacji ma jednakowe prawdopodobieństwo włączenia do próby, stąd termin „losowy”. Istnieje wiele innych metod próbkowania, np. Próbkowanie warstwowe, próbkowanie skupiskowe itp., Które mają swoje zalety i wady.
Należy pamiętać, że próbka, którą pobieramy z populacji, jest tylko jedną z dużej liczby potencjalnych próbek. Jeśli dziesięciu badaczy studiuje tę samą populację, pobierając własne próbki, mogą uzyskać różne odpowiedzi. Wracając do naszego wcześniejszego przykładu, każdy z dziesięciu badaczy może zaproponować inną średnią wysokość mężczyzn, tj. Przedmiotowa statystyka (średnia wysokość) zmienia się od próbki do próbki - ma rozkład zwany rozkładem próbkowania. Możemy użyć tego rozkładu, aby zrozumieć niepewność w naszym oszacowaniu parametru populacji.
Rozkład próbkowania średniej próbki jest znany jako rozkład normalny ze odchyleniem standardowym równym odchyleniu standardowemu próbki podzielonemu przez wielkość próbki. Ponieważ można to łatwo pomylić ze standardowym odchyleniem próbki, powszechniejsze jest nazywanie standardowego odchylenia rozkładu próbkowania błędem standardowym .
Populacja to cały zestaw wartości lub osób, którymi jesteś zainteresowany. Próbka jest podzbiorem populacji i jest zbiorem wartości, których faktycznie używasz w swoich szacunkach.
Na przykład, jeśli chcesz poznać średnią wysokość mieszkańców Chin, to jest to twoja populacja, tj. Populacja Chin. Chodzi o to, że jest to dość duża liczba i nie byłoby możliwe uzyskanie danych dla wszystkich. Narysujesz więc próbkę, to znaczy otrzymujesz pewne obserwacje lub wysokość niektórych ludzi w Chinach (podgrupa populacji, próba) i na tej podstawie wyciągasz wnioski.
Populacja jest wszystkim w grupie badań. Na przykład, jeśli studiujesz cenę akcji Apple, są to historyczne, bieżące, a nawet wszystkie przyszłe ceny akcji. Lub, jeśli prowadzisz fabrykę jaj, są to wszystkie jaja wyprodukowane przez fabrykę.
Nie zawsze musisz próbkować i przeprowadzać testy statystyczne. Jeśli twoja populacja jest twoją najbliższą rodziną, nie musisz próbować, ponieważ populacja jest niewielka.
Pobieranie próbek jest popularne z różnych powodów:
Kiedy myślimy o „populacji”, zwykle myślimy o ludziach w naszym mieście, regionie, stanie lub kraju i ich odpowiednich cechach, takich jak płeć, wiek, stan cywilny, przynależność etniczna, religia i tak dalej. W statystyce termin „populacja” ma nieco inne znaczenie. „Populacja” w statystykach obejmuje wszystkich członków określonej grupy, nad którymi badamy lub zbieramy informacje w celu podjęcia decyzji opartych na danych.
Część populacji nazywa się próbką. Jest to część populacji, jej część, jej część i wszystkie jej cechy. Próbka to naukowo narysowana grupa, która w rzeczywistości ma te same cechy co populacja - jeśli jest losowana (może to być trudne do uwierzenia, ale to prawda!)
Losowo losowane próbki muszą mieć dwie cechy:
* Każda osoba ma równe szanse na wybór próbki; i,
* Wybór jednej osoby jest niezależny od wyboru innej osoby.
Wspaniałą cechą losowych próbek jest to, że możesz uogólniać na populację, którą jesteś zainteresowany. Jeśli więc spróbujesz 500 gospodarstw domowych w swojej społeczności, możesz uogólnić na 50 000 gospodarstw domowych, które tam mieszkają. Jeśli dopasujesz niektóre cechy demograficzne 500 z 50 000, zobaczysz, że są one zaskakująco podobne.
Populacja zawiera wszystkie elementy z zestawu danych. Próbka składa się z jednej lub więcej obserwacji z populacji. BOA, A. (2012, 17)