Jaka jest różnica między statystykami opisowymi a wnioskującymi?


21

Rozumiałem, że statystyki opisowe opisują ilościowo cechy próbki danych, podczas gdy statystyki wnioskowania wnioskowały o populacjach, z których pobrano próbki.

Jednak strona Wikipedii do wnioskowania statystycznego stwierdza:

W większości wnioskowanie statystyczne tworzy propozycje dotyczące populacji, wykorzystując dane pochodzące z populacji, która jest przedmiotem zainteresowania, poprzez jakąś formę losowego próbkowania.

„W większości” sprawiło, że pomyślałem, że być może nie rozumiem właściwie tych pojęć. Czy istnieją przykłady wnioskowania statystycznego, które nie zawierają propozycji dotyczących populacji?


Statystyka opisowa: Moneta rzuciła dziesięć razy i sześć razy padła głową. Wnioskowanie statystyczne: Maksymalne oszacowanie prawdopodobieństwa prawdopodobieństwa głów wynosi lub, Ta informacja jest niewystarczająca, aby odrzucić hipotezę, że moneta jest monetą uczciwą. 0,6
Dilip Sarwate

2
Wnioskowanie bez pojęcia „populacja”: Załóżmy, że twoje dane są generowane przez jakiś (częściowo) nieznany losowy mechanizm / regułę. Metody wnioskowania pozwalają ocenić właściwości tego mechanizmu na podstawie danych. Przykład: Chcesz zweryfikować formułę elektrofizyczną na podstawie wyników, które można zmierzyć tylko w przybliżeniu lub w niedoskonałych warunkach.
Michael M

1
@Michael: Tak; a nawet sprawić, by Twoje dane były generowane przez znany mechanizm losowy - losowe przypisywanie eksperymentalnych zabiegów.
Scortchi - Przywróć Monikę

Odpowiedzi:


19

Pochodząc z nauk behawioralnych kojarzę tę terminologię szczególnie z podręcznikami statystyki wprowadzającej. W tym kontekście wyróżnia się to, że:

  • Statystyki opisowe to funkcje przykładowych danych, które są z natury interesujące w opisie niektórych cech danych. Klasyczne statystyki opisowe obejmują średnią, minimalną, maksymalną, odchylenie standardowe, medianę, pochylenie, kurtozę.
  • χ2)

Ważne jest to, że każda statystyka, wnioskowanie lub opis, jest funkcją danych przykładowych. Parametr jest funkcją populacji, przy czym termin „populacja” jest taki sam, jak wypowiadanie leżącego u podstaw procesu generowania danych.

Z tej perspektywy status danej funkcji danych jako statystyki opisowej lub wnioskowania zależy od celu, w jakim ją wykorzystujesz.

To powiedziawszy, niektóre statystyki są wyraźnie bardziej przydatne w opisywaniu istotnych cech danych, a niektóre dobrze nadają się do wnioskowania.

  • Statystyki wnioskowania: Standardowe statystyki testu, takie jak tiz , dla danego procesu generowania danych, gdzie hipoteza zerowa jest fałszywa, na wartość oczekiwaną silnie wpływa wielkość próby. Większość badaczy nie postrzegałaby takich statystyk jako szacowania parametru populacji o istotnym znaczeniu.
  • Statystyka opisowa : W przeciwieństwie do statystyki opisowej szacuje się parametry populacji, które są zwykle przedmiotem zainteresowania. Na przykład średnia próbki i odchylenie standardowe zapewniają szacunki równoważnych parametrów populacji. Nawet statystyki opisowe, takie jak minimum i maksimum, dostarczają informacji o równoważnych lub podobnych parametrach populacji, choć oczywiście w tym przypadku wymagana jest znacznie większa ostrożność. Ponadto wiele statystyk opisowych może być stronniczych lub w inny sposób mniejszych niż idealne estymatory. Nadal jednak mają one pewną użyteczność w szacowaniu interesującego parametru populacji.

Z tego punktu widzenia ważne jest, aby zrozumieć:

  • statystyka : funkcja danych przykładowych
  • parametr : funkcja populacji (proces generowania danych)
  • estymator : funkcja przykładowych danych wykorzystywana do oszacowania parametru
  • wnioskowanie : proces dochodzenia do wniosku dotyczącego parametru

W ten sposób możesz albo zdefiniować rozróżnienie między opisowym a wnioskowania na podstawie intencji badacza wykorzystującego statystyki, lub możesz zdefiniować statystyki w oparciu o to, jak jest zwykle używane.


Jak to jest uzasadnione, aby zadzwonić t lub F punktów (zamiast np t- testów ) wnioskowania statystycznego?
jona

@jona Wynik t jest „statystyką” stosowaną w teście t, dlatego można opisać wynik t jako statystyki wnioskowania, gdy jest stosowany jako część takiego wnioskowania. Wydaje mi się, że zacząłem od założenia, że ​​statystyka jest funkcją danych. Ale może nawiązujesz do tego, że często myślimy o wnioskach statystycznych jako o szerszym zestawie technik wykorzystywanych do wnioskowania?
Jeromy Anglim

Pozwólcie, że sformułuję to inaczej - czy statystyka t nie jest opisem próbki, a nie wnioskiem (takim jak wartość p)?
jona

Cóż, tak, funkcja danych jest równoważna opisowi próbki. Wydaje mi się, że myślałem, że takie statystyki są wykorzystywane w procesie wnioskowania (np. Badacze wiążą statystykę t z rozkładem t, aby uzyskać wartość p, a następnie odnoszą p do alfa, aby wyciągnąć wnioskowanie). Często widziałem, że podręczniki używają tych przykładów. Ale przypuszczam, że wartość p i sam wniosek binarny mogą być postrzegane jako statystyki (tj. Funkcje danych przykładowych). I samo wnioskowanie binarne może być postrzegane jako najbardziej wyraźnie dostosowane do wnioskowania. Czy o to ci chodzi?
Jeromy Anglim

1
Na przykład, używasz danych, aby dostać się do t, co jest związane z rozkładem, co daje ci p , co z kolei daje binarne wnioskowanie na temat parametru populacji. Tak więc z perspektywy częstokroć t, p i wnioskowanie binarne są zmiennymi losowymi. Wszyscy byli zaangażowani w proces wnioskowania. Nie jestem pewien, jakie są zalety i wady oznaczania wszystkich lub tylko niektórych takich statystyk jako wnioskowania.
Jeromy Anglim

8

Jedna forma wnioskowania opiera się na losowym przypisywaniu eksperymentalnych zabiegów, a nie na losowym pobieraniu próbek z populacji (nawet hipotetycznie). Oscar Kempthorne był zwolennikiem.

ZAbtt10/252=0,04

Prognozowanie to kolejny obszar, w którym niekoniecznie formułujesz zdania na temat populacji. (Nie wiem, czy wszyscy chcieliby nazwać przewidywanie „wnioskowanie”, ale istnieje Geisser (1993), Predictive Inference: An Introduction ). Często prognozy wynikają z dopasowanego modelu populacji, ale nie zawsze; np. przykład klasyfikacji @ Matta, uśrednianie modelu (bayesowskie lub oparte na wagach Akaike) lub algorytmy prognozowania, takie jak wygładzanie wykładnicze.

NB: Uważam, że „statystyki wnioskowania a statystyki opisowe” częściej odnoszą się do statystyki dyscypliny, niż do ilości obliczanych na podstawie próbek. Nie ma zasadniczej różnicy między wnioskową a opisową statystyką; jak zauważył @Jeremy, jest to kwestia tego, do czego go wykorzystasz.


2

Nie jestem pewien, czy klasyfikacja niekoniecznie zawiera stwierdzenie dotyczące populacji, z których czerpane są punkty danych. Klasyfikacja, jak zapewne wiesz, wykorzystuje dane szkoleniowe składające się z niektórych wektorów „cech”, z których każdy jest oznaczony określoną klasą, do przewidywania etykiet klas należących do innych nieoznakowanych wektorów cech. Na przykład możemy wykorzystać parametry życiowe pacjenta i diagnozę lekarza, aby przewidzieć, czy inni pacjenci są zdrowi czy chorzy.

P.(klasa=do|cechy)do

Jednak inni klasyfikatorzy szukają różnic między klasami bez modelowania samych klas; są to tak zwane klasyfikatory dyskryminujące. Klasycznym przykładem jest klasyfikator najbliższego sąsiada, który przypisuje nieznakowany przykład do klasy swojego najbliższego sąsiada (gdzie close jest zdefiniowane w rozsądny sposób dla problemu). Nie wydaje się, aby zawierało wiele, jeśli w ogóle, informacji o populacjach, z których zostały pobrane punkty danych.

t


0

W jednym wierszu, biorąc pod uwagę dane, statystyki opisowe starają się podsumować zawartość twoich danych przy minimalnej utracie informacji (w zależności od tego, jakiego środka używasz). Zobaczysz geografię danych (coś w tym stylu, zobacz wykres wydajności klasy i powiedz, kto jest na górze, na dole i tak dalej)

W jednym wierszu, biorąc pod uwagę dane, próbujesz oszacować i wnioskować o właściwościach hipotetycznej populacji, z której pochodzą dane. (Coś jak zrozumienie uczniów klas 7 poprzez dobrą próbkę z klasy, przy założeniu, że populacja podstawowa jest na tyle duża, że ​​nie można ich wziąć pod uwagę w całości)


3
Nie sądzę, że jest to definicja lub charakterystyka statystyk opisowych, których celem jest minimalna utrata informacji. Całkowicie możliwe jest posiadanie statystyk opisowych, które pomijają naprawdę ważne szczegóły i często stanowi to problem.
Nick Cox

0

W skrócie

Statystyka opisowa to analiza danych, które opisują, pokazują lub podsumowują dane w sposób znaczący; jest to po prostu sposób na opisanie naszych danych / rozmowy o całej populacji. niektóre z nich to miary tendencji centralnej i miary dyspersji

Statystyki wnioskowania to technika, która pozwala nam używać próbek do uogólnień na temat populacji, z których próbki zostały pobrane. Przykład testowania hipotez i


0

statystyki opisowe to analiza danych, które opisują, pokazują lub podsumowują dane w sposób znaczący; jest to po prostu sposób na opisanie naszych danych / rozmowy o całej populacji. niektóre z nich to miary tendencji centralnej i miary dyspersji

Statystyki wnioskowania to technika, która pozwala nam na wykorzystanie próbek w celu uogólnienia na temat populacji, z których pobrano próbki. Na przykład testowanie hipotez i dzielenie się tą poprawką


Witamy w Cross Validated ! Poświęć chwilę, aby zobaczyć naszą wycieczkę . Wygląda na to, że kończysz dobrą odpowiedź, ale coś się stało. zredaguj swoją odpowiedź, aby dokończyć myśl. Możesz również poprawić swoją odpowiedź, dodając cytaty / referencje, które współpracują z tym, co tu umieściłeś. Musisz także odpowiedzieć na pytanie „Czy istnieją przykłady wnioskowania statystycznego, które nie zawierają propozycji dotyczących populacji?”
Tavrock
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.