Czy możesz powiedzieć, że statystyki i prawdopodobieństwo są jak indukcja i dedukcja?

17

Przeczytałem ten wątek i wydaje mi się, że można powiedzieć, że:

statystyka = indukcja?
prawdopodobieństwo = odliczenie?

Ale zastanawiam się, czy może być więcej szczegółów na temat porównania, którego mi brakuje. Na przykład, czy statystyka jest równa indukcji, czy jest to tylko jej szczególny przypadek? Wydaje się, że prawdopodobieństwo jest subdeklaracją dedukcji (ponieważ jest sub-przypadkiem myślenia matematycznego).

Wiem, że to wybredne pytanie, ale w pewnym sensie dlatego zadaję to pytanie, ponieważ chcę mieć pewność, w jaki sposób można dokładnie porównać te warunki.

probability theory

— Tal Galili
źródło

Nie dlatego, że odpowiada na twoje pytanie, ale dlatego, że są ze sobą powiązane: stats.stackexchange.com/questions/665/... (Naprawdę podoba mi się odpowiedź Marka / Petera) i stats.stackexchange.com/questions/2641/...

— robin girard

15

Myślę, że najlepiej odpowiedzieć na pytanie rozumowania indukcyjnego i dedukcyjnego przed udzieleniem odpowiedzi na pytanie.

Wnioskowanie dedukcyjne: „Argumenty dedukcyjne to próby wykazania, że wniosek koniecznie wynika z zestawu przesłanek. Argument dedukcyjny jest ważny, jeśli wniosek wynika koniecznie z przesłanek, tj. Jeśli wniosek musi być prawdziwy, pod warunkiem że przesłanki są prawdziwe Argument dedukcyjny jest trafny, jeśli jest prawidłowy, a jego przesłanki są prawdziwe. Argumenty dedukcyjne są ważne lub nieważne, zdrowe lub nieuzasadnione, ale nigdy nie są fałszywe ani prawdziwe. ” ( cytat z wikipedii , wyróżnienie dodane).
„Rozumowanie indukcyjne, znane również jako indukcja lub logika indukcyjna lub wykształcone zgadywanie w potocznym języku angielskim, jest rodzajem rozumowania, które dopuszcza możliwość, że wniosek jest fałszywy, nawet jeśli wszystkie przesłanki są prawdziwe. Przesłanki indukcyjnego argumentu logicznego wskaż pewien stopień poparcia (prawdopodobieństwo indukcyjne) dla wniosku, ale nie pociągaj go za sobą; to znaczy, nie zapewniają jego prawdy. ”( z wikipedii , podkreślenie dodane)

Podkreślając główną różnicę: podczas gdy wnioskowanie dedukcyjne przenosi prawdę z przesłanek na wnioski, rozumowanie indukcyjne nie. To znaczy, podczas gdy dla wnioskowania dedukcyjnego nigdy nie poszerzasz swojej wiedzy (tj. Wszystko jest w pomieszczeniach, ale czasami jest ukryte i musi zostać wykazane za pomocą dowodów), rozumowanie indukcyjne pozwala poszerzyć swoją wiedzę (tj. Możesz uzyskać nowe spostrzeżenia, które nie są jeszcze zawarte w lokalu, jednak kosztem nieznajomości ich prawdy).

Jak to się ma do prawdopodobieństwa i statystyki?

Moim zdaniem prawdopodobieństwo jest z konieczności dedukcyjne. To gałąź matematyki. Opierając się na niektórych aksjomatach lub ideach (podobno prawdziwych), wywodzi teorie.

Jednak statystyki niekoniecznie są indukcyjne. Tylko jeśli spróbujesz użyć go do generowania wiedzy o nieobserwowanych bytach (tj. Do prowadzenia wnioskowania statystycznego, zobacz także odpowiedź onestop). Jeśli jednak użyjesz statystyk do opisania próby (tj. Statystyk deszyfrujących) lub jeśli próbkujesz całą populację, nadal jest to dedukcyjne, ponieważ nie otrzymujesz żadnej wiedzy ani informacji, ponieważ są one już obecne w próbie.

Jeśli więc uważasz, że statystyki są heroicznym przedsięwzięciem naukowców próbujących użyć metod matematycznych do znalezienia prawidłowości, które rządzą wzajemnym oddziaływaniem jednostek empirycznych na świecie, co w rzeczywistości nigdy się nie powiedzie (tj. Nigdy tak naprawdę nie dowiemy się, czy coś takiego naszych teorii jest prawdą), więc tak, to indukcja. Jest to także metoda naukowa, którą sformułował Francis Bacon, na której opiera się współczesna nauka empiryczna. Metoda prowadzi do wniosków indukcyjnych, które są co najwyżej wysoce prawdopodobne, choć nie pewne. To z kolei prowadzi do nieporozumień wśród nienaukowców na temat znaczenia teorii naukowej i dowodu naukowego.

Aktualizacja: Po przeczytaniu odpowiedzi Conjugate Prior (i po kilku nocnych myślach) chciałbym coś dodać. Myślę, że pytanie, czy (wnioskowanie) wnioskowania statystycznego ma charakter dedukcyjny czy indukcyjny, zależy od tego, czym dokładnie jesteś zainteresowany, tj. O jaki wniosek dążysz.

Jeśli interesują cię wnioski probabilistyczne, rozumowanie statystyczne jest dedukcyjne. Oznacza to, że jeśli chcesz wiedzieć, czy np. W 95 na 100 przypadków wartość populacji mieści się w określonym przedziale (tj. Przedziale ufności), możesz uzyskać wartość prawdy (prawda lub nieprawda) dla tego stwierdzenia. Można powiedzieć (jeśli założenia są prawdziwe), że w 95 na 100 przypadków wartość populacji mieści się w przedziale. Jednak w żadnym przypadku empirycznym nie będziesz wiedział, czy wartość populacji mieści się w uzyskanym CI. Tak czy inaczej, ale nie ma sposobu, aby się upewnić. To samo rozumowanie dotyczy prawdopodobieństw w klasycznej wartości p i statystyce bayesowskiej. Możesz być pewien prawdopodobieństwa.

Jeśli jednak jesteś zainteresowany wnioskami na temat jednostek empirycznych (np. Gdzie jest wartość populacji), możesz argumentować tylko indukcyjnie. Możesz użyć wszystkich dostępnych metod statystycznych, aby zgromadzić dowody potwierdzające niektóre twierdzenia dotyczące bytów empirycznych lub mechanizmów przyczynowych, z którymi one współdziałają. Ale nigdy nie będziesz pewny żadnej z tych propozycji.

Podsumowując: Chcę podkreślić, że ważne jest to, na co patrzysz. Prawdopodobieństwa, które możesz wydedukować, ale dla każdej określonej propozycji dotyczącej rzeczy możesz znaleźć tylko dowody na ich korzyść. Nie więcej. Zobacz także link onestop do problemu indukcyjnego.

— Henrik
źródło

Dziękuję Henrik - rozróżnienie między definicjami (i twoimi myślami na ich temat) było pomocne.

— Tal Galili

Twoja aktualizacja była jasna i do rzeczy. Gdybym mógł dać ci kolejny (+1), zrobiłbym to.

— Tal Galili

7

Statystyka jest dedukcyjnym podejściem do indukcji. Rozważ dwa główne podejścia do wnioskowania statystycznego: Frequentist i Bayesian.

Załóżmy, że jesteś częstym (w stylu Fishera, a nie Neymana dla wygody). Zastanawiasz się, czy parametr będący przedmiotem zainteresowania ma konkretną wartość, więc konstruujesz model, wybierasz statystyki dotyczące parametru i przeprowadzasz test. Wartość p wygenerowana przez twój test wskazuje na prawdopodobieństwo, że statystyki będą bardziej lub bardziej ekstremalne niż statystyki obliczone z próbki, którą masz, przy założeniu, że twój model jest poprawny. Otrzymujesz wystarczająco małą wartość p, więc odrzucasz hipotezę, że parametr przyjmuje tę wartość. Twoje rozumowanie jest dedukcyjne: przy założeniu, że model jest poprawny, albo parametr naprawdę przyjmuje wartość istotnego zainteresowania, ale twoje jest mało prawdopodobne, aby zobaczyć, lub w rzeczywistości nie bierze tej wartości.

Przechodząc od testu hipotez do przedziałów ufności: dla parametru masz 95% przedział ufności, który nie zawiera wartości istotnego zainteresowania. Twoje rozumowanie jest znów dedukcyjne: zakładając, że model jest poprawny, albo jest to jeden z tych rzadkich przedziałów, które pojawią się 1 na 20 razy, gdy parametr naprawdę ma wartość istotnego zainteresowania (ponieważ twoja próbka jest mało prawdopodobna), lub parametr w rzeczywistości nie ma tej wartości.

Załóżmy teraz, że jesteś Bayesianinem (w stylu Laplace'a zamiast Gelmana). Twoje założenia i obliczenia modelu dają (tylny) rozkład prawdopodobieństwa dla wartości parametru. Większość masy tego rozkładu jest daleka od wartości istotnego zainteresowania, więc wnioskujesz, że parametr prawdopodobnie nie ma tej wartości. Twoje rozumowanie jest znów dedukcyjne: zakładając, że twój model jest poprawny i jeśli poprzednia dystrybucja reprezentowała twoje przekonania na temat parametru, to twoje przekonania na temat tego w świetle danych są opisane przez twój rozkład późniejszy, co stawia bardzo małe prawdopodobieństwo tej wartości. Ponieważ ta dystrybucja oferuje niewielkie poparcie dla wartości merytorycznego zainteresowania, możesz dojść do wniosku, że parametr w rzeczywistości nie ma tej wartości. (Lub możesz być zadowolony z określenia prawdopodobieństwa).

We wszystkich trzech przypadkach uzyskuje się logiczne rozłączenie, które opiera się na działaniach, na których opiera się dedukcyjnie / matematycznie z założeń. Założenia te dotyczą zazwyczaj modelu generowania danych, ale mogą być również wcześniejszymi przekonaniami na temat innych wielkości.

— sprzężonyprior
źródło

1

Dziękuję Cp, robisz interesujący punkt. Chociaż z perspektywy powyższej odpowiedzi Henrika nadal znajdujesz się w dziedzinie indukcyjnej, ponieważ opisywane przez ciebie rozumowanie statystyczne wiąże się z niepewnością.

— Tal Galili

Proszę zobaczyć (mam nadzieję zrozumiałą) aktualizację mojej odpowiedzi, w której próbuję rozwiązać poruszony tutaj problem.

— Henrik

@Henrik To jest jaśniejsze (przynajmniej dla mnie). Troszeczkę: nie do końca jest tak, że „to samo rozumowanie dotyczy prawdopodobieństw w klasycznej wartości p i statystyce bayesowskiej”. Ten ostatni będzie daje pojedyncze prawdopodobieństw zdarzeń, np prawdopodobieństwo, że prawdziwe myśli to między jakąś wartość i inną wartość (choć Twoje inne zastrzeżenia wszystkim zastosowanie), podczas gdy „klasyczne” metody częstościowym takie jak przedziały ufności nie będzie nawet zrobić, że mimo kochana i powszechna nadzieja, że tak. Ich interpretacja jest rzeczywiście taka, jak ją opisujesz.

— conjugateprior

3

Tak! Może statystyki nie są ściśle równe indukcji, ale moim zdaniem statystyki stanowią rozwiązanie problemu indukcji .

— jeden przystanek
źródło