Jakie jest prawdopodobieństwo, że ta osoba jest kobietą?


32

Za zasłoną stoi osoba - nie wiem, czy jest to kobieta czy mężczyzna.

Wiem, że ta osoba ma długie włosy i że 90% wszystkich ludzi z długimi włosami to kobiety

Wiem, że ta osoba ma rzadką grupę krwi AX3 i że 80% wszystkich osób z tą grupą krwi to kobiety.

Jakie jest prawdopodobieństwo, że dana osoba jest kobietą?

UWAGA: ten oryginalny preparat został rozszerzony o dwa dalsze założenia: 1. Grupa krwi i długość włosów są niezależne 2. Stosunek mężczyzn do kobiet w populacji wynosi 50:50

(Konkretny scenariusz tutaj nie jest tak istotny - raczej mam pilny projekt, który wymaga ode mnie zastanowienia się nad właściwym podejściem do odpowiedzi na to pytanie. Mam wrażenie, że chodzi o proste prawdopodobieństwo, z prostą, ostateczną odpowiedzią, a raczej niż coś z wieloma dyskusyjnymi odpowiedziami według różnych teorii statystycznych).


1
Nie ma wielu teorii prawdopodobieństwa, ale notorycznie prawdą jest, że ludzie mają trudności z prawidłowym myśleniem o prawdopodobieństwach. (August DeMorgan, dobry matematyk, zrezygnował z badania prawdopodobieństwa ze względu na jego trudności). Nie patrz na debaty: szukaj odwołań do zasad prawdopodobieństwa (takich jak aksjomaty Kołmogorowa). Nie pozwól, aby rozwiązano to w sposób demokratyczny: twoje pytanie przyciąga wiele źle przemyślanych odpowiedzi, które, nawet jeśli niektóre z nich się zgadzają, są po prostu zbiorowo błędne. @Michael C daje dobre wskazówki; moja odpowiedź próbuje pokazać, dlaczego ma rację.
whuber

@ Whuber, jeśli zakłada się niezależność, czy zgadzasz się, że 0,97297 to poprawna odpowiedź? (Uważam, że bez tego założenia odpowiedź może wynosić od 0% do 100% - twoje diagramy to ładnie pokazują).
Prawdopodobnie

Niezależność od tego, co dokładnie? Sugerujesz, że fryzury dla kobiet i mężczyzn są takie same? Jak powiedziałeś w swoim pytaniu, ten konkretny scenariusz dotyczący płci / włosów / grupy krwi może nie być istotny: mówi mi, że starasz się zrozumieć, jak ogólnie rozwiązać takie problemy. Aby to zrobić, musisz wiedzieć, które założenia sugerują, które wnioski. Dlatego musisz bardzo uważnie skoncentrować się na założeniach, które chcesz poczynić, i dokładnie określić, na ile pozwalają ci dojść do wniosku.
whuber

3
Rodzaj niezależności do zbadania dotyczy połączenia wszystkich trzech cech. Na przykład, jeśli AX3 jest wskaźnikiem zespołu, który obejmuje łysienie u kobiet (ale nie u mężczyzn), to każda długowłosa osoba z AX3 jest koniecznie mężczyzną, co czyni prawdopodobieństwo bycia kobietą 0%, a nie 97,3%. Mam nadzieję, że czyni to oczywistym, że każdy, kto udzieli konkretnej odpowiedzi na to pytanie, musi przyjąć dodatkowe założenia, nawet jeśli nie wyrazi na to wyraźnej zgody. Naprawdę przydatne odpowiedzi, IMHO, byłyby tymi, które pokazują bezpośrednio, w jaki sposób różne założenia prowadzą do różnych wyników.
whuber

2
Brakuje Ci prawdopodobieństwa, że ​​kobieta nie ma długich włosów. To bardzo ważna miara.
Daniel R Hicks

Odpowiedzi:


35

Wiele osób uważa, że ​​pomocne jest myślenie w kategoriach „populacji”, podgrup w niej i proporcji (a nie prawdopodobieństw). To nadaje się do rozumowania wizualnego.

Szczegółowo wyjaśnię te liczby, ale intencją jest, aby szybkie porównanie tych dwóch liczb natychmiast i przekonująco wskazało, w jaki sposób i dlaczego nie można udzielić konkretnej odpowiedzi na pytanie. Nieco dłuższe badanie zasugeruje, jakie dodatkowe informacje byłyby przydatne do ustalenia odpowiedzi lub przynajmniej uzyskania granic odpowiedzi.

Schemat Venna

Legenda

Kreskowanie : samica / Solid background : male.

Góra : długowłosy / Dół : krótkowłosy.

Prawa (i kolorowa) : AX3 / Lewa (bezbarwna) : bez AX3.

Dane

Wylęg górny stanowi 90% górnego prostokąta („90% wszystkich osób o długich włosach to kobiety”).

Całkowite kreskowanie w prostokącie w odpowiednim kolorze wynosi 80% tego prostokąta („80% wszystkich osób z tą grupą krwi to kobiety”).

Wyjaśnienie

Ten schemat pokazuje schematycznie, w jaki sposób populację (wszystkich rozważanych kobiet i nie-kobiet) można jednocześnie podzielić na kobiety / kobiety, AX3 / inne niż AX3 i długie włosy / długie włosy („krótkie”). Wykorzystuje obszar, przynajmniej w przybliżeniu, do przedstawienia proporcji (jest trochę przesady, aby obraz był wyraźniejszy).

Oczywiste jest, że te trzy binarne klasyfikacje tworzą osiem możliwych grup. Każda grupa pojawia się tutaj.

Z podanych informacji wynika, że ​​górny zakreskowany prostokąt (kobiety o długich włosach) stanowi 90% górnego prostokąta (wszyscy ludzie o długich włosach). Stwierdzono również, że połączone kreskowane części kolorowych prostokątów (kobiety o długich włosach z AX3 i kobiety o krótkich włosach z AX3) stanowią 80% obszaru po prawej stronie (wszystkie osoby z AX3). Powiedziano nam, że ktoś leży w prawym górnym rogu (strzałka): długowłose osoby z AX3. Jaka część tego prostokąta jest kreskowana (żeńska)?

Przyjąłem również (domyślnie), że grupa krwi i długość włosów są niezależne : proporcja górnego prostokąta (długie włosy), który jest zabarwiony (AX3) równa się proporcji dolnego prostokąta (krótkie włosy), który jest zabarwiony (AX3). To właśnie oznacza niezależność. Jest to słuszne i naturalne założenie przy rozwiązywaniu takich pytań, ale oczywiście należy to stwierdzić.

Położenie górnego prostokąta w kształcie krzyża (kobiety o długich włosach) jest nieznane. Możemy sobie wyobrazić przesuwanie górnego kreskowanego prostokąta na boki i przesuwanie dolnego kreskowanego prostokąta na boki i ewentualnie zmianę jego szerokości. Jeśli zrobimy to, aby 80% kolorowego prostokąta pozostało kreskowanymi, taka zmiana nie zmieni żadnej z podanych informacji, ale może zmienić proporcję kobiet w prawym górnym prostokącie. Oczywiście proporcja może wynosić od 0% do 100% i nadal być zgodna z podanymi informacjami, jak na tym obrazku:

Rysunek 2


Jedną z zalet tej metody jest ustalenie istnienia wielu odpowiedzi na pytanie. Można to wszystko przetłumaczyć algebraicznie i, poprzez ustalenie prawdopodobieństw, podać konkretne sytuacje jako możliwe przykłady, ale wtedy powstałoby pytanie, czy takie przykłady są naprawdę zgodne z danymi. Na przykład, jeśli ktoś zasugeruje, że być może 50% długowłosych ludzi to AX3, na początku nie jest oczywiste, że jest to nawet możliwe, biorąc pod uwagę wszystkie dostępne informacje. Te (Venn) diagramy populacji i jej podgrup wyjaśniają takie rzeczy.


3
Whuber, zakładając, że grupa krwi i długość włosów są niezależne, to z pewnością część długowłosych kobiet z typem AX3 powinna być taka sama jak część krótkowłosych kobiet z AX3? Tzn. Nie masz elastyczności, aby przesuwać prostokąty tak, jak proponujesz ... Jeśli założymy, że mężczyźni i kobiety mają 50:50 w całej populacji, czy to nie daje nam wystarczających informacji, aby rozwiązać to pytanie jednym bezdyskusyjna odpowiedź?
Prawdopodobnie

@ whuber +1 bardzo miło.
Michael R. Chernick

5
ProbablyWrong, uważnie spojrzeć na pytanie w komentarzu: ponieważ zajmuje się kobietami , to jest dokonanie dodatkowego założenia o niezależności warunkowego na płeć. Założenie (bezwarunkowej) niezależności włosów i grupy krwi w ogóle nie wspomina o płci, więc aby zrozumieć, co to znaczy, usuń kreskowanie z figur. Mam nadzieję, że wskazuje to na to, dlaczego możemy elastycznie umieszczać kreskowanie w dowolnym miejscu w obrębie górnych i dolnych prostokątów.
whuber

1
@ whuber, podoba mi się to. Mam jednak 2 pytania / wyjaśnienia: 1. liczby wydają się przyjmować proporcje populacji dla długich i krótkich włosów (około 6: 4) i ~ AX3 vs AX3 (około 85:15), ale nie zostało to wspomniane w pierwotnym pytaniu ani nie omówione w wyjaśnieniach dotyczących liczb. Podejrzewam, że proporcje popu nie są istotne. Czy mam rację / czy możesz to wyjaśnić w wyjaśnieniach? 2. Myślę, że ta sytuacja ostatecznie działa w / z tym samym zjawiskiem, co Paradoks Simpsona , tylko inaczej ujęty w ramkę ( niejako odwrotnie ). Czy to uczciwa ocena?
gung - Przywróć Monikę

3
@gung, dziękuję za wyjaśnienia. Liczby oczywiście muszą przedstawiać pewne proporcje, aby w ogóle zadziałały, ale wszelkie proporcje nieokreślone w opisie problemu mogą się zmieniać. (Skonstruowałem tę liczbę, aby około 50% populacji wyglądało na kobiety, w oczekiwaniu na późniejszą edycję, w której to założono). Pomysł zastosowania tej graficznej reprezentacji do zrozumienia paradoksu Simpsona jest intrygujący; Myślę, że ma to sens.
whuber

13

Jest to kwestia prawdopodobieństwa warunkowego. Wiesz, że osoba ma długie włosy i grupę krwi Ax3. Niech A = { „Osoba ma długie włosy” } Więc szukasz P ( C | A i B ) . Wiesz, że P ( C | A ) = 0,9 i P ( C | B ) = 0,8 . Czy to wystarczy, aby obliczyć P ( C | A i B ) ? Załóżmy, że P ( A i B i C ) = 0,7

     A={'The person has long hair'}              B={'The person has blood type Ax3'}C={'The person is female'}.

P(C|A and B)P(C|A)=0.9P(C|B)=0.8
P(C|A and B)P(A and B and C)=0.7. Następnie Załóżmy, że P ( A i B ) = 0,8 . Następnie, według powyższego, P ( C | A i B ) = 0,875
P(C|A and B)=P(A and B and C)/P(A and B)=0.7/P(A and B).
P(A and B)=0.8P(C|A and B)=0.875. Z drugiej strony, jeśli , mielibyśmy wtedy P ( C | A i B ) = 0,78.P(A and B)=0.9P(C|A and B)

Teraz oba są możliwe, gdy i P ( C | B ) = 0,8 . Nie możemy więc powiedzieć na pewno, co to jest P ( C | A i B ) .P(C|A)=0.9P(C|B)=0.8P(C|A and B)


Cześć Michael, jeśli dobrze cię przeczytam, mówisz, że na postawione pytanie nie można odpowiedzieć, prawda? Lub inaczej mówiąc, potrzebujesz więcej informacji, aby odpowiedzieć na to pytanie? 1. Załóżmy, że rzadka grupa krwi w moim pierwotnym pytaniu nie ma żadnego wpływu na pragnienie czy zdolność osoby do długiego wzrostu włosów. Czy można teraz odpowiedzieć na pytanie? 2. Czy zgodziłbyś się, że odpowiedź musi być WIĘKSZA niż 0,9? (Ponieważ masz drugą niezależną informację - grupę krwi - która potwierdza hipotezę, że dana osoba jest kobietą)
Prawdopodobnie

2
Jeśli jest niezależny, to P ( A  i  B ) = P ( A ) P ( B ) i musisz określić, jaka część osób ma długie włosy, tj. P ( A ) i jaka część osób ma grupę krwi Ax3, tj. P ( B ) . Nie można też powiedzieć, że odpowiedź musi być większa niż 0,9, co odpowiada stwierdzeniu, że P ( C | A  i  B )P.(ZA i b)P.(ZA i b)=P.(ZA)P.(b)P.(ZA)P.(b) (Naprawdę nie rozumiem dlaczego). P.(do|ZA i b)>0,9
Néstor

2
@ProbablyWrong. Tak, problem, jak początkowo stwierdzono, nie ma wystarczających informacji, aby uzyskać unikalną odpowiedź.
Michael R. Chernick

@ Néstor, Micahael, nie zgadzam się, że musimy wiedzieć, jaka część osób ma długie włosy lub jaka część osób ma grupę krwi AX3. Myślę, że odpowiedź na pierwotne pytanie rozwiązuje się wyjątkowo, nie znając ich (zakładając, że A i B są niezależni, co wszyscy mamy, i zakładając, że znamy podział mężczyzn i kobiet w całej populacji - nie jest nieuzasadnione przypuszczenie, że to około 50:50 , Myślę).
Prawdopodobnie

7
Dlaczego Myślałem, że P ( C | A B ) = P ( C ( A B ) )
P.(do|ZA i b)=P.(ZA i b i do)×P.(ZA i b)??
przy użyciu definicji prawdopodobieństwa warunkowego.
P.(do|ZAb)=P.(do(ZAb))P.(ZAb)=P.(ZAbdo)P.(ZAb)
Dilip Sarwate

4

Fascynująca dyskusja! Zastanawiam się, czy określono również P (A) i P (B), czy też zakresy P (C | A, B) nie będą znacznie węższe niż pełny przedział [0,1], po prostu z powodu wielu ograniczeń mamy.

Trzymając się notacji wprowadzonej powyżej:

A = zdarzenie, że dana osoba ma długie włosy

B = zdarzenie, że dana osoba ma grupę krwi AX3

C = zdarzenie, że ta osoba jest kobietą

P (C | A) = 0,9

P (C | B) = 0,8

P (C) = 0,5 (tzn. Załóżmy jednakowy stosunek mężczyzn i kobiet w populacji ogółem)

nie wydaje się możliwe założenie, że zdarzenia A i B są warunkowo niezależne, biorąc pod uwagę C! Prowadzi to bezpośrednio do sprzeczności: jeśli P(AB|C)=P(A|C)P(B|C)=P(C|A)P(A)P(C)P(C|B)P(B)P(C)

następnie

P(C|AB)=P(AB|C)(P(C)P(AB))=P(C|A)P(A)P(C)P(C|B)P(B)P(C)(P(C)P(AB))

Jeśli teraz założymy, że A i B są również niezależne: większość terminów zostanie anulowana i otrzymamyP(AB)=P(A)P(B)

P(C|AB)=P(C|A)P(C|B)P(C)=0.90.80.5>1

P(C|AB)[0,1]P(A)P(B)P(A)P(B)

P(C|AB)

P(C|A)=0.9

P(C)=0.5

P(C|B)=0.8

4. (trywialny) Górnego prostokąta nie można przesunąć poza lewą granicę i nie należy go przesuwać poza jego minimalną zakładkę w lewo.

5. (trywialny) Dolny prostokąt nie może być przesuwany poza prawą granicę i nie powinien być przesuwany poza maksymalne zachodzenie na prawo.

P(C|AB)wprowadź opis zdjęcia tutaj

Przeszukanie zakresu możliwych wartości dla P (A) i P (B) ( skrypt R ) generuje ten wykres wprowadź opis zdjęcia tutaj

Podsumowując, możemy obniżyć granicę prawdopodobieństwa warunkowego P (c | A, B) dla danego P (A), P (B)


2
ZA,b,do

1
@whuber: dzięki za użyteczny komentarz! Mam nadzieję, że nowe zmiany sprawią, że będzie bardziej czytelny i przejrzysty.
Markus Loecher

@whuber i inni: Miałem nadzieję na wznowienie dyskusji, ale wątek wydaje się nieaktywny? Żadnych więcej komentarzy przez nikogo?
Markus Loecher,

1

Stawić hipotezę, że osobą za zasłoną jest kobieta.

Otrzymaliśmy 2 dowody, a mianowicie:

Dowód 1: Wiemy, że dana osoba ma długie włosy (i powiedziano nam, że 90% wszystkich osób z długimi włosami to kobiety)

Dowód 2: Wiemy, że osoba ma rzadką grupę krwi AX3 (i powiedziano nam, że 80% wszystkich osób z tą grupą krwi to kobiety)

Biorąc pod uwagę tylko Dowód 1, możemy stwierdzić, że osoba za zasłoną ma wartość prawdopodobieństwa bycia kobietą wynoszącą 0,9 (zakładając podział 50:50 między mężczyznami i kobietami).

Odnośnie pytania postawionego wcześniej w wątku, a mianowicie: „Czy zgodziłbyś się, że odpowiedź musi być WIĘKSZA niż 0,9?”, Bez robienia matematyki, powiedziałbym intuicyjnie, odpowiedź musi być „tak” (jest WIĘKSZA niż 0,9). Logika jest taka, że ​​Dowód 2 popiera dowody (ponownie, zakładając podział 50:50 na liczbę mężczyzn i kobiet na świecie). Gdyby powiedziano nam, że 50% wszystkich osób z krwią typu AX3 to kobiety, to Dowód 2 byłby neutralny i nie miałby żadnego wpływu. Ale ponieważ powiedziano nam, że 80% wszystkich osób z tą grupą krwi to kobiety, Dowód 2 popiera dowody i logicznie powinien zwiększyć ostateczne prawdopodobieństwo kobiety powyżej 0,9.

Aby obliczyć konkretne prawdopodobieństwo, możemy zastosować regułę Bayesa dla Dowodu 1, a następnie użyć aktualizacji Bayesa, aby zastosować Dowód 2 do nowej hipotezy.

Przypuszczać:

A = zdarzenie, że dana osoba ma długie włosy

B = zdarzenie, że dana osoba ma grupę krwi AX3

C = zdarzenie, że ta osoba jest kobietą (załóż 50%)

Zastosowanie reguły Bayesa do dowodów 1:

P (C | A) = (P (A | C) * P (C)) / P (A)

W tym przypadku ponownie, jeśli założymy podział 50:50 między mężczyznami i kobietami:

P (A) = (0,5 * 0,9) + (0,5 * 0,1) = 0,5

Zatem P (C | A) = (0,9 * 0,5) / 0,5 = 0,9 (nic dziwnego, ale byłoby inaczej, gdybyśmy nie mieli podziału 50:50 między mężczyznami i kobietami)

Korzystając z aktualizacji bayesowskiej w celu zastosowania dowodu 2 i podłączając 0,9 jako nowe wcześniejsze prawdopodobieństwo, mamy:

P (C | A AND B) = (P (B | C) * 0,9) / P (E)

Tutaj P (E) oznacza prawdopodobieństwo Dowodu 2, biorąc pod uwagę hipotezy, że dana osoba ma już 90% szans na bycie kobietą.

P (E) = (0,9 * 0,8) + (0,1 * 0,2) [jest to prawo całkowitego prawdopodobieństwa: (P (kobieta) * P (AX3 | kobieta) + P (mężczyzna) * P (AX3 | mężczyzna)] Tak , P (E) = 0,74

Zatem P (C | A i B) = (0,8 * 0,9) / 0,74 = 0,97297


1
W twojej odpowiedzi jest kilka stwierdzeń, które nie mają dla mnie sensu. (1) P (C | A) = 0,9 z założenia. Nigdzie nie powiedziano, że P (C) = 0,9. Przyjęliśmy, że P (C) = 0,5. (2) Jak uzyskałeś wynik dla P (E)? P (kobieta) = P (mężczyzna) = 0,5 przy założeniu, że piszesz P (kobieta) = 0,9.
Michael R. Chernick

Wartość P (C) przyjmuje się na 0,5, a tego właśnie użyłem. Wartość P (E) to prawdopodobieństwo Dowodu 2 po zastosowaniu Dowodu 1 (co prowadzi do nowych hipotez, że prawdopodobieństwo, że dana osoba jest kobietą, wynosi 0,9). P (E) = (prawdopodobieństwo, że dana osoba jest kobietą (biorąc pod uwagę Doświadczenie 1) * prawdopodobieństwo, że dana osoba ma AX3, jeśli kobieta) + (prawdopodobieństwo, że dana osoba jest mężczyzną (biorąc pod uwagę Doświadczenie 1) * prawdopodobieństwo, że dana osoba ma AX3 jeśli mężczyzna) = (0,9 * 0,8) + (0,1 * 0,2) = 0,74
RandomAnswer

Twoja definicja prawdopodobieństwa E jest nieco myląca, a terminy, których używasz do obliczenia, wyglądają inaczej niż te, które napisałeś wcześniej. To naprawdę nie ma znaczenia. Odpowiedź jest najwyraźniej poprawna w oparciu o ładnie przedstawioną odpowiedź Huu.
Michael R. Chernick

@Michael Tyle że wydaje się, że Huu popełnił błędy.
whuber

2
Ta odpowiedź jest po prostu błędna. Mogą występować inne błędy, ale ten jest rażący. Podajesz ostateczną odpowiedź na P („Ma długie włosy”) (twoje P (A)), a następnie używasz jej, aby dać ostateczną ostateczną odpowiedź. Po prostu nie ma wystarczających informacji, aby to ustalić, nawet przy założeniu, że P (F) = 0,5. Twoja linia do obliczenia P (A) wydaje się pochodzić znikąd. Oto poprawna formuła wykorzystująca teorię Bayesa: P (A) = P (A | F) P (F) / P (F | A), z którego, korzystając z podanych założeń, przejdź do P (A) = P (A | F) * 5/9. Jednak nadal nie znamy P (A | F), co może być czymkolwiek.
Bogdanovist

0

Przekształcenie i uogólnienie pytań

ZAbdo01ZjaZja(X|Y)XY(ZAza|bbdodoja)

  1. (ZAza1|bb1ja)=u1(ZAza2)|dodo2)ja)=u2)
  2. (ZAza1|bb1ja)=u1(ZAza2)|dodo2)ja)=u2)(bdo|ja)=(b|ja)(do|ja)
  3. (ZAza1|bb1ja)=u1(ZAza2)|dodo2)ja)=u2)(ZA0|ja)=12)
  4. (ZAza1|bb1ja)=u1(ZAza2)|dodo2)ja)=u2)(ZA0|ja)=12)(bdo|ja)=(b|ja)(do|ja)

ja

(bjotdok|ja)=(bjot|ja)(dok|ja),jot=0,1k=0,1

Odpowiedzi

Przypadek 1

(ZAbdo|ja)(ZAbdo|ja)

Wykazano za pomocą różnych ezoterycznych środków, że rozkład do przypisania, gdy informacja inaczej nie określa rozwiązania, jest tym, który ze wszystkich rozkładów zgodnych ze znanymi informacjami ma największą entropię. Każda inna dystrybucja sugeruje, że wiemy więcej niż znane informacje, co oczywiście jest sprzecznością.

-ja,jot,k(ZAjabjotdok|ja)ln(ZAjabjotdok|ja)
ja,jot,k(ZAjabjotdok|ja)=1
(ZAza1|bb1ja)=u1to znaczyk(ZAza1bb1dok|ja)ja,k(ZAjabb1dok|ja)=u1
(ZAza2)|dodo2)ja)=u2)to znaczyjot(ZAza2)bjotdodo2)|ja)ja,jot(ZAjabjotdodo2)|ja)=u2)

  1. ZA1
  2. b1
  3. do1

za=1b=1do=1za1=1b1=1za2)=1do2)=1u1=0,9u2)=0,8(ZA1|b1do1ja)0,932. Dlatego prawdopodobieństwo, że osoba za zasłoną jest kobietą, biorąc pod uwagę, że ma on długie włosy i grupę krwi AX3, wynosi 0,932.

Przypadek 2

bdo

(b0|dolja)=(b0|ja),l=0,1
ja(ZAjab0dol|ja)ja,jot(ZAjabjotdol|ja)=ja,k(ZAjab0dok|ja),l=0,1
(ZA1|b1do1ja)0,936

Przypadek 3

Teraz usuwamy warunek niezależności i zastępujemy go wcześniejszym warunkiem, że istnieje równa szansa, że ​​dana osoba jest mężczyzną lub kobietą:

(ZA0|ja)=12)to znaczyjot,k(ZA0bjotdok|ja)=12)
Tym razem (ZA1|b1do1ja)0,973, więc prawdopodobieństwo, że osoba za zasłoną jest kobietą, biorąc pod uwagę, że ma on długie włosy i grupę krwi AX3, wynosi 0,973.

Przypadek 4

Wreszcie ponownie wprowadzamy ograniczenia niezależności w przypadku 2 i znajdujemy to (ZA1|b1do1ja)0,989. Dlatego prawdopodobieństwo, że osoba za zasłoną jest kobietą, biorąc pod uwagę, że ma on długie włosy i grupę krwi AX3, wynosi 0,989.


-2

Wierzę teraz, że jeśli przyjmiemy proporcję mężczyzn i kobiet w całej populacji, istnieje jedna niepodważalna odpowiedź.

A = zdarzenie, że dana osoba ma długie włosy

B = zdarzenie, że dana osoba ma grupę krwi AX3

C = zdarzenie, że ta osoba jest kobietą

P (C | A) = 0,9

P (C | B) = 0,8

P (C) = 0,5 (tzn. Załóżmy jednakowy stosunek mężczyzn i kobiet w populacji ogółem)

Następnie P (C | A i B) = [P (C | A) x P (C | B) / P (C)] / [[P (C | A) x P (C | B) / P (C )] + [[1-P (C | A)] x [1-P (C | B)] / [1-P (C)]]]

w tym przypadku P (C | A i B) = 0,972973


P [C | A i B) = P (A i B i C) / P (A i B) = P (A i B i C) / [P (A | B) P (B)]. Jak dostałeś swoją formułę?
Michael R. Chernick

Prawdopodobnie istnieje sposób na dodanie warunków, aby uzyskać unikalną odpowiedź.
Michael R. Chernick

Aby dodać przez niezależność A i B, wzór upraszcza do P (A i B i C} / [P (A) P (B)] = P (B i C | A) / P (B).
Michael R. Chernick

2
Celem mojego pytania było naprawdę uzasadnienie formuły. Nie rozumiem, jak można by to uzyskać.
Michael R. Chernick

2
Nie, odpowiedź, która rzekomo zastosowała Regułę Bayesa, jest nieprawidłowa. Nie jestem pewien, dlaczego jesteś zdezorientowany, powyższa formuła MC jest poprawna i nie może być wykorzystana do uzyskania żadnego wyniku, oto wyjaśnienie odpowiedzi jego i Whubera na pytanie!
Bogdanovist

-2

Uwaga: Aby uzyskać ostateczną odpowiedź, poniższe odpowiedzi zakładają, że prawdopodobieństwo osoby, długowłosego mężczyzny i długowłosych kobiet mających AX3 jest w przybliżeniu takie samo. Jeśli wymagana jest większa dokładność, należy to zweryfikować.

Zaczynasz ze świadomością, że dana osoba ma długie włosy, więc w tym momencie szanse są następujące:

90:10

Uwaga: stosunek mężczyzn do kobiet w populacji ogólnej nie ma dla nas znaczenia, gdy dowiemy się, że dana osoba ma długie włosy. Na przykład, jeśli w populacji ogólnej będzie 1 kobieta na sto, losowo wybrana długowłosa osoba nadal będzie kobietą w 90% przypadków. Stosunek kobiet do mężczyzn NIE MA znaczenia! (szczegóły znajdziesz w aktualizacji poniżej)

Następnie dowiadujemy się, że dana osoba ma AX3. Ponieważ AX3 nie ma związku z długimi włosami, wiadomo, że stosunek mężczyzn do kobiet wynosi 50:50, a ponieważ zakładamy, że prawdopodobieństwa są takie same, możemy po prostu pomnożyć każdą stronę prawdopodobieństwa i znormalizować, aby suma boki prawdopodobieństwa wynoszą 100:

(90:10) * (80:20)
==> 7200:200

    Normalize by dividing each side by (7200+200)/100 = 74

==> 7200/74:200/74
==> 97.297.. : 2.702..

Zatem prawdopodobieństwo, że osoba za zasłoną jest kobietą, wynosi około 97,297%.

AKTUALIZACJA

Oto dalsze badanie problemu:

Definicje:

f - number of females
m - number of males
fl - number of females with long hair
ml - number of males with long hair
fx - number of females with AX3
mx - number of males with AX3
flx - number of females with long hair and AX3
mlx - number of males with long hair and AX3
pfl - probability that a female has long hair
pml - probability that a male has long hair
pfx - probability that a female has AX3
pmx - probability that a male has AX3

Po pierwsze, otrzymujemy, że 90% długowłosych ludzi to kobiety, a 80% osób z AX3 to kobiety, więc:

fl = 9 * ml
pfl = fl / f
pml = ml / m 
    = fl / (9 * m)

fx = 4 * mx
pfx = fx / f
pmx = mx / m 
    = fx / (4 * m)

Ponieważ przyjęliśmy, że prawdopodobieństwo wystąpienia AX3 jest niezależne od płci i długich włosów, nasze obliczone pfx będzie miało zastosowanie do kobiet o długich włosach, a pmx będzie miało zastosowanie do mężczyzn o długich włosach, aby znaleźć liczbę tych, którzy prawdopodobnie mają AX3:

flx = fl * pfx 
    = fl * (fx / f) 
    = (fl * fx) / f
mlx = ml * pmx 
    = (fl / 9) * (fx / (4 * m)) 
    = (fl * fx) / (36 * m)

Zatem prawdopodobny stosunek liczby kobiet o długich włosach i AX3 do liczby mężczyzn o długich włosach i AX3 wynosi:

flx             :   mlx
(fl * fx) / f   :   (fl * fx) / (36 * m)
1/f             :   1 / (36m)
36m             :   f

Ponieważ podano, że jest równa 50:50, możesz anulować obie strony i skończyć z 36 kobietami dla każdego mężczyzny. W przeciwnym razie dla każdego mężczyzny w określonej podgrupie przypada 36 * m / k kobiet. Na przykład, gdyby było dwa razy więcej kobiet niż mężczyzn, na każdego mężczyznę przypadałyby 72 kobiety z długimi włosami i AX3.


1
To rozwiązanie opiera się na założeniu, że problem jest dłuższy niż obecnie: mianowicie, że długie włosy, AX3 i płeć są niezależne. W przeciwnym razie nie możesz usprawiedliwić „stosowania” pfx u kobiet z długimi włosami itp.
whuber

@whuber: Tak, przyjmuję takie założenie. Czy jednak celem prawdopodobieństwa nie jest najlepsze przybliżenie na podstawie posiadanych danych? Zatem, skoro już wiesz, że długie włosy i AX3 są niezależne dla ogółu populacji, POWINNYś przekazać to założenie mężczyznom i kobietom, dopóki wyraźnie nie nauczysz się inaczej. To prawda, że ​​nie jest to poprawna metoda, ale jest najlepsza, jaką możesz zrobić, dopóki nie uzyskasz więcej informacji. P: Gdyby tylko na podstawie aktualnych danych, gdybyś miał dać szansę, że za kobietą kryła się kobieta, czy naprawdę powiedziałbyś „od 0 do 100%”?
Briguy37,

1
Mamy ważną różnicę w filozofii, @Briguy. Mocno wierzę w to, że nie przyjmę nieuzasadnionych założeń. Nie jest jasne, w jakim sensie założenie o wzajemnej niezależności jest „najlepsze”: przyznam, że może dotyczyć niektórych wniosków. Ale ogólnie wydaje mi się to niebezpieczne. Wolałbym jasno mówić o założeniach potrzebnych do rozwiązania problemu, aby ludzie mogli zdecydować, czy warto gromadzić dane w celu sprawdzenia tych założeń, zamiast zakładać rzeczy, które są matematycznie wygodne w celu uzyskania odpowiedzi. To jest różnica między statystykami a matematyką.
whuber

Aby odpowiedzieć na twoje pytanie: tak, 0% - 100% to dokładnie odpowiedź, którą bym dał. (Udzieliłem podobnych odpowiedzi na porównywalne pytania na tej stronie.) Zakres ten dokładnie odzwierciedla niepewność. Ta kwestia jest ściśle związana z paradoksem Ellsberga . Oryginalny artykuł Ellsberga jest dobrze napisany i jasny: polecam go.
whuber

@whuber: Dziękujemy za poświęcenie czasu na rozmowę ze mną. Widzę twój punkt widzenia na temat przemyślenia i spisania poczynionych założeń i odpowiednio zaktualizowałem moją odpowiedź. Jednak w odniesieniu do twojej odpowiedzi uważam, że jest ona niekompletna. Powodem tego jest to, że możesz wziąć pod uwagę wszystkie nieznane przypadki i znaleźć średnie prawdopodobieństwo wystąpienia wszystkich ostatecznych odpowiedzi. EG Chociaż oba są nadal możliwe, prawdopodobieństwo powyżej 50% jest znacznie bardziej rozpowszechnione niż prawdopodobieństwo poniżej 50% we wszystkich przypadkach, więc z pewnością lepiej zgadywać, że jest to kobieta.
Briguy37,

-4

98% Kobieta, prosta interpolacja. Pierwsza przesłanka 90% kobiet, pozostawia 10%, druga przesłanka pozostawia tylko 2% istniejących 10%, stąd 98% kobiet

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.