„Uwarunkowanie” to słowo z teorii prawdopodobieństwa: https://en.wikipedia.org/wiki/Conditional_probability
Uwarunkowanie na C oznacza, że patrzymy tylko na przypadki, w których C jest prawdziwe. „Niejawnie” oznacza, że możemy nie ujawniać tego ograniczenia wyraźnie, a czasem nawet nie zdawać sobie z tego sprawy.
Ten punkt oznacza, że gdy zarówno A, jak i B powodują C, obserwacja korelacji między A i B w przypadkach, w których C jest prawdziwe, nie oznacza, że istnieje prawdziwy związek między A i B. To po prostu uwarunkowanie na C (być może niechętnie), że tworzy sztuczną korelację.
Weźmy przykład.
W kraju istnieją dokładnie dwa rodzaje chorób, całkowicie niezależne. Zawołanie A: „osoba ma pierwszą chorobę”, B: „osoba ma drugą chorobę”. Załóżmy, że , .P ( B ) = 0,1P.( A ) = 0,1P.( B ) = 0,1
Teraz każda osoba, która ma jedną z tych chorób, idzie do lekarza i tylko wtedy. Zadzwoń do C: „osoba idzie do lekarza”. Mamy .do= A lub B
Teraz obliczmy kilka prawdopodobieństw:
- P.( C) = 0,19
- P.( A | C) = P( B | C) = 0,10,19≈ 0,53
- P.( A i B | C) = 0,010,19≈ 0,053
- P.( A | C) P( B | C) ≈ 0,28
Oczywiście, gdy uwarunkowane C, i są bardzo dalekie od niezależności. Właściwie uwarunkowane C, wydaje się „przyczyna” .ZAbn O tb
Jeśli korzystasz z listy osób, które zostały nagrane przez lekarza (y) jako źródło danych do analizy, to nie wydaje się być silna korelacja pomiędzy chorobami i . Być może nie zdajesz sobie sprawy z faktu, że twoje źródło danych jest tak naprawdę warunkiem. Jest to również nazywane „nastawieniem selekcyjnym”.ZAb