W swoim pytaniu stwierdzasz, że nie wiesz, czym są „przyczynowe sieci bayesowskie” i „testy tylnych drzwi”.
Załóżmy, że masz przyczynową sieć bayesowską. To jest ukierunkowany wykres acykliczny, którego węzły przedstawiają zdania, a których skierowane krawędzie reprezentują potencjalne związki przyczynowe. Możesz mieć wiele takich sieci dla każdej z twoich hipotez. Istnieją trzy sposoby na przekonywanie o sile lub istnieniu krawędzi A→?B .
Najłatwiejszym sposobem jest interwencja. To właśnie sugerują inne odpowiedzi, gdy mówią, że „właściwa randomizacja” naprawi problem. Losowo zmuszasz do różnych wartości i mierzysz BAB . Jeśli możesz to zrobić, jesteś skończony, ale nie zawsze możesz to zrobić. W twoim przykładzie może być nieetyczne traktowanie ludzi nieskutecznych metod leczenia śmiertelnych chorób lub mogą oni mieć pewne zdanie na temat leczenia, np. Mogą wybrać mniej surowe (leczenie B), gdy ich kamienie nerkowe są małe i mniej bolesne.
Drugi sposób to metoda drzwi wejściowych. Chcesz pokazać, że działa na B przez C , czyli A → C → B . Jeśli założymy, że C jest potencjalnie spowodowane przez A , ale nie ma innych przyczyn, a można mierzyć że C jest skorelowane z A i B jest skorelowana z C , to można stwierdzić, dowody muszą być płynący poprzez C . Oryginalny przykład: A to palenie, B to rak, CABCA→C→BCACABCCABCto akumulacja substancji smolistych. Smoła może pochodzić tylko z palenia i jest skorelowana zarówno z paleniem, jak i rakiem. Dlatego palenie powoduje raka poprzez smołę (choć mogą istnieć inne ścieżki przyczynowe, które łagodzą ten efekt).
Trzecim sposobem jest metoda tylnych drzwi. Chcesz pokazać, że i B nie są skorelowane z powodu „tylnymi drzwiami”, np wspólnej sprawy, czyli A ← D → B . Ponieważ założyliśmy model przyczynowy, to po prostu trzeba zablokować wszystkie ścieżki (obserwując zmienne i klimatyzacji na nich), że dowody mogą płynąć w górę od A i do B . Blokowanie tych ścieżek jest nieco trudne, ale Pearl podaje przejrzysty algorytm, który informuje, które zmienne należy obserwować, aby zablokować te ścieżki.ABA←D→BAB
Gung ma rację, że przy dobrej randomizacji pomieszanie nie będzie miało znaczenia. Ponieważ zakładamy, że interwencja w hipotetyczną przyczynę (leczenie) jest niedozwolona, jakakolwiek wspólna przyczyna między hipotetyczną przyczyną (leczenie) a skutkiem (przeżycie), taka jak wiek lub rozmiar kamienia nerkowego, będzie dezorientująca. Rozwiązaniem jest wykonanie odpowiednich pomiarów, aby zablokować wszystkie tylne drzwi. Więcej informacji można znaleźć w:
Pearl, Judea. „Diagramy przyczynowe dla badań empirycznych”. Biometrika 82,4 (1995): 669-688.
Aby zastosować to do twojego problemu, najpierw narysujmy wykres przyczynowy. (Leczeniem poprzedzających) Powierzchnia kamicy nerkowej i typu obróbki Y są zarówno przyczyny sukcesu Z . X może być przyczyną Y, jeśli inni lekarze przypisują leczenie na podstawie wielkości kamienia nerkowego. Oczywiście istnieją żadne inne związki przyczynowy pomiędzy X , Y i Z . Y pojawia się po X, więc nie może być jego przyczyną. Podobnie Z pochodzi od X i Y .XYZXYXYZYXZXY
Ponieważ jest częstą przyczyną, należy go zmierzyć. Do eksperymentatora należy określenie wszechświata zmiennych i potencjalnych związków przyczynowych . Dla każdego eksperymentu eksperymentator mierzy niezbędne „zmienne tylnych drzwi”, a następnie oblicza krańcowy rozkład prawdopodobieństwa sukcesu leczenia dla każdej konfiguracji zmiennych. W przypadku nowego pacjenta mierzysz zmienne i postępujesz zgodnie z kuracją wskazaną przez rozkład brzeżny. Jeśli nie możesz zmierzyć wszystkiego lub nie masz dużo danych, ale wiesz coś o architekturze relacji, możesz przeprowadzić „propagację przekonań” (wnioskowanie bayesowskie) w sieci.X