Jak wykryć, które z nich jest lepsze, gdy dają sprzeczne wyniki?


11

Tak często natrafiasz w prasie na różne badania, które prowadzą do przeciwnych wyników. Mogą być one związane z testowaniem nowego leku na receptę lub zasługi konkretnego składnika odżywczego lub czegokolwiek innego w tym zakresie.

Kiedy dwa takie badania prowadzą do sprzecznych wyników, jak możesz stwierdzić, które z nich jest najbliższe prawdzie?


Może to powinno być CW? Nie będzie jednoznacznej odpowiedzi na to pytanie i mogą pojawić się różne perspektywy i podejścia.
whuber

2
@ whuber Głosowałbym przeciwko CW, ponieważ nawet jeśli istnieją różne perspektywy, istnieje prawdopodobnie jedno najlepsze podejście. Jest to podobne do sposobu testowania tej samej hipotezy przy użyciu różnych ram / modeli, ale prawdopodobnie istnieje jedno najlepsze podejście.

@ Srikant: W każdym konkretnym przypadku mogę sobie wyobrazić, że możesz zebrać silną obronę na poparcie swojego twierdzenia. Zasadniczo jednak - jaka jest obecna sytuacja - najlepsza odpowiedź będzie zależeć od kontekstu. Jako prosty (i niekompletny) przykład rozważ różnice między oceną pary zaprojektowanych eksperymentów fizycznych (takich jak pomiar prędkości światła, gdzie historycznie większość przedziałów ufności nie dotarło do prawdy!) A badaniem obserwacyjnym w naukach społecznych .
whuber

@whuber Być może powinniśmy kontynuować tę rozmowę na meta. Przyznaję, że wciąż nie rozumiem, kiedy użyć CW, a kiedy nie, ale zająć się twoją tezą: najlepsza odpowiedź na to pytanie brzmiałaby wtedy, że odpowiedź zależy od kontekstu i wyjaśniam dlaczego za pomocą kilku przykładów. W każdym razie wydaje mi się, że to pytanie nie powinno być CW, ale nie jestem w stanie przedstawić żadnych innych powodów poza tymi, które przedstawiłem powyżej.

Odpowiedzi:


3

Myślę, że odpowiedź Jeromy'ego jest wystarczająca, jeśli analizujesz dwa badania eksperymentalne lub faktyczną metaanalizę. Ale często mamy do czynienia z badaniem dwóch badań nieeksperymentalnych i mamy za zadanie ocenić zasadność tych dwóch odmiennych wyników.

Jak sugeruje lista pytań sklepu spożywczego Cyrusa , sam temat nie nadaje się do krótkiej odpowiedzi, a całe książki mają na celu właśnie takie pytanie. Wszystkim zainteresowanym przeprowadzeniem badań danych nie eksperymentalnych zdecydowanie polecam lekturę

Eksperymentalne i quasi-eksperymentalne projekty uogólnionego wnioskowania przyczynowego Williama R. Shadisha, Thomasa D. Cooka, Donalda Thomasa Campbella (słyszałem również, że starsze wersje tego tekstu są równie dobre).

Kilka przedmiotów, o których wspominał Jeromy (większe rozmiary próbek i większy rygor metodologiczny), a wszystko, o czym wspomniał Cyrus, będzie uważane za coś, co Campbell i Cook nazywają „wewnętrzną ważnością”. Obejmują one aspekty projektu badań i metody statystyczne zastosowane do oceny związku między X i Y. W szczególności jako krytycy martwimy się aspektami, które mogą wpływać na wyniki i zmniejszać wiarygodność wyników. Ponieważ jest to forum poświęcone analizie statystycznej, wiele odpowiedzi koncentruje się wokół metod statystycznych, aby zapewnić obiektywne szacunki niezależnie od ocenianego związku. Ale są to inne aspekty projektu badawczego niezwiązane z analizą statystyczną, które zmniejszają wiarygodność wyników bez względu na to, jakie rygorystyczne długości ma się w ich analizie statystycznej (takie jak wzmianka Cyrusa o kilku aspektach wierności eksperymentu, które można rozwiązać, ale których nie można rozwiązać metody statystyczne, a jeśli wystąpią, zawsze będą obniżać ważność wyników badań). Istnieje wiele innych aspektów wewnętrznej ważności, które stają się kluczowe w ocenie przy porównywaniu wyników badań nieeksperymentalnych, które nie zostały tu wymienione, oraz aspekty projektów badawczych, które mogą odróżnić wiarygodność wyników. Nie wydaje mi się, aby zbyt szczegółowe było tu wchodzenie w szczegóły

Campbell i Cook odnoszą się również do „zewnętrznej ważności” badań. Ten aspekt projektowania badań ma często znacznie mniejszy zakres i nie zasługuje na tyle uwagi, co ważność wewnętrzna. Zewnętrzna ważność zasadniczo dotyczy uogólnienia wyników i powiedziałbym, że laicy często potrafią dość dobrze ocenić zewnętrzną ważność, o ile znają ten temat. Krótkie opowiadanie przeczytało książkę Shadisha, Cooka i Campbella.


8

Analiza meta literatura jest istotne pytanie. Za pomocą technik metaanalitycznych można wygenerować oszacowanie efektu zainteresowania zebrane w różnych badaniach. Takie techniki często badają wagę pod względem wielkości próby.

W kontekście metaanalizy badacze rozmawiają o modelach efektu stałego i modelu efektu losowego (patrz Hunter i Schmidt, 2002 ). Model ze stałym efektem zakłada, że ​​wszystkie badania oceniają ten sam efekt populacji. Model efektów losowych zakłada, że ​​badania różnią się szacowanym efektem populacyjnym. Model efektów losowych jest zazwyczaj bardziej odpowiedni.

W miarę gromadzenia się większej liczby badań dotyczących konkretnego związku, możliwe stają się bardziej wyrafinowane podejścia. Na przykład można kodować badania pod kątem różnych właściwości, takich jak postrzegana jakość, a następnie zbadać empirycznie, czy wielkość efektu różni się w zależności od tych cech badania. Poza jakością mogą istnieć pewne teoretycznie istotne różnice między badaniami, które łagodzą związek (np. Charakterystyka próbki, poziomy dawkowania itp.).

Ogólnie rzecz biorąc, ufam badaniom z:

  • większe rozmiary próbek
  • większy rygor metodologiczny
  • orientacja potwierdzająca (np. nie badanie, w którym badano korelacje między 100 różnymi składnikami odżywczymi a 50 wynikami zdrowotnymi)
  • brak konfliktu interesów (np. nie przez firmę z komercyjnym interesem w wykazaniu związku; nie przez badacza, który ma motywację do znalezienia znaczącego wyniku)

Ale to powiedziało, że musisz zachować losowe pobieranie próbek i teoretycznie znaczące różnice między badaniami, jako prawdopodobne wyjaśnienie sprzecznych wyników badań.


Szczególnie podoba mi się wskaźnik wiarygodności jako sposób agregowania dowodów w metaanalizie; jeśli masz wystarczające dane, aby obliczyć je dla każdego badania, po prostu obliczasz produkt dla różnych badań, aby przedstawić zagregowane dowody za / przeciw hipotezie.
Mike Lawrence

Skomentowałem (nie) znaczenie metaanalizy po odpowiedzi Cyrusa, ale głosowałem tę odpowiedź za wszystko inne, szczególnie za punktory.
whuber

@whuber @ Pytanie Gaetana zakłada, że ​​jedno badanie jest bliższe prawdy. Staram się zrobić krok wstecz i zlokalizować różnice w wynikach między badaniami w ramach metaanalitycznych, uznając możliwość, że badania mogą być tej samej jakości, ale że losowe pobieranie próbek lub istotne różnice mogą być wyjaśnieniem.
Jeromy Anglim

@ whuber Nawet przy dwóch badaniach możliwe byłoby stworzenie metaanalitycznej oceny efektu zainteresowania. Oczywiście przedział ufności oszacowania efektu może być duży. Należy się jednak spodziewać wysokiego stopnia niepewności, jeżeli przeprowadzono tylko dwa badania, które dają sprzeczne wyniki.
Jeromy Anglim

5

Nie zastanawiałbym się nad metaanalizą, dopóki nie przyjrzysz się źródłom, czy potencjalne uprzedzenia lub zmiany w populacjach docelowych. Jeśli są to badania efektów leczenia, czy leczenie przydzielono losowo? Czy były odstępstwa od protokołu? Czy była niezgodność? Czy brakuje danych o wynikach? Czy próbki zostały pobrane z tej samej ramki? Czy była odmowa uczestnictwa? Błędy implementacyjne? Czy błędy standardowe zostały poprawnie obliczone, uwzględniając klastrowanie i czy są zgodne z różnymi założeniami parametrycznymi? Myślę, że dopiero po udzieleniu odpowiedzi na te pytania problemy z metaanalizą zaczynają wchodzić w obraz. Musi być rzadkie, aby w przypadku jakichkolwiek dwóch badań metaanaliza była odpowiednia, chyba że jesteś skłonny poczynić jedno heroiczne założenia.


Ale czy te kroki nie są już częścią metaanalizy?
chl

3
@chl: To prawda, ale chodzi o to, że te kroki prowadzą do istoty pytania. Metaanaliza byłaby pomocna tylko wtedy, gdy istnieje wiele badań (nie tylko dwóch), a ich zalety zostały już dokładnie ocenione. Pytanie, które przed nami stoi, polega na tym, by przede wszystkim ocenić jakość badania lub pary sprzecznych badań. Cyrus wskazał na niektóre z wielu aspektów tego; rozsądne leczenie zwykle wymaga jednego lub dwóch semestrów studiów uniwersyteckich. W tym świetle myślę, że jego użycie terminu „heroiczny” jest nieco zaniżone!
whuber

1
@whuber Tak, zgadzam się z tobą i @Cyrus. Oczywiście ocena jakości i wiarygodności wcześniejszych badań jest obowiązkowym krokiem (i potrzeba czasu, aby przejrzeć każde badanie, szczególnie gdy musimy skontaktować się z autorami, ponieważ brakuje informacji w PC); Pomyślałem, że to część metaanalizy, a „część statystyczna” sprowadza się do przedstawienia ilościowego podsumowania wiarygodnych wyników.
chl
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.