Po co zgłaszać statystyki opisowe?


21

Właśnie przeprowadziłem analizę moich danych przy użyciu regresji logistycznej, ale w raporcie muszę też mieć opisową część dotyczącą statystyki. Naprawdę nie rozumiem w tym sensu i miałem nadzieję, że ktoś może wyjaśnić, dlaczego jest to konieczne.

Na przykład, jeśli wykreślę histogram jednej z moich niezależnych zmiennych ciągłych, która pokazuje normalność lub skośność, w jaki sposób doda to jakąkolwiek wartość do raportu?

Moje dane obejmują zmienną zależną prawda lub fałsz w znalezieniu pracy, a zmienną niezależną są oceny w połowie semestru, oceny z egzaminów końcowych oraz mężczyźni lub kobiety.


Jeśli nie widzisz żadnej wartości w wykreślaniu histogramu swoich IV, być może nie powinieneś tego robić, ale czy są jakieś zebrane dane, które Twoim zdaniem mają jakąś wartość dla pracy, którą prezentujesz raport?
Ian_Fin

Cześć Ian, dodałem więcej szczegółów dotyczących mojego problemu. Jestem dość nowy w statystyce i zastanawiałem się, czy istnieje ogólne podejście, które przyjmujemy przed przeprowadzeniem regresji logistycznej.
user3223190,

Sugeruję również przyjrzenie się i ewentualnie uwzględnienie różnych wykresów danych. Na przykład możesz wykreślić ocenę końcową w porównaniu do oceny śródokresowej, oznaczonej kolorem według płci i oznaczonej symbolami „dostałem pracę” i „nie udało się znaleźć pracy”.
Emil M. Friedman,

Odpowiedzi:


42

W mojej dziedzinie opisowa część raportu jest niezwykle ważna, ponieważ określa kontekst dla uogólnienia wyników. Na przykład badacz chce zidentyfikować predyktory urazowego uszkodzenia mózgu po wypadkach motocyklowych w próbce ze szpitala. Jej zmienna zależna jest binarna i miała szereg zmiennych niezależnych. Wielowymiarowa regresja logistyczna pozwoliła jej na następujące ustalenia:

  • bez korekty użycia kasku OR = 4,5 (95% CI 3,6, 5,5) w porównaniu do kasku.
  • wszystkie inne zmienne nie zostały uwzględnione w ostatecznym modelu.

Żeby było jasne, nie było problemów z modelowaniem. Koncentrujemy się na wartości, którą statystyki opisowe mogą dodać.

Bez statystyki opisowej czytelnik nie może spojrzeć na te ustalenia z perspektywy. Czemu? Pokażę ci statystyki opisowe:

age, years, mean (SD)                  54 (2)
males, freq (%)                       490 (98)
blood alcohol level, %, mean (SD)    0.10 (0.01)
...

Z powyższego widać, że jej próbka składała się ze starszych, odurzonych mężczyzn. Dzięki tym informacjom czytelnik może powiedzieć, co, jeśli w ogóle, te wyniki mogą powiedzieć o urazach u młodych mężczyzn lub urazach u nietrzeźwych jeźdźców lub kobiet.

Proszę nie ignorować statystyk opisowych.


5
Niezły przykład. Czy to jest prawdziwe czy zmyślone?
ameba mówi Przywróć Monikę

5
Dzięki, @amoeba. Liczby i statystyki są prawdziwe. Jednak zmieniłem temat na traumatyczne uszkodzenie mózgu, aby chronić niewinnych.

3
Więc pijani mężczyźni jadący na motocyklach bez kasków ... Kto by pomyślał, że możesz skończyć z traumatycznym uszkodzeniem mózgu?
Gung - Przywróć Monikę

Cieszę się szklanką ładnej australijskiej czerwieni, a Bob jest twoim wujem ...

25

Celem dostarczenia statystyk opisowych jest scharakteryzowanie próby, aby osoby w innych ośrodkach lub krajach mogły ocenić, czy wyniki uogólniają się w zależności od ich sytuacji. W twoim przypadku zestawienie płci, ocen itd. Byłoby korzystnym dodatkiem do regresji logistycznej. Nie ma to na celu umożliwienia sprawdzania twoich założeń, chociaż oni też mogą próbować to zrobić.

============== Edytuj, aby podać linki do niektórych wskazówek dotyczących zdrowia

W dziedzinie, którą znam, zdrowie, istnieją szczegółowe wytyczne dotyczące raportowania. Zostały one zebrane razem w sieci EQUATOR, z którą należy się zapoznać w celu uzyskania aktualnych szczegółów.

Jako przykład możemy wziąć próby kliniczne, w których odpowiednią wytyczną jest CONSORT. W dokumencie przedstawiającym wytyczne dostępne tutaj i gdzie indziej czytamy w Tabeli 1 zalecenie 15 „Tabela pokazująca podstawowe cechy demograficzne i kliniczne dla każdej grupy”.

Istnieją podobne zalecenia dla innych rodzajów badań.


Dziękuję, mdewey, więc kiedy robimy różne fabuły opisowe i jeśli zauważymy normalność lub skośność, po prostu komentujcie je. I tak w zasadzie statystyki opisowe służą tylko do informowania czytelnika o danych, z którymi pracujesz. Naprawdę przykro, jeśli może się to wydawać elementarne
użytkownik3223190,

Tak to działa w dziedzinie zdrowia, z którą jestem najbardziej zaznajomiony.
mdewey,

8
+1. Na początku błędnie odczytałem „w innych ośrodkach lub krajach” jako „w innych wiekach”.
ameba mówi Przywróć Monikę

4

Inną rzeczą jest pokazanie, jak dobrze zachowujesz się w zmiennych. Jeśli, na przykład, jedną z twoich zmiennych jest wynagrodzenie i przeprowadziłeś wywiad dokładnie z jednym miliarderem, to kiedy wprowadzisz jego wynagrodzenie do regresji logistycznej, dominuje nad wszystkim innym, więc prawdopodobnie nauczysz się ignorować wynagrodzenie, niezależnie od ile może zawierać rzeczywistych informacji.

Niektóre metody są bardziej wrażliwe niż inne na skośność i ekstremalne wartości, a regresja logistyczna jest raczej po stronie wrażliwej. Oczywiście ostateczny dowód znajduje się w puddingu i można porównać wyniki uzyskane z surowymi danymi lub z każdą cechą przekształconą w kierunku normalności.


1

Część opisowa pomaga zrozumieć czytelnikowi twój zestaw danych. W zastosowanym ekonie jest to zwykle wysoce zalecane, ponieważ może wykazać pierwsze potencjalne wady analizy.

Możesz użyć danych z różnych źródeł, aby wysunąć swoje opisy.

1 stół powinien wystarczyć. Ten, który załączyłeś, nie jest bardzo intuicyjny.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.