Jest tu kilka problemów.
Zazwyczaj chcemy ustalić minimalną wielkość próby, aby osiągnąć minimalnie akceptowalny poziom mocy statystycznej . Wymagana wielkość próby jest funkcją kilku czynników, przede wszystkim wielkości efektu, który chcesz odróżnić od 0 (lub jakiejkolwiek wartości zerowej, której używasz, ale 0 jest najczęściej), a także minimalnego prawdopodobieństwa złapania tego efektu chcę mieć. W tej perspektywie wielkość próbki jest określana na podstawie analizy mocy.
Innym aspektem jest stabilność twojego modelu (jak zauważa @cbeleites). Zasadniczo, ponieważ stosunek szacowanych parametrów do liczby danych zbliża się do 1, Twój model zostanie nasycony i koniecznie będzie nadmierny (chyba że w systemie nie ma przypadkowości). Z tej perspektywy wynika praktyczna zasada stosunku 1 do 10. Pamiętaj, że posiadanie odpowiedniej mocy na ogół zaspokoi tę troskę, ale nie odwrotnie.
Jednak reguła 1 do 10 pochodzi ze świata regresji liniowej i ważne jest, aby pamiętać, że regresja logistyczna ma dodatkowe złożoności. Jednym z problemów jest to, że regresja logistyczna działa najlepiej, gdy procent 1 i 0 wynosi około 50% / 50% (jak omawiają @andrea i @psj w powyższych komentarzach). Inną kwestią, którą należy się zająć, jest separacja . Oznacza to, że nie chcesz, aby wszystkie twoje 1 były zbierane na jednym skrajniku niezależnej zmiennej (lub pewnej ich kombinacji), a wszystkie zera na drugim biegunie. Chociaż wydaje się, że jest to dobra sytuacja, ponieważ ułatwiłoby to idealne przewidywanie, w rzeczywistości wysadza proces szacowania parametrów. (@Scortchi doskonale omawia tutaj sposób radzenia sobie z separacją w regresji logistycznej:Jak radzić sobie z idealną separacją w regresji logistycznej? ) Przy większej liczbie IV, staje się to bardziej prawdopodobne, nawet jeśli prawdziwe wielkości efektów są utrzymywane na stałym poziomie, a zwłaszcza, jeśli twoje odpowiedzi są niezrównoważone. Tak więc możesz łatwo potrzebować więcej niż 10 danych na IV.
Ostatnim problemem związanym z tą zasadą jest to, że zakłada ona, że twoje IV są ortogonalne . Jest to uzasadnione w przypadku zaprojektowanych eksperymentów, ale przy takich badaniach obserwacyjnych, jak twoje, twoje IV prawie nigdy nie będą w przybliżeniu ortogonalne. Istnieją strategie radzenia sobie z tą sytuacją (np. Łączenie lub upuszczanie kroplówki, najpierw przeprowadzanie analizy głównych składników itp.), Ale jeśli nie zostanie to rozwiązane (co jest powszechne), będziesz potrzebować więcej danych.
Rozsądnym pytaniem jest zatem, jakie powinno być twoje minimalne N i / lub czy Twoja próbka jest wystarczająca? Aby rozwiązać ten problem, sugeruję skorzystanie z metod omawianych przez @cbeleites; poleganie na zasadzie od 1 do 10 będzie niewystarczające.
1
„s”) i 90 nie-przypadków (0
„s”), wówczas reguła mówi „uwzględnij tylko 1 predyktor”. Ale co jeśli wymodeluję te0
zamiast tych1
, a następnie wezmę odwrotność oszacowanych ilorazów szans? Czy mogę dołączyć 9 predyktorów? To nie ma dla mnie sensu.