Analiza danych eksploracyjnych (EDA) często prowadzi do eksploracji innych „ścieżek”, które niekoniecznie należą do początkowego zestawu hipotez. Taką sytuację mam w przypadku badań z ograniczoną wielkością próby i dużą ilością danych zebranych za pomocą różnych kwestionariuszy (dane społeczno-demograficzne, skale neuropsychologiczne lub medyczne - np. Funkcjonowanie psychiczne lub fizyczne, poziom depresji / lęku, lista kontrolna objawów ). Zdarza się, że EDA pomaga uwypuklić niektóre nieoczekiwane relacje („nieoczekiwane”, co oznacza, że nie zostały uwzględnione w pierwotnym planie analizy), co przekłada się na dodatkowe pytania / hipotezy.
Podobnie jak w przypadku nadmiernego dopasowania, pogłębianie lub szpiegowanie danych prowadzi do wyników, które się nie generalizują. Jednak gdy dostępnych jest wiele danych, postulowanie ograniczonego zestawu hipotez jest dość trudne (dla badacza lub lekarza).
Chciałbym wiedzieć, czy istnieją dobrze znane metody, zalecenia lub praktyczne zasady, które mogą pomóc w określeniu EDA w przypadku badań na małej próbie.