Pracowałem nad nową metodą analizy i analizy zestawów danych w celu identyfikacji i izolacji podgrup populacji bez uprzedniej wiedzy o cechach podgrup. Chociaż metoda działa wystarczająco dobrze ze sztucznymi próbkami danych (tj. Zestawami danych utworzonymi specjalnie w celu identyfikacji i segregacji podzbiorów populacji), chciałbym spróbować przetestować ją z danymi na żywo.
To, czego szukam, to swobodnie dostępne (tj. Niepoufne, niezastrzeżone) źródło danych. Korzystnie taki, który zawiera rozkłady bimodalne lub multimodalne lub oczywiście składa się z wielu podzbiorów, których nie można łatwo rozdzielić za pomocą tradycyjnych środków. Gdzie znajdę takie informacje?