Mam zestaw danych zdarzeń, które miały miejsce w tym samym okresie czasu. Każde zdarzenie ma typ (istnieje kilka różnych typów, mniej niż dziesięć) i lokalizację, reprezentowaną jako punkt 2D.
Chciałbym sprawdzić, czy istnieje jakaś korelacja między typami zdarzeń, czy też między typem a lokalizacją. Na przykład, może zdarzenia typu A zwykle nie występują tam, gdzie mają miejsce zdarzenia typu B. A może w niektórych obszarach występują głównie zdarzenia typu C.
Jakiego rodzaju narzędzi mogę tego użyć? Będąc nowicjuszem w analizie statystycznej, moim pierwszym pomysłem było użycie pewnego rodzaju PCA (Principal Component Analysis) w tym zestawie danych, aby sprawdzić, czy każde zdarzenie ma swój własny komponent, czy może niektóre mają takie same (tj. Są skorelowane)?
Muszę wspomnieć, że mój zestaw danych jest rzędu 500 000 punktów , przez co trudniej sobie z tym poradzić.
EDYCJA: Jak zauważono w odpowiedziach poniżej i komentarzach, sposobem jest modelowanie tego procesu jako oznaczonego punktu, a następnie użycie R do wykonania wszystkich ciężkich zadań, jak wyjaśniono szczegółowo w raporcie z warsztatów: http: / /www.csiro.edu.au/resources/Spatial-Point-Patterns-in-R.html