Mam dość skomplikowany zestaw danych do analizy i nie mogę znaleźć dla niego dobrego rozwiązania.
Oto rzecz:
1. surowe dane są zasadniczo nagraniami owadów. Każda piosenka składa się z kilku serii, a każda seria składa się z podjednostek. Wszystkie osoby były rejestrowane przez 5 minut. Liczba serii i ich pozycja w nagraniu mogą być bardzo różne dla poszczególnych osób, a także liczba podjednostek na serię.
2. Mam częstotliwość nośną (częstotliwość podstawową) każdej podjednostki i to właśnie chcę przeanalizować.
Moje problemy:
1. Częstotliwości w serii nie są oczywiście niezależne (chociaż jest dość stabilna, ale częstotliwość podjednostki n-1 będzie miała wpływ na podjednostkę n).
2. Serie również nie są niezależne w obrębie nagrania.
3. Są jeszcze mniej niezależne, gdy częstotliwość maleje z czasem (jednostka zmęczy się śpiewaniem, więc częstotliwość piosenki maleje). Upuszczanie wydaje się być liniowe.
4. Zagnieżdżanie = Mam 3 replikowane populacje dla dwóch lokalizacji A i B. Więc mam A1, A2, A3 i B1, B2, B3.
Co chciałbym zrobić:
1. Scharakteryzuj różnicę częstotliwości między moimi dwiema lokalizacjami (przetestuj to statystycznie)
2. Scharakteryzuj częstotliwość spadającą między dwiema lokalizacjami (zobacz, czy spada ona szybciej w jednej z nich)
Jak to zrobić:
Dlatego potrzebuję pomocy: nie wiem. Wygląda na to, że mój przypadek łączy problemy, których zwykle nie widać razem. Czytałem o mieszanych modelach, o GAM, o ARIMA, losowych i ustalonych efektach, ale nie mogę być naprawdę pewien najlepszego sposobu na zrobienie tego. Kiedy jednak to wykresuję (częstotliwość ~ liczba podjednostek n ), różnica między dwiema lokalizacjami jest bardzo wyraźna. Muszę również wziąć pod uwagę inne zmienne, takie jak temperatura (zwiększa częstotliwość) itp.
Myślałem o:
Zagnieżdżanie poszczególnych osób w replikacji, z której pochodzą, i zagnieżdżanie repliki w lokalizacji (osoba / replikacja / lokalizacja).
Użyj losowego efektu „wybuchu”, więc biorę pod uwagę zmienność w każdym wybuchu.
Użyj stałego efektu „pozycji zdjęć seryjnych podczas nagrywania”, aby zmierzyć spadek częstotliwości (mając nadzieję, że faktycznie jest liniowy).
Czy to byłoby poprawne?
Czy istnieje specjalny typ modelu, którego można użyć do tego rodzaju scenariusza?