Oto kontekst. Interesuje mnie określenie, w jaki sposób dwie zmienne środowiskowe (temperatura, poziomy składników odżywczych) wpływają na średnią wartość zmiennej odpowiedzi w okresie 11 lat. W ciągu każdego roku dostępne są dane z ponad 100 000 lokalizacji.
Celem jest ustalenie, czy w ciągu 11 lat średnia wartość zmiennych odpowiedzi zareagowała na zmiany zmiennych środowiskowych (np. Wyższa temperatura + więcej składników odżywczych = większa odpowiedź).
Niestety, ponieważ odpowiedź jest wartością średnią (bez patrzenia na średnią, tylko regularna zmienność międzyroczna spowoduje zalanie sygnału), regresja wyniesie 11 punktów danych (1 wartość średnia na rok), z 2 zmiennymi objaśniającymi. Dla mnie nawet liniową regresję dodatnią trudno będzie uznać za znaczącą, biorąc pod uwagę, że zestaw danych jest tak mały (nawet nie spełnia nominalnych 40 punktów / zmiennych, chyba że związek jest super silny).
Czy mam rację, aby przyjąć to założenie? Czy ktoś może zaoferować jakieś inne przemyślenia / perspektywy, które mogą mi brakować?
PS: Niektóre zastrzeżenia: Nie ma sposobu, aby uzyskać więcej danych bez czekania kolejnych lat. Dostępne dane są tym, z czym naprawdę musimy pracować.