Mam szczerą nadzieję, że sformułowałem to pytanie w taki sposób, że można na nie ostatecznie odpowiedzieć - jeśli nie, proszę dać mi znać, a spróbuję ponownie! Powinienem też chyba zauważyć, że do tych analiz będę używać R.
Mam kilka środków, plant performance (Ys)
które, jak podejrzewam, były pod wpływem czterech zabiegów, które nałożyłem flower thinning (X1), fertilization (X2), leaf clipping (X3)
- i biased flower thinning (X4)
. Dla wszystkich możliwych Y, N wynosi co najmniej 242, więc moje próbki były duże. Wszystkie wykresy były albo przerzedzone, albo nie, ale każdy wykres został również poddany jednemu (i tylko jednemu) z pozostałych trzech zabiegów (lub nie - były również wykresy kontrolne). Ideą tego projektu było sprawdzenie, czy pozostałe trzy zabiegi były w stanie „maskować” lub „wzmacniać” efekty przerzedzania. Zatem z założenia trzy ostatnie zabiegi (X2-X4) nie mogły ze sobą współdziałać, ponieważ nie zostały skrzyżowane, ale każde z nich może oddziaływać z przerzedzaniem kwiatów - i prawdopodobnie tak jest.
Moje wyraźne hipotezy są następujące: 1) przerzedzenie kwitnienia będzie znaczące i 2) warunki interakcji X1*X2, X1*X3, and X1*X4,
między przerzedzeniem kwiatów a pozostałymi trzema zabiegami będą również znaczące. Oznacza to, że przerzedzanie kwiatów powinno mieć znaczenie, ale sposoby, w jakie to ma znaczenie, powinny zostać znacząco zmienione przez to, co zrobiły pozostałe trzy zabiegi.
Chciałbym zawrzeć wszystkie te informacje w modelu mieszanym:
Y ~ X0 + X1 + X2 + X3 + X4 + X1*X2 + X1*X3 + X1*X4 + (Up to three random effects)
Jest jednak jedno rozłączenie: mam dobry powód, by sądzić, że skutki przerzedzenia Y są nieliniowe. Są prawdopodobnie kwadratowe, ale w niektórych przypadkach nawet sześcienne. Wynika to z faktu, że wpływ przerzedzania na wydajność najprawdopodobniej wzrośnie szybciej przy wyższych poziomach przerzedzania. Jeśli spróbuję zamodelować tę nieliniową zależność za pomocą powyższego równania, dodając warunki kwadratowe i sześcienne dla X1, nie jestem pewien, jak modelować warunki interakcji - czy powinienem uwzględnić każdą możliwą kombinację X1, (X1) ^ 2 i (X1) ^ 3 * X2, X3 i X4? Ponieważ wydaje się, że to wiele parametrów, które próbuję oszacować, nawet przy liczbie punktów danych, które mam, i nie jestem pewien, jak interpretować otrzymane wyniki. To powiedziawszy, nie mam biologicznego powodu, aby sądzić, że byłby to nieroztropny sposób modelowania sytuacji.
Mam trzy przemyślenia na temat rozwiązania tego problemu:
- Najpierw dopasuj mniejszy model, np
Y ~ X1 + X1^2 + X^3 + Random effects
. Wyłącznie w celu ustalenia, czy związek między przerzedzeniem a Y jest liniowy, kwadratowy lub sześcienny, a następnie przekształć przerzedzenie za pomocą pierwiastka kwadratowego lub sześcianu, aby odpowiednio zlinearyzować związek. Stamtąd terminy interakcji można modelować jak powyżej za pomocą przekształconej zmiennej.- Załóż, że znaczące interakcje, jeśli wystąpią, wpływają tylko na jeden z terminów X1 (tj. Tylko liniowy, kwadratowy lub sześcienny) i odpowiednio modeluj interakcje. Nie jestem nawet pewien, czy to podejście ma sens.
- Po prostu dopasuj „pełny model” do każdego możliwego terminu interakcji między warunkami przerzedzania a innymi metodami leczenia, jak omówiono powyżej. Następnie wytnij nieistotne terminy interakcji i użyj wykresów i innych technik do interpretacji wyników.
Które z tych podejść, jeśli w ogóle, ma sens i dlaczego, biorąc pod uwagę, że jestem zainteresowany testowaniem hipotez, a nie wyborem modelu? W szczególności, jeśli powyższy punkt 1 nie ma sensu, dlaczego? Przeczytałem ten artykuł i ten artykuł i próbowałem przetrawić, co mogą dla mnie oznaczać, ale wszelkie źródła do dalszej lektury również byłyby mile widziane!