Muszę rozwiązać skomplikowany problem regresji na dysku jednostki. Oryginalne pytanie przyciągnęło kilka interesujących komentarzy, ale niestety nie otrzymano odpowiedzi. Tymczasem nauczyłem się czegoś więcej na temat tego problemu, dlatego spróbuję podzielić oryginalny problem na podproblemy i zobaczę, czy tym razem będę miał więcej szczęścia.
Mam 40 czujników temperatury regularnie rozmieszczonych w wąskim pierścieniu wewnątrz dysku urządzenia:
Czujniki te rejestrują temperaturę w czasie. Ponieważ jednak zmiana czasu jest znacznie mniejsza niż zmiana przestrzeni, uprośćmy problem, ignorując zmienność czasu i załóżmy, że każdy czujnik daje mi tylko średnią czasową. Oznacza to, że mam 40 próbek (po jednej dla każdego czujnika) i nie mam powtarzanych próbek.
Chciałbym zbudować powierzchnię regresji z danych czujnika. Regresja ma dwa cele:
- Muszę oszacować średni profil temperatury radialnej . Dzięki regresji liniowej już oszacowałem powierzchnię, która jest powierzchnią średniej temperatury, dlatego muszę tylko zintegrować moją powierzchnię względem , prawda? Jeśli używam wielomianów do regresji, ten krok powinien być bułką z masłem.
- Muszę oszacować profil temperatury radialnej , tak że w każdej pozycji promieniowej .
Biorąc pod uwagę te dwa cele, jakiej techniki powinienem użyć do regresji na dysku jednostki? Oczywiście procesy regresji Gaussa są powszechnie stosowane do regresji przestrzennej. Jednak definicja dobrego jądra dla dysku jednostki nie jest trywialna, dlatego chciałbym zachować prostotę i używać wielomianów, chyba że uważasz, że jest to strategia przegrana. Czytałem o wielomianach Zernike . Wielomiany Zernike wydają się być odpowiednie do regresji na dysku jednostki, ponieważ są one okresowe w .
Po wybraniu modelu muszę wybrać procedurę szacowania. Ponieważ jest to problem regresji przestrzennej, błędy w różnych lokalizacjach powinny być skorelowane. Zwykłe najmniejsze kwadraty zakładają nieskorelowane błędy, więc myślę, że Uogólnione najmniejsze kwadraty byłyby bardziej odpowiednie. GLS wydaje się stosunkowo powszechną techniką statystyczną, biorąc pod uwagę, że istnieje gls
funkcja w standardowym rozkładzie R. Jednak nigdy nie korzystałem z GLS i mam wątpliwości. Na przykład, jak oszacować macierz kowariancji? Sprawdzony przykład, nawet z kilkoma czujnikami, byłby świetny.
PS Zdecydowałem się na wielomiany Zernike i GLS, ponieważ wydaje mi się to logiczne. Jednak nie jestem ekspertem i jeśli uważasz, że idę w złym kierunku, możesz zastosować zupełnie inne podejście.