To pytanie dotyczy oszacowania ograniczonego maksymalnego prawdopodobieństwa (REML) w określonej wersji modelu liniowego, a mianowicie:
gdzie jest macierzą ( ) sparametryzowaną przez , podobnie jak . jest nieznanym wektorem parametrów uciążliwych; interesuje nas oszacowanie , a mamy . Oszacowanie modelu według maksymalnego prawdopodobieństwa nie stanowi problemu, ale chcę użyć REML. Jest dobrze znane, patrz np. LaMotte , że prawdopodobieństwo , gdzie jest dowolną półprostokątną macierzą taką, że można zapisać
gdy jest pełną pozycją kolumny .
Moim problemem jest to, że dla niektórych całkowicie rozsądnych i interesujących naukowo macierz X ( α ) nie ma pełnej rangi kolumny. Wszystkie pochodne, które widziałem powyżej o ograniczonym prawdopodobieństwie, wykorzystują wyznaczniki równości, które nie mają zastosowania, gdy | X ′ X | = 0 , czyli zakładają pełną rangę kolumny X . Oznacza to, że powyższe ograniczone prawdopodobieństwo jest poprawne tylko dla mojego ustawienia na częściach przestrzeni parametrów, a zatem nie jest tym, co chcę zoptymalizować.
Pytanie: Czy istnieją bardziej ogólne ograniczone prawdopodobieństwa, wyprowadzone w literaturze statystycznej lub gdzie indziej, bez założenia, że będzie pełną pozycją kolumny? Jeśli tak, to jak wyglądają?
Niektóre spostrzeżenia:
- Wyprowadzenie części wykładniczej nie stanowi problemu dla żadnego i można je zapisać w kategoriach odwrotności Moore-Penrose'a jak powyżej
- Kolumny stanowią (dowolną) ortonormalną podstawę dla C ( X ) ⊥
- Dla znanego prawdopodobieństwo A ′ Y można łatwo zapisać dla każdego α , ale oczywiście liczba wektorów bazowych, tj. Kolumn, w A zależy od rangi kolumny X
Jeśli ktoś zainteresowany tym pytaniem uważa, że dokładna parametryzacja , daj mi znać, a ja je zanotuję. W tym momencie jednak najbardziej interesuje mnie REML dla ogólnego X prawidłowych wymiarów.
Bardziej szczegółowy opis modelu znajduje się tutaj. Niech będzie r- wymiarową autoregresją wektorową pierwszego rzędu [VAR (1)] gdzie v t i i d ∼ N ( . Załóżmy, że proces rozpoczyna się od pewnej stałej wartości y 0 w czasie t = 0 .
Zdefiniuj . Model można zapisać w postaci modelu liniowego Y = X β + ε przy użyciu następujących definicji i notacji:
gdzie oznacza T - wymiarowy wektor zer i e 1 , T pierwszą standardową podstawę wektorowych R T .
Oznacz . Zauważ, że jeśli A nie jest pełną rangą, X ( α ) nie jest pełną rangą kolumny. Obejmuje to na przykład przypadki, w których jeden ze składników y t nie zależy od przeszłości.
Pomysł oszacowania VAR przy użyciu REML jest dobrze znany, na przykład, w literaturze dotyczącej regresji predykcyjnej (patrz np. Phillips i Chen i odnośniki tam zawarte).
Warto wyjaśnić, że macierz nie jest macierzą projektową w zwykłym sensie, po prostu wypada z modelu i jeśli nie jest a priori wiedza na temat A , o ile mogę powiedzieć, nie ma sposobu na ponowną parametryzację ma być pełna ranga.
Na stronie mat.stackexchange zamieściłem pytanie, które jest z tym związane w tym sensie, że odpowiedź na pytanie matematyczne może pomóc w ustaleniu prawdopodobieństwa udzielenia odpowiedzi na to pytanie.