To pytanie dotyczy artykułu Różnicowa geometria zakrzywionych rodzin wykładniczych-krzywizny i utraty informacji autorstwa Amari.
Tekst wygląda następująco.
Niech będzie wymiarowym kolektorem rozkładów prawdopodobieństwa z układem współrzędnych , gdzie zakłada się ...n θ = ( θ 1 , … , θ n ) p θ ( x ) > 0
Możemy uznać każdy punkt o a przeprowadzania funkcji z ...S n log p θ ( x ) x
Niech będzie przestrzenią styczną w , która z grubsza jest utożsamiana z linearyzowaną wersją małego sąsiedztwa w . Niech będą naturalną podstawą powiązanego ze skoordynowanym układem ... S n θ θ S n e i ( θ ) , i = 1 , … , n T θ
Ponieważ każdy punkt z niesie funkcję z , naturalne jest, że w reprezentuje funkcjęS n log p θ ( x ) x e i ( θ ) θ e i ( θ ) = ∂
Nie rozumiem ostatniego stwierdzenia. Pojawia się to w sekcji 2 wyżej wymienionego artykułu. W jaki sposób podstawę przestrzeni stycznej określa powyższe równanie? Byłoby pomocne, gdyby ktoś w tej społeczności zaznajomiony z tego rodzaju materiałami mógł mi to pomóc. Dzięki.
Aktualizacja 1:
Chociaż zgadzam się, że (od @aginensky) jeśli są liniowo niezależni, to są również liniowo niezależne, to, w jaki sposób są one członkami przestrzeni stycznej, nie jest bardzo jasne. Jak więc można uznać za podstawę przestrzeni stycznej. Każda pomoc jest mile widziana.∂∂
Aktualizacja 2:
@aginensky: W swojej książce Amari mówi:
Rozważmy przypadek, w którym , zbiór wszystkich (ściśle) pozytywnych miar prawdopodobieństwa na , gdzie traktujemy jako podzbiór . W rzeczywistości jest otwartym podzbiorem przestrzeni afinicznej .X = { x 0 , … , x n } P ( X ) R X = { X | X : X → R } P ( X ) { X | ∑ x X ( x ) = 1 }
Następnie przestrzeń styczna z w każdym miejscu mogą być oczywiście określone liniowymi podprzestrzeń . Dla naturalnej podstawy układu współrzędnych , mamy .S n A 0 = { X | ∑ x X ( x ) = 0 } ∂ θ=(θ1,…,θn)(∂
Następnie weźmy kolejne osadzanie i zidentyfikujmy za pomocą podzbioru z . Wektor styczny jest następnie reprezentowany przez wynik działania na , które oznaczamy przez . W szczególności mamy . Oczywiste jest, że i że S n log S n : = { log p | p ∈ S n } R X X ∈ T p ( S n ) X p ↦ log p X ( e ) ( ∂X(e)=X(x)/p(x), T ( e ) P (Sn)={X(e)| X∈Tp(Sn)}={A∈RX| ∑xA(x)p(x
Moje pytanie: jeśli zarówno i są podstawą przestrzeni stycznej, to czy nie byłoby to sprzeczne z fakt, że i są różne i ?
Wydaje mi się, że istnieje związek między ( ) i . Jeśli możesz to wyjaśnić, byłoby to bardzo pomocne. Możesz dać to jako odpowiedź.