Jestem ciekawy natury . Czy ktoś może powiedzieć coś intuicyjnego na temat „Co mówi o danych?”
Edytować:
Dziękuję za odpowiedzi
Po wzięciu świetnych kursów chciałbym dodać kilka punktów:
- Jest to miara informacji, tj. to ilość informacji wzdłuż kierunku x .
- Dwoistość: Od jest dodatnio określona, więc jest Σ - 1 , więc one są normy dot-produktów, a dokładniej są podwójne normy siebie, więc możemy czerpać Fenchel Podwójny za uregulowana problemu najmniejszych kwadratów, a nie maksymalizację wrt podwójny problem. Możemy wybrać jeden z nich, w zależności od ich uwarunkowania.
- Przestrzeń Hilberta: Kolumny (i rzędy) i obejmują to samo miejsce. Zatem nie ma żadnej przewagi (innej niż gdy jedna z tych macierzy jest źle uwarunkowana) między reprezentacją za pomocą lub
- Statystyki częstokroć: Jest ściśle związane z informacjami Fishera, z wykorzystaniem powiązań Cramér – Rao. W rzeczywistości macierz informacji Fishera (zewnętrzny produkt gradientu prawdopodobieństwa logarytmu z samym sobą) jest związana przez Craméra – Rao, tj. (wrt dodatni półokreślony stożek, stężenie iewrt elipsoidy). Kiedy więc estymator maksymalnego prawdopodobieństwa jest skuteczny, tj. W danych istnieje maksymalna informacja, więc częstość reżimu optymistycznego jest optymalna. Mówiąc prościej, w przypadku niektórych funkcji prawdopodobieństwa (zauważ, że funkcjonalna forma prawdopodobieństwa zależy wyłącznie od modelu probablistycznego, który rzekomo wygenerował dane, czyli model generatywny), maksymalne prawdopodobieństwo jest wydajnym i spójnym estymatorem, rządzącym jak szef. (przepraszam za przekroczenie tego)