Statystyki i duże zbiory danych svd

2

Dlaczego nie mogę uzyskać prawidłowego SVD X za pomocą rozkładu wartości własnych XX 'i X'X?

Próbuję wykonać SVD ręcznie: m<-matrix(c(1,0,1,2,1,1,1,0,0),byrow=TRUE,nrow=3) U=eigen(m%*%t(m))$vector V=eigen(t(m)%*%m)$vector D=sqrt(diag(eigen(m%*%t(m))$values)) U1=svd(m)$u V1=svd(m)$v D1=diag(svd(m)$d) U1%*%D1%*%t(V1) U%*%D%*%t(V) Ale ostatnia linia nie mwraca. Dlaczego? Wydaje się, że ma to coś wspólnego z oznakami tych wektorów własnych ... Czy też źle zrozumiałem procedurę?

9 r svd eigenvalues

1

Zrozumienie dekompozycji pojedynczej wartości w kontekście LSI

Moje pytanie dotyczy generalnie pojedynczej dekompozycji wartości (SVD), a zwłaszcza Latent Semantic Indexing (LSI). Powiedzmy, że mam który zawiera częstotliwości 5 słów dla 7 dokumentów.ZAw O r d× do c u m e n tAword×document A_{word \times document} A = matrix(data=c(2,0,8,6,0,3,1, 1,6,0,1,7,0,1, 5,0,7,4,0,5,6, 7,0,8,5,0,8,5, 0,10,0,0,7,0,0), ncol=7, byrow=TRUE) rownames(A) <- c('doctor','car','nurse','hospital','wheel') …

9 r svd natural-language latent-semantic-indexing

1

Parellel między LSA i pLSA

W oryginalnej pracy pLSA autor, Thomas Hoffman, rysuje paralelę między strukturami danych pLSA i LSA, o których chciałbym z tobą porozmawiać. Tło: Czerpiąc inspirację z wyszukiwania informacji, załóżmy, że mamy kolekcję NNN dokumenty D={d1,d2,....,dN}D={d1,d2,....,dN}D = \lbrace d_1, d_2, ...., d_N \rbrace i słownictwo MMM warunki Ω={ω1,ω2,...,ωM}Ω={ω1,ω2,...,ωM}\Omega = \lbrace \omega_1, \omega_2, …

9 machine-learning conditional-probability svd information-retrieval lsa

3

Jaki jest sens dekompozycji pojedynczej wartości?

Nie rozumiem, dlaczego zmniejszenie wymiaru jest ważne. Jakie są korzyści z pobrania niektórych danych i zmniejszenia ich wymiaru?

9 dimensionality-reduction svd

1

Jak interpretować wyniki redukcji wymiarowości / skalowania wielowymiarowego?

Przeprowadziłem zarówno dekompozycję SVD, jak i wielowymiarowe skalowanie 6-wymiarowej macierzy danych, aby lepiej zrozumieć strukturę danych. Niestety, wszystkie wartości w liczbie pojedynczej są tego samego rzędu, co oznacza, że wymiarowość danych rzeczywiście wynosi 6. Chciałbym jednak móc interpretować wartości wektorów w liczbie pojedynczej. Na przykład pierwszy wydaje się być mniej …

9 pca interpretation dimensionality-reduction svd

Pytania otagowane jako svd