Korzystanie z jednorodnie rozmieszczonych zmiennych wielowymiarowych
Taeke zapewnia link do artykułu, który w poniższym tekście jest bardziej intuicyjny, wyjaśniając w szczególności przypadki 2-normalne i 1-normowe.
∥ x ∥2)≤ r
przykładowy kierunek
Możesz użyć tego wyniku http://mathworld.wolfram.com/HyperspherePointPicking.html
Wielowymiarowa zmienna rozkładowa Gaussa (z macierzą kowariancji tożsamości) zależy tylko od odległości lub sumy kwadratów.X
fa( X1, X2), . . . , Xn) = ∏1 ≤ i ≤ n12 π--√mi12)x2)ja= 12 π--√mi12)∑1 ≤ i ≤ nx2)ja
Zatem jest równomiernie rozmieszczony na powierzchni n-wymiarowej hipersfery.X∥ X∥2)
odległość próbki
Aby ukończyć, wystarczy próbkować odległość, aby zmienić jednorodny rozkład na kuli na jednorodny rozkład w kuli. (który jest mniej więcej podobny do połączonego przykładu wybierania punktów na dysku)
Jeśli po prostu spróbujesz jako rozkład równomierny, będziesz mieć stosunkowo większą gęstość w pobliżu środka (objętość skaluje się jako więc ułamek punktów kończy się na objętości , która jest bardziej gęsta blisko centrum i nie oznaczałoby równomiernego rozkładu)r n r r nrrnrrn
Jeśli zamiast tego użyjesz pierwiastka zmiennej próbkowanej z rozkładu jednolitego, otrzymasz rozkład parzysty.n
1-norm∥ x ∥1≤ r
kierunek
W tym przypadku próbkujesz z rozkładu Laplace'a zamiast rozkładu Gaussa i dzielisz przez 1-normę. równomiernie rozmieszczone na n-wymiarowej norma 1 kuli.XXX| X|1
Nie mam formalnego dowodu, tylko intuicję
(ponieważ plik pdf jest niezależny od położenia, można oczekiwać, że każdy nieskończenie mały obszar / objętość o tej samej 1-normie będzie miał takie samo prawdopodobieństwo a gdy zwiniesz go na powierzchnię jednostki, to samo )f ( x ) d Afa( x ) dV.fa( x ) dZA
ale testowanie za pomocą symulacji wygląda dobrze.
library(rmutil)
x <- abs(rlaplace(20000))
y <- abs(rlaplace(20000))
z <- abs(rlaplace(20000))
rn <- abs(x)+abs(y)+abs(z)
xi <- (x/rn)
yi <- (y/rn)
zi <- (z/rn)
plot(sqrt(0.5)*(xi-yi),
sqrt((0.5-0.5*(xi+yi))^2+zi^2),
pc=21,bg=rgb(0,0,0,0.02), col=rgb(0,0,0,0),cex=1)
dystans
Odległość jest podobna jak w przypadku 2-normowym (głośność nadal skaluje się jako ).rn
p-norm∥x∥p≤r
W takim przypadku, jeśli chcesz zastosować tę samą zasadę, musisz próbkować z dystrybucji za pomocą ( ). Są to uogólnione rozkłady normalne i prawdopodobnie odnoszą się do rozkładu wspomnianego przez Taeke.f(x)∝e|x|pG()