Gdybym miał zdefiniować współrzędne i gdzie
Jak znajdę oczekiwaną wartość odległości między nimi?
Myślałem, ponieważ odległość jest obliczana przez byłby oczekiwaną wartością po prostu bądź ?
Gdybym miał zdefiniować współrzędne i gdzie
Jak znajdę oczekiwaną wartość odległości między nimi?
Myślałem, ponieważ odległość jest obliczana przez byłby oczekiwaną wartością po prostu bądź ?
Odpowiedzi:
##problem
x <- runif(1000000,0,30)
y <- runif(1000000,0,40)
Uniform <- as.data.frame(cbind(x,y))
n <- nrow(Uniform)
catch <- rep(NA,n)
for (i in 2:n) {
catch[i] <-((x[i+1]-x[i])^2 + (y[i+1]-y[i])^2)^.5
}
mean(catch, na.rm=TRUE)
18.35855
Jeśli dobrze rozumiem, czego szukasz, może to pomoże. Próbujesz ustalić odległość między losowymi punktami, których wartości X są generowane z unif (0,30), a wartości Y są generowane z unif (0,40). Właśnie stworzyłem milion RV z każdego z tych rozkładów, a następnie związałem x i y, aby utworzyć punkt dla każdego z nich. Następnie obliczyłem odległość między punktami 2 i 1 aż do odległości między punktami 1 000 000 a 999,999. Średnia odległość wynosiła 18,35855. Daj mi znać, jeśli nie tego szukasz.
n <- 10^7; distance <- sqrt((runif(n,0,30)-runif(n,0,30))^2 + (runif(n,0,40)-runif(n,0,40))^2)
sd(distance) / sqrt(n)
Z geometrycznego spojrzenia na pytanie jest jasne, że oczekiwana odległość między dwoma niezależnymi, jednolitymi losowymi punktami w zestawie wypukłym będzie nieco mniejsza niż połowa jego średnicy . (Powinno być mniej, ponieważ stosunkowo rzadko dwa punkty znajdują się w ekstremalnych obszarach, takich jak narożniki, a częściej w przypadku, gdy będą blisko centrum, gdzie są blisko.) Ponieważ średnica tego prostokąta wynosi , przez to samo uzasadnienie przewidywałoby, że odpowiedź będzie nieco mniejsza niż .
Dokładną odpowiedź uzyskuje się z definicji oczekiwania jako wartości ważonej prawdopodobieństwem odległości. Ogólnie rzecz biorąc, rozważ prostokąt z boków i ; następnie przeskalujemy go do właściwego rozmiaru (ustawiając i mnożąc oczekiwanie przez ). Dla tego prostokąta, przy użyciu współrzędnych , jednolita gęstość prawdopodobieństwa wynosi . Średnia odległość w tym prostokącie jest następnie podana przez
Korzystanie z elementarnych metod integracji jest proste, ale bolesne; Aby uzyskać odpowiedź, zastosowałem system algebry komputerowej ( Mathematica )
Obecność w wielu z tych terminów nie jest zaskoczeniem: jest to średnica prostokąta (maksymalna możliwa odległość między dowolnymi dwoma punktami w nim zawartymi). Pojawienie się logarytmów (w tym arcsinh) również nie jest zaskakujące, jeśli kiedykolwiek badałeś średnie odległości w prostych figurach płaskich: jakoś zawsze się pojawia (wskazówka tego pojawia się w funkcji siecznej). Nawiasem mówiąc, obecność w mianowniku nie ma nic wspólnego ze specyfiką problemu dotyczącego prostokąta boków i : jest to stała uniwersalna).
Przy i skalowaniu w górę o współczynnik , daje to wartość .
Jednym ze sposobów głębszego zrozumienia sytuacji jest wykreślenie średniej odległości względem średnicy dla różnych wartości . W przypadku ekstremalnych wartości (blisko lub znacznie większych niż ) prostokąt staje się zasadniczo jednowymiarowy, a bardziej elementarna integracja wskazuje, że średnia odległość powinna zmniejszyć się do jednej trzeciej średnicy. Ponadto, ponieważ kształty prostokątów z i są takie same, naturalne jest wykreślanie wyniku w skali logarytmicznej , gdzie musi być symetryczna względem (kwadrat). Oto on:
Dzięki temu poznajemy ogólną zasadę : średnia odległość w prostokącie wynosi między a (w przybliżeniu) jego średnicy, przy czym większe wartości związane są z prostokątami prostokątnymi, a mniejsze wartości związane z długimi chudymi (liniowymi ) prostokąty. Punkt środkowy między tymi skrajnościami jest osiągany z grubsza dla prostokątów o proporcjach . Mając to na uwadze, wystarczy spojrzeć na prostokąt i oszacować jego średnią odległość do dwóch znaczących cyfr.