Mam kilkaset pomiarów. Teraz rozważam wykorzystanie jakiegoś oprogramowania do skorelowania każdej miary z każdą miarą. Oznacza to, że istnieją tysiące korelacji. Wśród nich powinna być (statystycznie) wysoka korelacja, nawet jeśli dane są całkowicie losowe (każda miara ma tylko około 100 punktów danych).
Kiedy znajdę korelację, w jaki sposób mogę dołączyć do niej informację o tym, jak bardzo szukałem korelacji?
Nie jestem na wysokim poziomie statystyki, więc proszę o wyrozumiałość.
R
na tej maszynie zajmuje 18 sekund, aby uzyskać 1000 realizacji zerowego rozkładu permutacji maksymalnego współczynnika korelacji dla macierzy 300 na 100 x
:correl <- function(x, k=1) { n <- dim(x)[2] * (dim(x)[2]-1) / 2; v <- cor(x); sort(v[lower.tri(v)])[(n-k+1):n] }; sim <- replicate(1000, correl(apply(x,2,sample)))