Statystyki i duże zbiory danych data-visualization

1

Interpretacja wykresów gęstości warunkowej

Chciałbym wiedzieć, jak poprawnie interpretować wykresy gęstości warunkowej. Włożenia dwa poniżej utworzonego w R z cdplot. Na przykład, czy prawdopodobieństwo, że Wynik będzie równy 1, gdy Var 1 wynosi 150, wynosi około 80%? Ciemnoszary obszar to takie, które jest warunkowym prawdopodobieństwem Resultbycia równym 1, prawda? Z cdplotdokumentacji: cdplot oblicza gęstości …

10 r data-visualization interpretation conditional-probability pdf

3

Zbuduj drzewo prawdopodobieństwa ścieżki dla podróży przez stronę internetową

Obecnie robię analizy na stronie internetowej, która wymaga, aby utworzyć diagram drzewa decyzyjnego pokazujący prawdopodobną trasę, którą ludzie wybiorą za każdym razem, gdy dotrą na stronę. Mam do czynienia z tym, data.framektóry pokazuje ścieżki wszystkich klientów do strony, zaczynając od strony głównej. Na przykład klient może wybrać następującą ścieżkę: Homepage …

10 r probability data-visualization markov-process

3

Jak interaktywnie wyświetlać dane dużych szeregów czasowych?

Często mam do czynienia z rozsądną ilością danych szeregów czasowych, 50-200 milionów podwójnych z powiązanymi znacznikami czasu i chciałbym je wizualizować dynamicznie. Czy istnieje oprogramowanie umożliwiające to skutecznie? Co powiesz na biblioteki i formaty danych? Zoom-cache jest jednym z przykładów bibliotek skupiających się na dużych seriach czasowych. W Zoom-cache dane …

10 time-series data-visualization large-data interactive-visualization

3

Jak wizualizujesz wyniki binarne w porównaniu z ciągłym predyktorem?

Mam pewne dane, które muszę wizualizować i nie jestem pewien, jak najlepiej to zrobić. Mam pewien zestaw elementów podstawowych o odpowiednich częstotliwościach i wyniki O \ w \ {0,1 \} ^ n . Teraz muszę wykreślić, jak dobrze moja metoda „znajduje” (tj. Wynik 1) elementy niskiej częstotliwości. Początkowo miałem po …

10 data-visualization

2

Wykresy w projektowaniu nieciągłości regresji w „Stata” lub „R”

Lee i Lemieux (s. 31, 2009) sugerują badaczowi przedstawienie wykresów podczas analizy analizy nieciągłości regresji (RDD). Sugerują następującą procedurę: ”... w pewnym paśmie , i pewnej liczby pojemników i na lewo i na prawo od wartości odcięcia odpowiednio idea jest budowa zbiorników ( , ] dla + gdzie "K 0 …

10 r regression data-visualization stata regression-discontinuity

2

Ocena klastrów łańcuchów Markowa pierwszego rzędu

Zgrupowałem mój zestaw danych kilku tysięcy łańcuchów Markowa pierwszego rzędu w około 10 klastrów. Czy istnieje jakiś zalecany sposób, w jaki mogę ocenić te klastry i dowiedzieć się, jakie elementy mają te klastry i czym różnią się od innych klastrów? Mogę więc wypowiedzieć się w stylu: „Procesy w klastrze A …

10 data-visualization clustering markov-process

3

Pierwsze szybkie spojrzenie na zestaw danych

Proszę wybaczyć moją ignorancję, ale ... Ciągle znajduję się w sytuacji, w której mam do czynienia z szeregiem nowych danych, które udało mi się znaleźć. Te dane zwykle wyglądają mniej więcej tak: Date Number1 Number2 Category1 Category2 20120125 11 101 Dog Brown 20120126 21 90 Cat Black 20120126 31 134 …

10 data-visualization correlation data-mining eda

7

W R jaki jest najlepszy sterownik grafiki do używania wykresów w Microsoft Word?

Używam R, aby tworzyć czyste wykresy, których używam w dokumentach Microsoft Office. Według tej strony najlepszą jakość uzyskuje się ze sterownikiem PDF. Niestety, Word nie obsługuje importowania danych PDF. Czego powinienem użyć?

10 r data-visualization

5

Wizualizacja kombinacji 2 liter

Odpowiedzi na to pytanie dotyczące SO zwróciły zestaw około 125 jedno- lub dwuliterowych nazw: /programming/6979630/what-1-2-letter-object-names-conflict-with-existing -r-objects [1] "Ad" "am" "ar" "as" "bc" "bd" "bp" "br" "BR" "bs" "by" "c" "C" [14] "cc" "cd" "ch" "ci" "CJ" "ck" "Cl" "cm" "cn" "cq" "cs" "Cs" "cv" [27] "d" "D" "dc" "dd" "de" …

10 r data-visualization

8

Encyklopedia graficzna

Muszę zbudować aplikację internetową dla wielu użytkowników, która dotyczy pomiarów ruchu, prognoz itp. W tym momencie wiem, że będę korzystać z wykresów słupkowych i kołowych. Niestety te typy wykresów nie są bogate w wyrażanie wszystkich danych, które zbieram i obliczam. Szukam kolekcji graficznych wykresów. Jest ok, jeśli muszę kupić książkę …

10 data-visualization references

3

Jak wyświetlić macierz korelacji z brakującymi wpisami?

Chciałbym uzyskać graficzną reprezentację korelacji w artykułach, które zebrałem do tej pory, aby łatwo zbadać relacje między zmiennymi. Kiedyś rysowałem (niechlujny) wykres, ale teraz mam za dużo danych. Zasadniczo mam stół z: [0]: nazwa zmiennej 1 [1]: nazwa zmiennej 2 [2]: wartość korelacji Matryca „ogólna” jest niekompletna (np. Mam korelację …

10 r data-visualization correlation

2

Wykres regresji złożonej w R.

Muszę narysować złożoną grafikę do wizualnej analizy danych. Mam 2 zmienne i dużą liczbę przypadków (> 1000). Na przykład (liczba wynosi 100, jeśli dyspersja jest mniej „normalna”): x <- rnorm(100,mean=95,sd=50) y <- rnorm(100,mean=35,sd=20) d <- data.frame(x=x,y=y) 1) Muszę wykreślić surowe dane z rozmiarem punktu, odpowiadającym względnej częstotliwości zbieżności, więc plot(x,y)nie …

10 r data-visualization regression

1

Rysowanie linii regresji częściowej

Czy istnieje sposób wykreślenia linii regresji takiego fragmentowego modelu, inny niż użycie linesdo wykreślenia każdego segmentu osobno lub użycie geom_smooth(aes(group=Ind), method="lm", fill=FALSE)? m.sqft <- mean(sqft) model <- lm(price~sqft+I((sqft-m.sqft)*Ind)) # sqft, price: continuous variables, Ind: if sqft>mean(sqft) then 1 else 0 plot(sqft,price) abline(reg = model) Warning message: In abline(reg = model) …

10 r data-visualization regression

4

Jak szukać dolin na wykresie?

Badam niektóre dane pokrycia genomowego, które są w zasadzie długą listą (kilka milionów wartości) liczb całkowitych, z których każda mówi, jak dobrze (lub „głęboka”) pozycja w genomie jest objęta. Chciałbym poszukać w tych danych „dolin”, czyli regionów znacznie „niższych” niż otaczające je środowisko. Zauważ, że rozmiar dolin, których szukam, może …

10 r distributions statistical-significance data-visualization

5

Biblioteki wizualizacji internetowej

Jakie są dobre biblioteki wizualizacji do użytku online? Czy są łatwe w użyciu i czy istnieje dobra dokumentacja?

10 data-visualization protovis

Pytania otagowane jako data-visualization