Konstruowanie znaczących i użytecznych graficznych reprezentacji danych. (Jeśli twoje pytanie dotyczy tylko tego, jak uzyskać określone oprogramowanie, aby uzyskać konkretny efekt, prawdopodobnie nie ma tutaj tematu).
Chciałbym wiedzieć, jak poprawnie interpretować wykresy gęstości warunkowej. Włożenia dwa poniżej utworzonego w R z cdplot. Na przykład, czy prawdopodobieństwo, że Wynik będzie równy 1, gdy Var 1 wynosi 150, wynosi około 80%? Ciemnoszary obszar to takie, które jest warunkowym prawdopodobieństwem Resultbycia równym 1, prawda? Z cdplotdokumentacji: cdplot oblicza gęstości …
Obecnie robię analizy na stronie internetowej, która wymaga, aby utworzyć diagram drzewa decyzyjnego pokazujący prawdopodobną trasę, którą ludzie wybiorą za każdym razem, gdy dotrą na stronę. Mam do czynienia z tym, data.framektóry pokazuje ścieżki wszystkich klientów do strony, zaczynając od strony głównej. Na przykład klient może wybrać następującą ścieżkę: Homepage …
Często mam do czynienia z rozsądną ilością danych szeregów czasowych, 50-200 milionów podwójnych z powiązanymi znacznikami czasu i chciałbym je wizualizować dynamicznie. Czy istnieje oprogramowanie umożliwiające to skutecznie? Co powiesz na biblioteki i formaty danych? Zoom-cache jest jednym z przykładów bibliotek skupiających się na dużych seriach czasowych. W Zoom-cache dane …
Mam pewne dane, które muszę wizualizować i nie jestem pewien, jak najlepiej to zrobić. Mam pewien zestaw elementów podstawowych o odpowiednich częstotliwościach i wyniki O \ w \ {0,1 \} ^ n . Teraz muszę wykreślić, jak dobrze moja metoda „znajduje” (tj. Wynik 1) elementy niskiej częstotliwości. Początkowo miałem po …
Lee i Lemieux (s. 31, 2009) sugerują badaczowi przedstawienie wykresów podczas analizy analizy nieciągłości regresji (RDD). Sugerują następującą procedurę: ”... w pewnym paśmie , i pewnej liczby pojemników i na lewo i na prawo od wartości odcięcia odpowiednio idea jest budowa zbiorników ( , ] dla + gdzie "K 0 …
Zgrupowałem mój zestaw danych kilku tysięcy łańcuchów Markowa pierwszego rzędu w około 10 klastrów. Czy istnieje jakiś zalecany sposób, w jaki mogę ocenić te klastry i dowiedzieć się, jakie elementy mają te klastry i czym różnią się od innych klastrów? Mogę więc wypowiedzieć się w stylu: „Procesy w klastrze A …
Proszę wybaczyć moją ignorancję, ale ... Ciągle znajduję się w sytuacji, w której mam do czynienia z szeregiem nowych danych, które udało mi się znaleźć. Te dane zwykle wyglądają mniej więcej tak: Date Number1 Number2 Category1 Category2 20120125 11 101 Dog Brown 20120126 21 90 Cat Black 20120126 31 134 …
Używam R, aby tworzyć czyste wykresy, których używam w dokumentach Microsoft Office. Według tej strony najlepszą jakość uzyskuje się ze sterownikiem PDF. Niestety, Word nie obsługuje importowania danych PDF. Czego powinienem użyć?
Muszę zbudować aplikację internetową dla wielu użytkowników, która dotyczy pomiarów ruchu, prognoz itp. W tym momencie wiem, że będę korzystać z wykresów słupkowych i kołowych. Niestety te typy wykresów nie są bogate w wyrażanie wszystkich danych, które zbieram i obliczam. Szukam kolekcji graficznych wykresów. Jest ok, jeśli muszę kupić książkę …
Chciałbym uzyskać graficzną reprezentację korelacji w artykułach, które zebrałem do tej pory, aby łatwo zbadać relacje między zmiennymi. Kiedyś rysowałem (niechlujny) wykres, ale teraz mam za dużo danych. Zasadniczo mam stół z: [0]: nazwa zmiennej 1 [1]: nazwa zmiennej 2 [2]: wartość korelacji Matryca „ogólna” jest niekompletna (np. Mam korelację …
Muszę narysować złożoną grafikę do wizualnej analizy danych. Mam 2 zmienne i dużą liczbę przypadków (> 1000). Na przykład (liczba wynosi 100, jeśli dyspersja jest mniej „normalna”): x <- rnorm(100,mean=95,sd=50) y <- rnorm(100,mean=35,sd=20) d <- data.frame(x=x,y=y) 1) Muszę wykreślić surowe dane z rozmiarem punktu, odpowiadającym względnej częstotliwości zbieżności, więc plot(x,y)nie …
Czy istnieje sposób wykreślenia linii regresji takiego fragmentowego modelu, inny niż użycie linesdo wykreślenia każdego segmentu osobno lub użycie geom_smooth(aes(group=Ind), method="lm", fill=FALSE)? m.sqft <- mean(sqft) model <- lm(price~sqft+I((sqft-m.sqft)*Ind)) # sqft, price: continuous variables, Ind: if sqft>mean(sqft) then 1 else 0 plot(sqft,price) abline(reg = model) Warning message: In abline(reg = model) …
Badam niektóre dane pokrycia genomowego, które są w zasadzie długą listą (kilka milionów wartości) liczb całkowitych, z których każda mówi, jak dobrze (lub „głęboka”) pozycja w genomie jest objęta. Chciałbym poszukać w tych danych „dolin”, czyli regionów znacznie „niższych” niż otaczające je środowisko. Zauważ, że rozmiar dolin, których szukam, może …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.