Konstruowanie znaczących i użytecznych graficznych reprezentacji danych. (Jeśli twoje pytanie dotyczy tylko tego, jak uzyskać określone oprogramowanie, aby uzyskać konkretny efekt, prawdopodobnie nie ma tutaj tematu).
Jakie jest najlepsze oprogramowanie do wizualizacji danych typu open source? Potrzebuję: Może importować dane z Microsoft Excel (importowanie danych z baz danych Oracle również byłoby dobre, ale nie jest to obowiązkowe). Wykresy generowane przez oprogramowanie można eksportować do programu Microsoft PowerPoint (kopiowanie i wklejanie jest ze mną w porządku). Open …
Próbuję zrozumieć wynik, który widzę na poniższym wykresie. Zwykle używam Excela i otrzymuję linię regresji liniowej, ale w poniższym przypadku używam R i otrzymuję regresję wielomianową z poleceniem: ggplot(visual1, aes(ISSUE_DATE,COUNTED)) + geom_point() + geom_smooth() Więc moje pytania sprowadzają się do tego: Co to jest szary obszar (strzałka nr 1) wokół …
Próbuję wykreślić wykres QQ z dwoma zestawami danych około 1,2 miliona punktów, w R (używając qqplot i wprowadzając dane do ggplot2). Obliczenia są dość łatwe, ale wynikowy wykres jest boleśnie powolny do ładowania, ponieważ jest tak wiele punktów. Próbowałem aproksymacji liniowej, aby zmniejszyć liczbę punktów do 10000 (to właśnie robi …
Próbuję rysować wykresy skrzypcowe i zastanawiam się, czy istnieje sprawdzona najlepsza praktyka skalowania ich między grupami. Oto trzy opcje, które wypróbowałem przy użyciu mtcarszestawu danych R (Motor Trend Cars z 1973 roku, tutaj ). Równe szerokości Wygląda na to, co robi oryginalny papier * i co vioplotrobi R ( przykład …
Załóżmy, że mam dwa rozkłady, które chcę szczegółowo porównać, tj. W taki sposób, aby kształt, skala i przesunięcie były łatwo widoczne. Jednym dobrym sposobem na to jest wykreślenie histogramu dla każdej dystrybucji, umieszczenie ich w tej samej skali X i ułożenie jednego pod drugim. W jaki sposób należy to zrobić? …
Chciałbym dowiedzieć się nieco więcej na temat interaktywnej wizualizacji danych (powiększanie, wskazywanie, szczotkowanie, mapowanie punktów i tak dalej). Chciałbym powitać każdego: Samouczek / przewodnik / książka (?) / Wideo na temat korzystania z takich metod w badaniach statystycznych. Wskaźniki dobrych / interesujących interaktywnych pakietów danych (w R i poza nim) …
Zablokowana . To pytanie i odpowiedzi są zablokowane, ponieważ pytanie jest nie na temat, ale ma znaczenie historyczne. Obecnie nie akceptuje nowych odpowiedzi ani interakcji. Piramida wieku wygląda następująco: chciałbym zrobić coś podobnego, a mianowicie 2 wykresy słupkowe (nie histogramy) z tymi samymi kategoriami, obrócone pionowo i rozciągające się na …
Obecnie kończę pracę i natknąłem się na to pytanie z wczoraj, które skłoniło mnie do postawienia sobie tego samego pytania. Czy lepiej jest podać mojemu wykresowi rzeczywisty błąd standardowy z danych lub ten oszacowany na podstawie mojej ANOVA? Ponieważ pytanie z wczoraj było raczej niespecyficzne, a moje dość specyficzne, pomyślałem, …
Zablokowana . To pytanie i odpowiedzi są zablokowane, ponieważ pytanie jest nie na temat, ale ma znaczenie historyczne. Obecnie nie akceptuje nowych odpowiedzi ani interakcji. Chcę zebrać ~ 22000 punktów. Wiele algorytmów klastrowania działa lepiej przy wstępnych domysłach o wyższej jakości. Jakie istnieją narzędzia, które mogą dać mi dobry pogląd …
Jestem ciekawy, czy istnieją specjalne techniki graficzne, które można zastosować do modelowania równań strukturalnych. Wydaje mi się, że to można podzielić na kategorie narzędzi eksploracyjnych do analizy kowariancji lub diagnostyki graficznej do oceny modelu SEM. (Tak naprawdę nie mam tu na myśli diagramów ścieżek / wykresów.)
Wydaje się, że istnieje wiele zamieszania w porównaniu używania glmnetwewnątrz w caretcelu znalezienia optymalnej lambdy i korzystania cv.glmnetz tego samego zadania. Zadano wiele pytań, np .: Model klasyfikacji train.glmnet vs. cv.glmnet? Jaki jest właściwy sposób używania glmnet z karetką? Cross-validation `glmnet` za pomocą` caret` ale nie udzielono odpowiedzi, co może …
Kontekst : Chcę, aby narysować linię na wykresie rozrzutu, że nie pojawia się parametryczne, dlatego używam geom_smooth()w ggplotw R. Automatycznie zwraca geom_smooth: method="auto" and size of largest group is >=1000, so using gam with formula: y ~ s(x, bs = "cs"). Use 'method = x' to change the smoothing method., …
Histogramy dają dobre wyobrażenie o rozkładzie zmiennej. Wykresy pudełkowe próbują zrobić to samo, jednak nie dają tak dobrego obrazu rozkładu tej zmiennej. Nie rozumiem, dlaczego ludzie używają wykresów pudełkowych. Histogramy są lepsze pod każdym względem. Czy jest powód, dla którego chciałbym użyć ich obu? Jedyne, co myślę, że wykresy pudełkowe …
Mam mały zestaw danych 14 osobnych razy, aby wykonać zadanie. Mam jednak trudności ze znalezieniem odpowiedniego wykresu, którego można by użyć do wykreślenia danych. Gdyby próbka była większa, użyłbym wykresu pudełkowego lub histogramu, ale nie jestem pewien, czy stosowne byłoby użycie w tym przypadku, gdy próbka jest tak mała. Aktualizacja: …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.