Konstruowanie znaczących i użytecznych graficznych reprezentacji danych. (Jeśli twoje pytanie dotyczy tylko tego, jak uzyskać określone oprogramowanie, aby uzyskać konkretny efekt, prawdopodobnie nie ma tutaj tematu).
Mam zestaw danych 50 próbek. Każda próbka składa się z 11 (prawdopodobnie skorelowanych) cech logicznych. Chciałbym przedstawić, w jaki sposób wizualizować te próbki na wykresie 2D i sprawdzić, czy wśród 50 próbek znajdują się klastry / grupy. Wypróbowałem następujące dwa podejścia: (a) Uruchom PCA na matrycy 50x11 i wybierz pierwsze …
Próbuję dopasować model czasu dyskretnego do R, ale nie jestem pewien, jak to zrobić. Czytałem, że możesz zorganizować zmienną zależną w różnych wierszach, po jednym dla każdej obserwacji czasu, i użyć glmfunkcji z łączem logit lub cloglog. W tym sensie, mam trzy kolumny: ID, Event(1 lub 0, w każdym okresie …
Przeczytałem kilka artykułów i fragmentów książek, które wyjaśniają, jak wybrać dobrą liczbę interwałów (pojemników) dla histogramu zestawu danych, ale zastanawiam się, czy istnieje twarda maksymalna liczba interwałów na podstawie liczby punktów w zestaw danych lub inne kryterium. Wstęp: Powód, dla którego pytam, jest to, że próbuję napisać oprogramowanie na podstawie …
To tylko przykład, na który natknąłem się kilka razy, więc nie mam żadnych przykładowych danych. Uruchamianie modelu regresji liniowej w R: a.lm = lm(Y ~ x1 + x2) x1jest zmienną ciągłą. x2jest kategoryczny i ma trzy wartości, np. „Niska”, „Średnia” i „Wysoka”. Jednak dane wyjściowe podane przez R byłyby mniej …
Zablokowana . To pytanie i odpowiedzi są zablokowane, ponieważ pytanie jest nie na temat, ale ma znaczenie historyczne. Obecnie nie akceptuje nowych odpowiedzi ani interakcji. Chcę utworzyć bardiagram dla tych danych w R (odczytany z pliku CVS): Experiment_Name MetricA MetricB Just_X 2 10 Just_X_i_Y 3 20 mieć następujący schemat: Jestem …
Przykłady: w opisie stanowiska mam zdanie: „Starszy inżynier Java w Wielkiej Brytanii”. Chcę użyć modelu głębokiego uczenia się, aby przewidzieć go jako 2 kategorie: English i IT jobs. Jeśli użyję tradycyjnego modelu klasyfikacji, może on przewidzieć tylko 1 etykietę z softmaxfunkcją na ostatniej warstwie. Dlatego mogę użyć 2 modelowych sieci …
Mam wiele danych szeregów czasowych - poziomy wody i prędkości w funkcji czasu. Jest to wynik symulacji modelu hydraulicznego. W ramach procesu przeglądu, aby potwierdzić, że model działa zgodnie z oczekiwaniami, muszę wykreślić każdy szereg czasowy, aby upewnić się, że w danych nie ma żadnych „wahnięć” (patrz przykład mniejszego wahania …
W swojej pracy w autoencoders do klasyfikacji tekst Hinton i Salakhutdinov wykazały wykres wytwarzanego przez 2 wymiarowe LSA (co jest ściśle związane z PCA) . Stosując PCA do absolutnie różnych nieco nieco wymiarowych danych, otrzymałem podobnie wyglądający wykres: (z wyjątkiem tego przypadku naprawdę chciałem wiedzieć, czy jest jakaś struktura wewnętrzna). …
Istnieje mnóstwo dobrze znanych zasobów oferujących porady dotyczące wizualizacji danych. (Np. Tufte, Stephen Few i in. , Nathan Yau .) Ale do jakich dziedzin można się zwrócić w celu uzyskania odpowiedzi na takie pytania: Czy krytyka wykresu kołowego jest istotna w praktyce? Czy ludzie znacznie lepiej interpretują długość skali liniowej …
W mojej dziedzinie zwykłym sposobem wykreślania sparowanych danych jest seria cienkich nachylonych segmentów linii, nakładających je na medianę i CI mediany dla dwóch grup: Jednak ten rodzaj wykresu staje się znacznie trudniejszy do odczytania, ponieważ liczba punktów danych staje się bardzo duża (w moim przypadku mam rzędu 10000 par): Zmniejszenie …
Dla zabawy chcę zobrazować moje miesięczne zużycie energii w gospodarstwach domowych w ujęciu rocznym. Chciałbym jednak dołączyć pewne odniesienie do miesięcznej temperatury, dzięki czemu mogę ustalić, czy mój dom lub zachowanie poprawia się, pogarsza lub utrzymuje stałe w odniesieniu do zużycia kWh. Dane, z którymi pracuję: +----------+--------+-----------+----------------+----------+-----------+------------+ | Month | …
Zajmuję się modelowaniem ARIMA wzbogaconym o zmienne egzogeniczne do celów modelowania promocyjnego i trudno mi to wytłumaczyć użytkownikom biznesowym. W niektórych przypadkach pakiety oprogramowania kończą się prostą funkcją przesyłania, tj. Parametrem * Zmienna egzogeniczna. W tym przypadku interpretacja jest łatwa, tzn. Działanie promocyjne X (reprezentowane przez egzogenną zmienną binarną) wpływa …
Poniżej znajduje się wykres z p. 202 Christiana Ruddera Dataclysm , choć został stworzony przez Jamesa Dowdella. To ilustruje relacje między różnymi 200 najpopularniejszymi subredditami, które są obszarami zainteresowania na reddit.com, gdzie użytkownicy mogą przesyłać linki, komentarze i głosy. Są one podobne do tagów na tej stronie. Rozmiar regionów subredditów …
Mam zestaw danych milionów ukierunkowanych segmentów linii. Segmenty linii są sekwencyjne - jest to zmienna klimatyczna (ciepło jawne), z obserwowanymi i symulowanymi wartościami w odstępach półgodzinnych. Staram się szukać wzorców w działaniu symulacji. Patrzę na wykres rozrzutu wartości obs vs vs i łączę je z segmentami linii (strzałki wskazują kierunek …
Mam problem z interpretacją wykresów interakcji, gdy występuje interakcja między dwiema zmiennymi niezależnymi. Poniższe wykresy pochodzą z tej strony: Tutaj i są zmiennymi niezależnymi, a jest zmienną zależną.ZAAAbBBD V.DVDV Pytanie: Występuje interakcja i główny efekt , ale brak głównego efektuZAAAbBB Można zauważyć, że im wyższa wartość , tym wyższa wartość …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.