Pytania otagowane jako discrete-data

Odnosi się do danych wygenerowanych z dystrybucji, która ma policzalną przestrzeń na próbki. Dyskretny znacznik danych może obejmować dane kategoryczne, nominalne (np. Rozkład rasy w próbie osób) lub porządkowe (np. Status społeczno-ekonomiczny), lub rzeczywistą dyskretną zmienną losową, taką jak zbiór zliczeń zdarzeń (np. liczba błędów na stronie tekstu). Jednak dane dyskretne nie muszą być liczbami całkowitymi.


1
Określenie optymalnej dyskretyzacji danych z ciągłej dystrybucji
Załóżmy, że masz zestaw danych z ciągłego rozkładu o gęstości obsługiwanej na który nie jest znany, ale jest dość duży, więc gęstość jądra (na przykład) szacunek jest dość dokładny. Dla konkretnego zastosowania muszę przekształcić obserwowane dane w skończoną liczbę kategorii, aby uzyskać nowy zestaw danych z implikowaną funkcją masy .Y1,...,YnY1,...,YnY_{1}, …


2
Rozkłady na posortowane listy
Powiedzmy, że mamy uporządkowaną listę przedmiotów [a, b, c, ... x, y, z, ...] Szukam rodziny dystrybucji z obsługą na powyższej liście, regulowanej przez niektóre parametry alfa, dzięki czemu: Dla alfa = 0 przypisuje prawdopodobieństwo 1 do pierwszego elementu, a powyżej, i 0 do reszty. Oznacza to, że jeśli próbkujemy …

4
Czy rozkład prawdopodobieństwa urny zmienia się, gdy czerpiesz z niej średnio bez zamiany?
Załóżmy, że mam urnę zawierającą N różnych kolorów kulek, a każdy inny kolor może pojawić się różną liczbę razy (jeśli jest 10 czerwonych kulek, nie musi też być 10 niebieskich kulek). Jeśli znamy dokładną zawartość urny przed narysowaniem, możemy utworzyć dyskretny rozkład prawdopodobieństwa, który mówi nam o prawdopodobieństwie narysowania każdego …

1
Jak znaleźć i ocenić optymalną dyskretyzację zmiennej ciągłej z kryterium ?
Mam zestaw danych ze zmienną ciągłą i binarną zmienną docelową (0 i 1). Muszę zdyskretyzować zmienne ciągłe (w przypadku regresji logistycznej) w odniesieniu do zmiennej docelowej oraz z ograniczeniem, że częstotliwość obserwacji w każdym przedziale powinna być zrównoważona. Próbowałem algorytmów uczenia maszynowego, takich jak Chi Merge, drzewa decyzyjne. Scalanie chi …

1
Dyskretne dane i alternatywy dla PCA
Posiadam zestaw danych dyskretnych (porządkowych, meristycznych i nominalnych) zmiennych opisujących morfologiczne charaktery skrzydeł na kilku blisko spokrewnionych gatunkach owadów. Chcę przeprowadzić jakąś analizę, która dałaby mi wizualną reprezentację podobieństwa różnych gatunków w oparciu o cechy morfologiczne. Pierwszą rzeczą, która wpadła mi do głowy, była PCA (jest to rodzaj wizualizacji, którą …

2
Rozkłady na podzbiory ?
Zastanawiam się, czy istnieją jakieś standardowe rozkłady na podzbiorach liczb całkowitych . Równolegle możemy to wyrazić jako rozkład na wektor długości wyników binarnych, np. Jeśli to odpowiada wektorowi .{1,2,...,J}{1,2,...,J}\{1, 2, ..., J\}JJJJ=5J=5J = 5{1,3,5}{1,3,5}\{1, 3, 5\}(1,0,1,0,1)(1,0,1,0,1)(1, 0, 1, 0, 1) Idealnie szukam jakiejś dystrybucji , pochodzącej z rodziny indeksowanej skończonym …

1
Funkcje dyskretne: zakres przedziału ufności?
Jak obliczyć pokrycie przedziału dyskretnego? Co wiem jak to zrobić: Gdybym miał model ciągły, mógłbym zdefiniować 95% przedział ufności dla każdej z moich przewidywanych wartości, a następnie zobaczyć, jak często rzeczywiste wartości mieściły się w przedziale ufności. Mogę stwierdzić, że tylko 88% czasu, w którym mój 95% przedział ufności obejmował …
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.