Pytania otagowane jako continuous-data

Zmienna losowa nazywana jest ciągłą, jeśli jej zbiór możliwych wartości jest niepoliczalny, a szansa, że ​​przyjmie jakąś określoną wartość, wynosi zero ( dla każdej liczby rzeczywistej ). Zmienna losowa jest ciągła wtedy i tylko wtedy, gdy jej skumulowana funkcja rozkładu prawdopodobieństwa jest funkcją ciągłą. XP(X=x)=0x


3
Wydajna obliczeniowo estymacja trybu wielowymiarowego
Wersja skrócona: Jaka jest najbardziej wydajna obliczeniowo metoda szacowania trybu wielowymiarowego zestawu danych, próbkowanego z ciągłego rozkładu? Wersja długa: Mam zestaw danych, który muszę oszacować dla trybu. Tryb nie pokrywa się ze średnią lub medianą. Przykład pokazano poniżej, jest to przykład 2D, ale rozwiązanie ND byłoby lepsze: Obecnie moją metodą …

2
Współczynnik korelacji między (niesychotomiczną) zmienną nominalną a zmienną liczbową (przedział) lub porządkową
Przeczytałem już wszystkie strony w tej witrynie, próbując znaleźć odpowiedź na mój problem, ale wydaje się, że nikt nie jest właściwy dla mnie ... Najpierw wyjaśnię ci dane, z którymi pracuję ... Powiedzmy, że mam wektor tablicowy z kilkoma nazwami miast, po jednym dla każdego z 300 użytkowników. Mam też …

3
Prawdopodobieństwo warunkowe zmiennej ciągłej
Załóżmy, że zmienna losowa ma ciągły rozkład jednolity o parametrach 0 i 10 (tj. )UUUU∼U(0,10)U∼U(0,10)U \sim \rm{U}(0,10) Teraz oznaczmy A zdarzenie, które = 5, a B zdarzenie, które jest równe albo albo 6. Według mojego zrozumienia, oba zdarzenia mają zerowe prawdopodobieństwo wystąpienia.UUUUUU555 Teraz, jeśli rozważymy obliczenie , nie możemy użyć …

5
Jak wykonać przypisanie wartości w bardzo dużej liczbie punktów danych?
Mam bardzo duży zestaw danych i brakuje około 5% wartości losowych. Te zmienne są ze sobą skorelowane. Poniższy przykładowy zestaw danych R jest tylko zabawkowym przykładem z fałszywymi skorelowanymi danymi. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 


5
Prawdopodobieństwo, że ciągła zmienna losowa przyjmuje stały punkt
Jestem w klasie statystyk wprowadzających, w której funkcja gęstości prawdopodobieństwa ciągłych zmiennych losowych została zdefiniowana jako . Rozumiem, że całka z ale nie mogę tego naprawić za pomocą intuicji ciągłej zmiennej losowej. Powiedz X to zmienna losowa równa liczbie minut od czasu t, kiedy pociąg przyjeżdża. Jak obliczyć prawdopodobieństwo dotarcia …

1
Określenie optymalnej dyskretyzacji danych z ciągłej dystrybucji
Załóżmy, że masz zestaw danych z ciągłego rozkładu o gęstości obsługiwanej na który nie jest znany, ale jest dość duży, więc gęstość jądra (na przykład) szacunek jest dość dokładny. Dla konkretnego zastosowania muszę przekształcić obserwowane dane w skończoną liczbę kategorii, aby uzyskać nowy zestaw danych z implikowaną funkcją masy .Y1,...,YnY1,...,YnY_{1}, …




1
Czy kiedykolwiek dobrym pomysłem jest „częściowe uznanie” (ciągły wynik) szkolenia regresji logistycznej?
Trenuję regresję logistyczną, aby przewidzieć, którzy biegacze najprawdopodobniej zakończą wyczerpujący wyścig wytrzymałościowy. Bardzo niewielu biegaczy kończy wyścig, więc mam poważny brak równowagi klas i małą próbkę sukcesów (może kilkadziesiąt). Czuję, że mógłbym uzyskać dobry „sygnał” od dziesiątek biegaczy, którzy prawie to zrobili. (Moje dane treningowe mają nie tylko ukończenie, ale …

3
Jak interpretować współczynnik ryzyka na podstawie zmiennej ciągłej - jednostki różnicy?
Czytam artykuł, który pokazuje współczynniki ryzyka dla zmiennych ciągłych, ale nie jestem pewien, jak interpretować podane wartości. Moje obecne rozumienie współczynników ryzyka polega na tym, że liczba ta reprezentuje względne prawdopodobieństwo [zdarzenia] pod pewnymi warunkami. Np .: jeśli współczynnik ryzyka zgonu z powodu raka płuc przy paleniu (zdarzenie binarne) wynosi …

2
Korelacja między zmienną dychotomiczną i zmienną ciągłą
Próbuję znaleźć korelację między zmienną dychotomiczną i zmienną ciągłą. Na podstawie moich prac nad tym stwierdziłem, że muszę zastosować niezależny test t, a warunkiem tego jest, aby rozkład zmiennej był normalny. Przeprowadziłem test Kołmogorowa-Smirnowa w celu przetestowania normalności i stwierdziłem, że zmienna ciągła jest nienormalna i jest wypaczona (dla około …


Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.