Statystyki i duże zbiory danych measurement-error

2

ImageNet: co to jest wskaźnik błędów w pierwszej i piątce?

W dokumentach klasyfikacyjnych ImageNet wskaźniki błędu 1 i 5 są ważnymi jednostkami do pomiaru sukcesu niektórych rozwiązań, ale jakie są te poziomy błędów? W ImageNet Classification with Deep Convolutional Neural Networks autorstwa Krizhevsky i in. każde rozwiązanie oparte na jednym CNN (strona 7) nie ma najwyższych 5 poziomów błędów, podczas …

38 classification neural-networks error measurement-error image-processing

4

Jak obliczyć błąd względny, gdy prawdziwa wartość wynosi zero?

Jak obliczyć błąd względny, gdy prawdziwa wartość wynosi zero? Powiedz, że mam i . Jeśli zdefiniuję błąd względny jako:xtrue=0xtrue=0x_{true} = 0xtestxtestx_{test} relative error=xtrue−xtestxtruerelative error=xtrue−xtestxtrue\text{relative error} = \frac{x_{true}-x_{test}}{x_{true}} Wówczas błąd względny jest zawsze niezdefiniowany. Jeśli zamiast tego użyję definicji: relative error=xtrue−xtestxtestrelative error=xtrue−xtestxtest\text{relative error} = \frac{x_{true}-x_{test}}{x_{test}} Wówczas błąd względny wynosi zawsze 100%. …

32 error measurement-error

5

Jak radzić sobie z hierarchicznymi / zagnieżdżonymi danymi w uczeniu maszynowym

Wyjaśnię mój problem na przykładzie. Załóżmy, że chcesz przewidzieć dochód danej osoby na podstawie niektórych atrybutów: {Wiek, płeć, kraj, region, miasto}. Masz taki zestaw danych szkoleniowych train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) train CountryID RegionID CityID …

29 regression machine-learning multilevel-analysis correlation dataset spatial paired-comparisons cross-correlation clustering aic bic dependent-variable k-means mean standard-error measurement-error errors-in-variables regression multiple-regression pca linear-model dimensionality-reduction machine-learning neural-networks deep-learning conv-neural-network computer-vision clustering spss r weighted-data wilcoxon-signed-rank bayesian hierarchical-bayesian bugs stan distributions categorical-data variance ecology r survival regression r-squared descriptive-statistics cross-section maximum-likelihood factor-analysis likert r multiple-imputation propensity-scores distributions t-test logit probit z-test confidence-interval poisson-distribution deep-learning conv-neural-network residual-networks r survey wilcoxon-mann-whitney ranking kruskal-wallis bias loss-functions frequentist decision-theory risk machine-learning distributions normal-distribution multivariate-analysis inference dataset factor-analysis survey multilevel-analysis clinical-trials

4

Jak interpretujesz RMSLE (błąd logarytmiczny średniej kwadratowej)?

Brałem udział w konkursie uczenia maszynowego, w którym używają RMSLE (Root Mean Squared Logarithmic Error) do oceny wydajności przewidującej cenę sprzedaży danej kategorii sprzętu. Problem w tym, że nie jestem pewien, jak interpretować sukces mojego końcowego wyniku. Na przykład, jeśli osiągnąłem RMSLE na poziomie czy mogę podnieść moc wykładniczą i …

29 regression machine-learning interpretation measurement-error theory

5

Wariancja ograniczonej zmiennej losowej

Załóżmy, że zmienna losowa ma dolną i górną granicę [0,1]. Jak obliczyć wariancję takiej zmiennej?

22 variance standard-deviation measurement-error

1

Czy obcięte liczby z generatora liczb losowych są nadal „losowe”?

Tutaj „obcięcie” oznacza zmniejszenie precyzji liczb losowych i nie obcinanie serii liczb losowych. Na przykład, jeśli mam liczb rzeczywistych losowych (narysowanych z dowolnego rozkładu, np. Normalnego, jednolitego itp.) Z dowolną precyzją i obcinam wszystkie liczby, aby w końcu otrzymać zestaw liczb, z których każda zawiera dokładnie 2 cyfry po przecinku. …

18 random-generation measurement-error truncation

2

Analiza ważonych głównych składników

Po krótkich poszukiwaniach niewiele znajduję informacji na temat włączania wag obserwacyjnych / błędów pomiarowych do analizy głównych składników. To, co uważam, polega na iteracyjnych podejściach obejmujących wagi (np. Tutaj ). Moje pytanie brzmi: dlaczego to podejście jest konieczne? Dlaczego nie możemy użyć wektorów własnych ważonej macierzy kowariancji?

17 pca measurement-error weighted-data

1

Co to znaczy, że AUC jest częściowo poprawną zasadą punktacji?

Właściwa reguła punktacji jest regułą, która jest maksymalizowana przez „prawdziwy” model i nie pozwala na „zabezpieczanie” lub granie w system (celowe zgłaszanie różnych wyników, jak to jest prawdziwe przekonanie modelu o poprawie wyniku). Wynik Briera jest prawidłowy, dokładność (proporcja sklasyfikowana poprawnie) jest niewłaściwa i często zniechęcana. Czasami widzę, że AUC …

16 classification references roc measurement-error scoring-rules

1

Czy mogę przekonwertować macierz kowariancji na niepewności dla zmiennych?

Mam urządzenie GPS, które wyprowadza pomiar hałasu za pomocą macierzy kowariancji :ΣΣ\Sigma Σ = ⎡⎣⎢σx xσyxσx zσx yσyyσyzσx zσyzσzz⎤⎦⎥Σ=[σxxσxyσxzσyxσyyσyzσxzσyzσzz]\Sigma = \left[\begin{matrix} \sigma_{xx} & \sigma_{xy} & \sigma_{xz} \\ \sigma_{yx} & \sigma_{yy} & \sigma_{yz} \\ \sigma_{xz} & \sigma_{yz} & \sigma_{zz} \end{matrix}\right] (tam też zaangażowany ale zignorujmy że na sekundę).ttt Załóżmy, że chcę …

16 covariance measurement-error uncertainty

2

Jeśli „Błąd standardowy” i „Przedziały ufności” mierzą precyzję pomiaru, to jakie są pomiary dokładności?

W książce „Biostatystyka manekinów” na stronie 40 czytam: Błąd standardowy (w skrócie SE) jest jednym ze sposobów wskazania, jak dokładna jest twoja ocena lub pomiar czegoś. i Przedziały ufności stanowią kolejny sposób na wskazanie dokładności oszacowania lub pomiaru czegoś. Ale nie ma nic, co wskazywałoby na dokładność pomiaru. Pytanie: Jak …

15 confidence-interval standard-error measurement-error accuracy

1

Jaka intuicja kryje się za wymiennymi próbkami pod hipotezą zerową?

Testy permutacyjne (zwane również testem randomizacji, testem ponownej randomizacji lub testem dokładnym) są bardzo przydatne i przydają się, gdy t-testnie jest spełnione założenie o rozkładzie normalnym wymagane na przykład i gdy transformacja wartości przez ranking test nieparametryczny, Mann-Whitney-U-testktóry prowadziłby do utraty większej ilości informacji. Jednak nie należy zapominać o jednym …

15 hypothesis-testing permutation-test exchangeability r statistical-significance loess data-visualization normal-distribution pdf ggplot2 kernel-smoothing probability self-study expected-value normal-distribution prior correlation time-series regression heteroscedasticity estimation estimators fisher-information data-visualization repeated-measures binary-data panel-data mathematical-statistics coefficient-of-variation normal-distribution order-statistics regression machine-learning one-class probability estimators forecasting prediction validation finance measurement-error variance mean spatial monte-carlo data-visualization boxplot sampling uniform chi-squared goodness-of-fit probability mixture theory gaussian-mixture regression statistical-significance p-value bootstrap regression multicollinearity correlation r poisson-distribution survival regression categorical-data ordinal-data ordered-logit regression interaction time-series machine-learning forecasting cross-validation binomial multiple-comparisons simulation false-discovery-rate r clustering frequency wilcoxon-mann-whitney wilcoxon-signed-rank r svm t-test missing-data excel r numerical-integration r random-variable lme4-nlme mixed-model weighted-regression power-law errors-in-variables machine-learning classification entropy information-theory mutual-information

2

Co możesz zrobić, gdy masz zmienne predykcyjne oparte na średnich grupowych o różnych wielkościach próby?

Rozważmy klasycznego problemu analizy danych, gdzie trzeba rezultatu YiYiY_{i} i jak to jest związane z wieloma czynnikami prognostycznymi Xi1,...,XipXi1,...,XipX_{i1}, ..., X_{ip} . Podstawowym rodzajem aplikacji, o których tu mowa, jest to YiYiY_{i} jest wynikiem na poziomie grupy, takim jak wskaźnik przestępczości w mieścieiii . Predyktory są cechami na poziomie grupy, …

14 regression measurement-error errors-in-variables

1

Błąd addytywny czy błąd mnożenia?

Jestem stosunkowo nowy w statystyce i byłbym wdzięczny za pomoc w lepszym zrozumieniu tego. W mojej dziedzinie znajduje się powszechnie stosowany model formularza: P.t= Po( Vt)αPt=Po(Vt)αP_t = P_o(V_t)^\alpha Kiedy ludzie dopasowują model do danych, zwykle linearyzują go i dopasowują do poniższych log( Pt) = log( Po) + dziennik α( Vt) …

13 modeling model error curve-fitting measurement-error

3

Jak znaleźć odchylenie standardowe próbki odchylenie standardowe od rozkładu normalnego?

Wybacz mi, że coś przeoczyłem. Jestem fizykiem z rozkładem (histogramem) skupionym wokół średniej wartości zbliżonej do rozkładu normalnego. Ważną dla mnie wartością jest odchylenie standardowe tej losowej zmiennej Gaussa. Jak miałbym spróbować znaleźć błąd w odchyleniu standardowym próbki? Mam wrażenie, że ma to związek z błędem na każdym bin w …

11 normal-distribution standard-deviation error measurement-error

4

Jak konceptualizować błąd w modelu regresji?

Uczęszczam na klasę analizy danych i niektóre z moich głęboko zakorzenionych pomysłów są wstrząśnięte. Mianowicie idea, że błąd (epsilon), a także jakakolwiek inna wariancja, odnosi się tylko (tak myślałem) do grupy (próbki lub całej populacji). Teraz uczymy się, że jednym z założeń regresji jest to, że wariancja jest „taka sama …

11 regression variance error measurement-error

Pytania otagowane jako measurement-error