Pytania otagowane jako smoothing

Metody wygładzania w analizie danych, takie jak splajny lub wygładzanie jądra, również wygładzają regresję, np. Lowess.


2
Wybór przepustowości dla estymatorów gęstości jądra
W przypadku jednowymiarowych estymatorów gęstości jądra (KDE) używam reguły Silvermana do obliczania hhh : 0,9 min ( s d, JaQ R / 1.34 ) × n- 0,20,9min(sre,jaQR/1.34)×n-0.2\begin{equation} 0.9 \min(sd, IQR/1.34)\times n^{-0.2} \end{equation} Jakie są standardowe reguły dla wielowymiarowego KDE (przy założeniu normalnego jądra).

4
Jakie są prawidłowe wartości precyzji i przywołania w przypadkach krawędzi?
Precyzja jest zdefiniowana jako: p = true positives / (true positives + false positives) Czy jest to prawidłowe, że, jak true positivesi false positivespodejście 0, precyzja zbliża 1? To samo pytanie do przypomnienia: r = true positives / (true positives + false negatives) Obecnie wdrażam test statystyczny, w którym muszę …
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

2
Wygładzanie - kiedy go używać, a kiedy nie?
Istnieje dość stary post na blogu Williama Briggsa, który analizuje pułapki wygładzania danych i przenoszenia tych wygładzonych danych do analizy. Kluczowym argumentem jest mianowicie: Jeśli w chwili szaleństwa robisz gładkie dane szeregów czasowych i używasz ich jako danych wejściowych do innych analiz, znacznie zwiększasz prawdopodobieństwo oszukiwania się! Wynika to z …

2
Jeśli zmienne szerokości jądra są często dobre dla regresji jądra, dlaczego na ogół nie są one dobre do oszacowania gęstości jądra?
To pytanie wynika z dyskusji w innym miejscu . Zmienne jądra są często używane w regresji lokalnej. Na przykład, less jest szeroko stosowany i działa dobrze jako wygładzacz regresji, i jest oparty na jądrze o zmiennej szerokości, która dostosowuje się do rzadkości danych. Z drugiej strony zwykle uważa się, że …

3
Jak w przypadku wygładzania Kneser-Ney obsługiwane są niewidoczne słowa?
Z tego, co widziałem, formuła wygładzania Knesera-Neya (drugiego rzędu) jest w jakiś sposób podana jako P2KN(wn|wn−1)=max{C(wn−1,wn)−D,0}∑w′C(wn−1,w′)+λ(wn−1)×Pcont(wn)PKN2(wn|wn−1)=max{C(wn−1,wn)−D,0}∑w′C(wn−1,w′)+λ(wn−1)×Pcont(wn) \begin{align} P^2_{KN}(w_n|w_{n-1}) &= \frac{\max \left\{ C\left(w_{n-1}, w_n\right) - D, 0\right\}}{\sum_{w'} C\left(w_{n-1}, w'\right)} + \lambda(w_{n-1}) \times P_{cont}(w_n) \end{align} ze współczynnikiem normalizującym λ(wn−1)λ(wn−1)\lambda(w_{n-1}) podanym jako λ(wn−1)=D∑w′C(wn−1,w′)×N1+(wn−1∙)λ(wn−1)=D∑w′C(wn−1,w′)×N1+(wn−1∙) \begin{align} \lambda(w_{n-1}) &= \frac{D}{\sum_{w'} C\left(w_{n-1}, w'\right)} \times N_{1+}\left(w_{n-1}\bullet\right) \end{align} oraz …

2
Jak wygładzić dane i wymusić monotoniczność
Mam pewne dane, które chciałbym wygładzić, aby wygładzone punkty monotonicznie zmniejszały się. Moje dane gwałtownie spadają, a następnie zaczynają się wyrównywać. Oto przykład z użyciem R. df <- data.frame(x=1:10, y=c(100,41,22,10,6,7,2,1,3,1)) ggplot(df, aes(x=x, y=y))+geom_line() Jakiej dobrej techniki wygładzania mógłbym użyć? Byłoby również miło, gdybym mógł zmusić pierwszy wygładzony punkt do zbliżenia …

1
Jak dostroić wygładzanie w modelu GAM mgcv
Próbuję dowiedzieć się, jak kontrolować parametry wygładzania w modelu mgcv: gam. Mam zmienną dwumianową, którą próbuję zamodelować jako przede wszystkim funkcję współrzędnych xiy na ustalonej siatce plus kilka innych zmiennych o mniejszych wpływach. W przeszłości zbudowałem dość dobry model regresji lokalnej, używając locfit pakietu i tylko wartości (x, y). Chciałbym …
14 r  smoothing  mgcv 

4
Wygładzanie danych szeregów czasowych
Buduję aplikację na Androida, która rejestruje dane akcelerometru podczas snu, aby analizować trendy snu i opcjonalnie budzić użytkownika w pobliżu pożądanego czasu podczas snu lekkiego. Zbudowałem już komponent, który gromadzi i przechowuje dane, a także alarm. Nadal muszę stawić czoła bestii, wyświetlając i zapisując dane dotyczące snu w naprawdę znaczący …

2
Kiedy filtr Kalmana da lepsze wyniki niż zwykła średnia ruchoma?
Niedawno wdrożyłem filtr Kalmana na prostym przykładzie pomiaru położenia cząstek z losową prędkością i przyspieszeniem. Odkryłem, że filtr Kalmana działa dobrze, ale zadałem sobie pytanie, jaka jest różnica między tym a zwykłą średnią ruchomą? Odkryłem, że jeśli użyję okna z około 10 próbek, których średnia ruchoma przewyższa filtr Kalmana, i …

5
Znajdowanie punktów przegięcia w R na podstawie wygładzonych danych
Mam pewne dane, których gładko używam loess. Chciałbym znaleźć punkty przegięcia wygładzonej linii. czy to możliwe? Jestem pewien, że ktoś wymyślił wymyślną metodę rozwiązania tego ... to znaczy ... w końcu to R! Nie przeszkadza mi zmiana funkcji wygładzania, której używam. Po prostu użyłem, loessponieważ tego właśnie używałem w przeszłości. …
14 r  smoothing  loess 

2
Jak korzystać z filtra Kalmana?
Mam trajektorię obiektu w przestrzeni 2D (powierzchni). Trajektoria jest podana jako ciąg (x,y)współrzędnych. Wiem, że moje pomiary są hałaśliwe i czasami mam oczywiste wartości odstające. Chcę więc odfiltrować moje obserwacje. O ile rozumiem filtr Kalmana, robi dokładnie to, czego potrzebuję. Więc próbuję go użyć. Znalazłem tutaj implementację Pythona . A …

2
Wygładzanie Laplace'a i Dirichleta wcześniej
W artykule na Wikipedii o wygładzaniu Laplace'a (lub wygładzaniu addytywnym) mówi się, że z bayesowskiego punktu widzenia odpowiada to oczekiwanej wartości rozkładu tylnego przy użyciu symetrycznego rozkładu Dirichleta z parametrem jako wcześniejszym.αα\alpha Zastanawiam się, jak to w rzeczywistości jest prawdą. Czy ktoś mógłby mi pomóc zrozumieć, w jaki sposób te …

2
Szerokość pasma jądra w szacowaniu gęstości jądra
Robię pewne oszacowanie gęstości jądra, z ustawionymi punktami ważonymi (tj. Każda próbka ma wagę, która nie jest konieczna), w wymiarach N. Próbki te znajdują się również w przestrzeni metrycznej (tzn. Możemy zdefiniować odległość między nimi), ale nic więcej. Na przykład nie możemy określić średniej punktów próby ani odchylenia standardowego, ani …

4
Jak uzyskać wartości używane w plot.gam w mgcv?
Chciałbym dowiedzieć się o wartościach (x, y)używanych podczas kreślenia plot(b, seWithMean=TRUE)w pakiecie mgcv . Czy ktoś wie, jak mogę wyodrębnić lub obliczyć te wartości? Oto przykład: library(mgcv) set.seed(0) dat <- gamSim(1, n=400, dist="normal", scale=2) b <- gam(y~s(x0), data=dat) plot(b, seWithMean=TRUE)

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.