Pytania otagowane jako convergence

Zbieżność ogólnie oznacza, że ​​sekwencja określonej ilości próbki zbliża się do stałej, gdy wielkość próbki dąży do nieskończoności. Zbieżność jest również właściwością iteracyjnego algorytmu stabilizującego na jakiejś wartości celu.


1
Czy stopnie swobody mogą być liczbą niecałkowitą?
Kiedy korzystam z GAM, daje mi resztkowy DF (ostatni wiersz kodu). Co to znaczy? Wychodząc poza przykład GAM, ogólnie, czy liczba stopni swobody może być liczbą niecałkowitą?26.626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) Deviance Residuals: Min 1Q Median 3Q Max -4.1470 -1.6217 -0.8971 …
27 r  degrees-of-freedom  gam  machine-learning  pca  lasso  probability  self-study  bootstrap  expected-value  regression  machine-learning  linear-model  probability  simulation  random-generation  machine-learning  distributions  svm  libsvm  classification  pca  multivariate-analysis  feature-selection  archaeology  r  regression  dataset  simulation  r  regression  time-series  forecasting  predictive-models  r  mean  sem  lavaan  machine-learning  regularization  regression  conv-neural-network  convolution  classification  deep-learning  conv-neural-network  regression  categorical-data  econometrics  r  confirmatory-factor  scale-invariance  self-study  unbiased-estimator  mse  regression  residuals  sampling  random-variable  sample  probability  random-variable  convergence  r  survival  weibull  references  autocorrelation  hypothesis-testing  distributions  correlation  regression  statistical-significance  regression-coefficients  univariate  categorical-data  chi-squared  regression  machine-learning  multiple-regression  categorical-data  linear-model  pca  factor-analysis  factor-rotation  classification  scikit-learn  logistic  p-value  regression  panel-data  multilevel-analysis  variance  bootstrap  bias  probability  r  distributions  interquartile  time-series  hypothesis-testing  normal-distribution  normality-assumption  kurtosis  arima  panel-data  stata  clustered-standard-errors  machine-learning  optimization  lasso  multivariate-analysis  ancova  machine-learning  cross-validation 

5
Intuicyjne wyjaśnienie zbieżności w rozkładzie i zbieżności w prawdopodobieństwie
Jaka jest intuicyjna różnica między zmienną losową zbieżną w prawdopodobieństwie a zmienną losową zbieżną w rozkładzie? Przeczytałem wiele definicji i równań matematycznych, ale to naprawdę nie pomaga. (Należy pamiętać, że jestem studentem licencjackim studiującym ekonometrię). W jaki sposób zmienna losowa może zbiegać się w jedną liczbę, ale także w rozkład?

2
Dlaczego algorytm Expectation Maximization gwarantuje osiągnięcie zbieżności z lokalnym optimum?
Przeczytałem kilka wyjaśnień algorytmu EM (np. Z Bishop's Pattern Recognition and Machine Learning oraz z Roger i Gerolami First Course on Machine Learning). Wyprowadzenie EM jest w porządku, rozumiem to. Rozumiem również, dlaczego algorytm obejmuje coś: na każdym etapie poprawiamy wynik, a prawdopodobieństwo jest ograniczone przez 1,0, więc używając prostego …

2
Teoria ekstremalnych wartości - pokaż: Normalna do Gumbela
Maksymalna wartość iid Standardnormals zbieżny do standardowa Gumbela rozdzielający według wartości ekstremalnej teorii .X1,…,Xn.∼X1,…,Xn.∼X_1,\dots,X_n. \sim Jak możemy to pokazać? Mamy P(maxXi≤x)=P(X1≤x,…,Xn≤x)=P(X1≤x)⋯P(Xn≤x)=F(x)nP(maxXi≤x)=P(X1≤x,…,Xn≤x)=P(X1≤x)⋯P(Xn≤x)=F(x)nP(\max X_i \leq x) = P(X_1 \leq x, \dots, X_n \leq x) = P(X_1 \leq x) \cdots P(X_n \leq x) = F(x)^n Musimy znaleźć / wybrać an>0,bn∈Ran>0,bn∈Ra_n>0,b_n\in\mathbb{R} ciągów stałych takich, …


3
Asymptotyczna spójność z niezerową wariancją asymptotyczną - co ona reprezentuje?
Problem pojawił się wcześniej, ale chcę zadać konkretne pytanie, które będzie próbowało uzyskać odpowiedź, która wyjaśni (i sklasyfikuje): W „Asymptotics Poor Man” zachowuje się wyraźne rozróżnienie (a) sekwencja zmiennych losowych, która zbiega się w prawdopodobieństwie do stałej w przeciwieństwie do (b) sekwencja zmiennych losowych, która jest zbieżna w prawdopodobieństwie ze …

1
Centralne twierdzenie graniczne i prawo wielkich liczb
Mam pytanie od bardzo początkującego dotyczące centralnego twierdzenia granicznego (CLT): Wiem, że CLT stwierdza, że ​​średnia iid zmiennych losowych ma w przybliżeniu rozkład normalny (dla , gdzie n jest indeksem sum) lub że znormalizowana zmienna losowa miałaby standardowy rozkład normalny.n → ∞n→∞n \to \inftynnn Teraz prawo dużej liczby mówi z …


5
Dlaczego k-znaczy nie daje globalnego minimum?
Czytałem, że algorytm k-średnich jest zbieżny tylko z lokalnym minimum, a nie globalnym minimum. Dlaczego to? Mogę logicznie myśleć o tym, w jaki sposób inicjalizacja mogłaby wpłynąć na końcowe grupowanie i istnieje możliwość nieoptymalnego grupowania, ale nie znalazłem niczego, co matematycznie to udowodni. Ponadto, dlaczego k-oznacza proces iteracyjny? Czy nie …

2
Dynamiczny widok centralnego twierdzenia o granicy?
(Pierwotnie opublikowane na MSE.) Widziałem wiele heurystycznych dyskusji na temat klasycznego centralnego twierdzenia granicznego mówiących o rozkładzie normalnym (lub dowolnym rozkładzie stabilnym) jako „atraktorze” w przestrzeni gęstości prawdopodobieństwa. Weźmy na przykład następujące zdania na początku traktowania Wikipedii : W bardziej ogólnym zastosowaniu, centralnym twierdzeniem granicznym jest dowolny zestaw twierdzeń o …

1
Znaczenie ostrzeżenia o konwergencji w blasku
Korzystam z glmerfunkcji z lme4pakietu w R i używam bobyqaoptymalizatora (tj. Domyślnego w moim przypadku). Dostaję ostrzeżenie i jestem ciekaw, co to znaczy. Warning message: In optwrap(optimizer, devfun, start, rho$lower, control = control, : convergence code 3 from bobyqa: bobyqa -- a trust region step failed to reduce q Szukałem …

1
Stan
Przeglądałem dokumentację Stana, którą można pobrać stąd . Byłem szczególnie zainteresowany ich wdrożeniem diagnostyki Gelmana-Rubina. Oryginalny artykuł Gelman i Rubin (1992) definiuje potencjalny współczynnik redukcji skali (PSRF) w następujący sposób: Niech Xi,1,…,Xi,NXi,1,…,Xi,NX_{i,1}, \dots , X_{i,N} będą iii -tym łańcuchem Markowa, z którego pobrano próbkę, i niech będzie próbka z całych …

1
Regresja wielowymiarowa: dlaczego wyjątkowy?
Próbuję przeczytać o badaniach w dziedzinie regresji wielowymiarowej; gdy jest większe niż , to znaczy p >> n . Wydaje się, że termin \ log p / n pojawia się często w odniesieniu do wskaźnika konwergencji dla estymatorów regresji.pppnnnp>>np>>np >> nlogp/nlog⁡p/n\log p/n Na przykład tutaj równanie (17) mówi, że dopasowanie …

1
Czy prawdopodobieństwo dziennika w GLM gwarantuje konwergencję do maksymalnych wartości globalnych?
Moje pytania to: Czy uogólnione modele liniowe (GLM) są gwarantowane, że osiągną globalne maksimum? Jeśli tak, to dlaczego? Co więcej, jakie są ograniczenia funkcji łączenia w celu zapewnienia wypukłości? Rozumiem GLM, że maksymalizują one wysoce nieliniową funkcję wiarygodności. Tak więc wyobrażam sobie, że istnieje kilka lokalnych maksimów, a zestaw parametrów, …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.