Pytania otagowane jako self-study

Rutynowe ćwiczenie z podręcznika, kursu lub testu stosowane na zajęciach lub do samodzielnej nauki. Polityka tej społeczności polega na „udzielaniu pomocnych wskazówek” w przypadku takich pytań, a nie na udzielaniu pełnych odpowiedzi.


3
Przykład: regresja LASSO z użyciem glmnet dla wyniku binarnego
Zaczynam bawić sięglmnet za pomocą regresji LASSO, gdzie moje wyniki zainteresowania są dychotomiczne. Poniżej utworzyłem małą próbną ramkę danych: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, 0.91, …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 


8
Pułapki w analizie szeregów czasowych
Zaczynam dopiero od samodzielnego uczenia się w analizie szeregów czasowych. Zauważyłem, że istnieje wiele potencjalnych pułapek, które nie mają zastosowania do statystyk ogólnych. Opierając się na czym są powszechne grzechy statystyczne? , Chciałbym spytać: Jakie są typowe pułapki lub grzechy statystyczne w analizie szeregów czasowych? To jest zamierzone jako wiki …

3
Interpretacja predyktora i / lub odpowiedzi transformowanej logarytmicznie
Zastanawiam się, czy ma to znaczenie w interpretacji, czy transformowane są tylko zmienne zależne, zależne i niezależne, czy tylko zmienne niezależne. Rozważ przypadek log(DV) = Intercept + B1*IV + Error Mogę interpretować IV jako wzrost procentowy, ale jak to się zmienia, kiedy mam log(DV) = Intercept + B1*log(IV) + Error …
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

3
Uogólnienie Prawa Iterowanych Oczekiwań
Ostatnio natknąłem się na tę tożsamość: E[E(Y|X,Z)|X]=E[Y|X]E[E(Y|X,Z)|X]=E[Y|X]E \left[ E \left(Y|X,Z \right) |X \right] =E \left[Y | X \right] Oczywiście jestem zaznajomiony z prostszą wersją tej reguły, a mianowicie, że ale nie byłem w stanie znaleźć uzasadnienia dla jego uogólnienie.E[E(Y|X)]=E(Y)E[E(Y|X)]=E(Y)E \left[ E \left(Y|X \right) \right]=E \left(Y\right) Byłbym wdzięczny, gdyby ktoś mógł …

4
Biorąc pod uwagę oczekiwania związane z serią Taylor (szczególnie pozostała część)
Moje pytanie dotyczy próby uzasadnienia powszechnie stosowanej metody, a mianowicie przyjęcia oczekiwanej wartości Taylor Series. Załóżmy, że mamy losową zmienną o dodatniej średniej i wariancji . Dodatkowo mamy funkcję, powiedzmy, .XXXμμ\muσ2σ2\sigma^2log(x)log⁡(x)\log(x) Po rozszerzeniu Taylora o średnio otrzymujemy gdzie, jak zwykle, to st.logXlog⁡X\log XlogX=logμ+X−μμ−12(X−μ)2μ2+13(X−μ)3ξ3X,log⁡X=log⁡μ+X−μμ−12(X−μ)2μ2+13(X−μ)3ξX3, \log X = \log\mu + \frac{X - …

5
LDA vs word2vec
Próbuję zrozumieć, jakie jest podobieństwo między Latent Dirichlet Allocation i word2vec do obliczania podobieństwa słów. Jak rozumiem, LDA odwzorowuje słowa na wektor prawdopodobieństwa ukrytych tematów, podczas gdy word2vec odwzorowuje je na wektor liczb rzeczywistych (związanych z rozkładem pojedynczej wartości punktowej wzajemnej informacji, patrz O. Levy, Y. Goldberg, „Neural Word Embedding” …

9
Jaki jest związek między
Jaki jest związek między i na poniższym wykresie? Moim zdaniem istnieje ujemny związek liniowy, ale ponieważ mamy wiele wartości odstających, związek jest bardzo słaby. Czy mam rację? Chcę się dowiedzieć, jak wyjaśnić wykresy rozrzutu.XYYYXXX

5
Czy fakt, że mój włoski syn będzie uczęszczał do szkoły podstawowej, zmieni oczekiwaną liczbę włoskich dzieci obecnych w jego klasie?
To pytanie wynika z rzeczywistej sytuacji, na którą naprawdę byłem zaskoczony odpowiedzią. Mój syn ma rozpocząć szkołę podstawową w Londynie. Ponieważ jesteśmy Włochami, byłem ciekawy, ilu włoskich dzieci uczęszcza już do szkoły. Poprosiłem o to urzędnika ds. Przyjęć podczas składania wniosku, a ona powiedziała mi, że mają średnio 2 włoskie …

6
Dlaczego mianownik estymatora kowariancji nie powinien być n-2, a nie n-1?
Mianownik (obiektywnego) estymatora wariancji jest ponieważ istnieje obserwacji i szacowany jest tylko jeden parametr.n−1n−1n-1nnn V(X)=∑ni=1(Xi−X¯¯¯¯)2n−1V(X)=∑i=1n(Xi−X¯)2n−1 \mathbb{V}\left(X\right)=\frac{\sum_{i=1}^{n}\left(X_{i}-\overline{X}\right)^{2}}{n-1} Z tego samego powodu zastanawiam się, dlaczego mianownik kowariancji nie powinien wynosić n−2n−2n-2 gdy szacuje się dwa parametry? Cov(X,Y)=∑ni=1(Xi−X¯¯¯¯)(Yi−Y¯¯¯¯)n−1Cov(X,Y)=∑i=1n(Xi−X¯)(Yi−Y¯)n−1 \mathbb{Cov}\left(X, Y\right)=\frac{\sum_{i=1}^{n}\left(X_{i}-\overline{X}\right)\left(Y_{i}-\overline{Y}\right)}{n-1}

3
Jak pobrać pochodną wielowymiarowej gęstości normalnej?
Powiedzmy, że mam wielowymiarową normalną gęstość . Chcę uzyskać drugą (częściową) pochodną wrt . Nie wiem, jak pobrać pochodną macierzy.N(μ,Σ)N(μ,Σ)N(\mu, \Sigma)μμ\mu Wiki mówi, że weź pochodną element po elemencie do matrycy. Pracuję z aproksymacją Laplace'a Tryb to .Θ = μlogPN(θ)=logPN−12(θ−θ^)TΣ−1(θ−θ^).log⁡PN(θ)=log⁡PN−12(θ−θ^)TΣ−1(θ−θ^).\log{P}_{N}(\theta)=\log {P}_{N}-\frac{1}{2}{(\theta-\hat{\theta})}^{T}{\Sigma}^{-1}(\theta-\hat{\theta}) \>.θ^=μθ^=μ\hat\theta=\mu Dostałem jak do tego doszło?Σ−1=−∂2∂θ2logp(θ^|y),Σ−1=−∂2∂θ2log⁡p(θ^|y),{\Sigma}^{-1}=-\frac{{{\partial }^{2}}}{\partial {{\theta }^{2}}}\log …

3
Co oznacza wynik Akaike Information Criterion (AIC) modelu?
Widziałem tu kilka pytań na temat tego, co to znaczy dla laików, ale są one dla mnie zbyt laikalne. Próbuję matematycznie zrozumieć, co oznacza wynik AIC. Ale jednocześnie nie chcę rygorystycznego dowodu, który sprawiłby, że nie widziałbym ważniejszych punktów. Na przykład, jeśli byłby to rachunek różniczkowy, byłbym szczęśliwy z nieskończenie …

5
Znajdź oczekiwaną wartość za pomocą CDF
Zacznę od stwierdzenia, że ​​jest to zadanie domowe od samego początku. Spędziłem kilka godzin, szukając sposobu na znalezienie oczekiwanych wartości i zdecydowałem, że nic nie rozumiem. Niech XXX ma CDF F(x)=1−x−α,x≥1F(x)=1−x−α,x≥1F(x) = 1 - x^{-\alpha}, x\ge1 . Znajdź E(X)E(X)E(X) dla tych wartości dla którychαα\alphaE(X)E(X)E(X) istnieje . Nie mam pojęcia, jak …

4
Czy wynik egzaminu jest dwumianowy?
Oto proste pytanie statystyczne, które otrzymałem. Nie jestem pewien, czy to rozumiem. X = liczba zdobytych punktów na egzaminie (wielokrotny wybór i prawidłowa odpowiedź to jeden punkt). Czy X jest dwumianowy? Odpowiedź profesora brzmiała: Tak, ponieważ są tylko dobre lub złe odpowiedzi. Moja odpowiedź: Nie, ponieważ każde pytanie ma inne …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.