Pytania otagowane jako data-transformation

Ponowne wyrażanie matematyczne, często nieliniowe, wartości danych. Dane są często przekształcane w celu spełnienia założeń modelu statystycznego lub w celu ułatwienia interpretacji wyników analizy.

2
Przekształcanie danych proporcji: gdy pierwiastek kwadratowy arcsin nie wystarczy
Czy istnieje (silniejsza?) Alternatywa dla transformacji pierwiastka kwadratowego arcsin dla danych procentowych / procentowych? W zbiorze danych, nad którym obecnie pracuję, znacząca heteroscedastyczność pozostaje po zastosowaniu tej transformacji, tj. Wykres wartości resztowych w stosunku do dopasowanych wartości jest nadal bardzo romboidalny. Edytowane, aby odpowiedzieć na komentarze: dane są decyzjami inwestycyjnymi …

4
Jakie są prawidłowe wartości precyzji i przywołania w przypadkach krawędzi?
Precyzja jest zdefiniowana jako: p = true positives / (true positives + false positives) Czy jest to prawidłowe, że, jak true positivesi false positivespodejście 0, precyzja zbliża 1? To samo pytanie do przypomnienia: r = true positives / (true positives + false negatives) Obecnie wdrażam test statystyczny, w którym muszę …
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 


2
Obliczanie błędu standardowego po transformacji dziennika
Rozważ losowy zestaw liczb, które są zwykle dystrybuowane: x <- rnorm(n=1000, mean=10) Chcielibyśmy poznać średnią i błąd standardowy średniej, dlatego wykonujemy następujące czynności: se <- function(x) { sd(x)/sqrt(length(x)) } mean(x) # something near 10.0 units se(x) # something near 0.03 units Świetny! Załóżmy jednak, że niekoniecznie wiemy, że nasza pierwotna …

2
Czy transformacja dziennika jest prawidłową techniką testowania danych niestandardowych?
Przeglądając artykuł, autorzy stwierdzają: „Ciągłe zmienne wyników wykazujące skośny rozkład zostały przekształcone przy użyciu logarytmów naturalnych, zanim przeprowadzono testy t w celu spełnienia wstępnych założeń normalności”. Czy jest to akceptowalny sposób analizy danych nienormalnych, szczególnie jeśli rozkład podstawowy niekoniecznie jest logarytmiczny? To może być bardzo głupie pytanie, ale nie widziałem …

3
Jak przeprowadzić izometryczną transformację logarytmiczną
Mam dane na temat zachowań ruchowych (czasu spania, siedzącego trybu życia i aktywności fizycznej), które wynoszą około 24 (jak w godzinach dziennie). Chcę utworzyć zmienną, która przechwytuje względny czas spędzony na każdym z tych zachowań - powiedziano mi, że dokonałaby tego izometryczna transformacja logarytmiczna. Wygląda na to, że powinienem użyć …


3
Co oznacza „normalizacja” i jak sprawdzić, czy próbka lub rozkład są znormalizowane?
Mam pytanie, w którym prosi się o sprawdzenie, czy rozkład jednolity ( Uniform(a,b)Unjafaorm(za,b){\rm Uniform}(a,b) ) jest znormalizowany. Po pierwsze, co to znaczy znormalizować dowolny rozkład? I po drugie, jak przejść do sprawdzenia, czy rozkład jest znormalizowany? Rozumiem, obliczając otrzymujemy znormalizowane dane , ale tutaj prosi się o sprawdzenie, czy rozkład …


4
Zmienne „normalizujące” dla SVD / PCA
Załóżmy, że mamy mierzalnych zmiennych, , wykonujemy liczbę pomiarów, a następnie chcemy przeprowadzić rozkład wyników w liczbie pojedynczej na wynikach, aby znaleźć osie największej wariancji dla punktów w przestrzeni wymiarowej. ( Uwaga: załóżmy, że środki zostały już odjęte, więc dla wszystkich .)N.N.N( a1, a2), … , AN.)(za1,za2),…,zaN.)(a_1, a_2, \ldots, a_N)M.> …

2
Wsteczna transformacja współczynników regresji
Wykonuję regresję liniową z transformowaną zmienną zależną. Dokonano następującej transformacji, aby utrzymać założenie normalności reszt. Nietransformowana zmienna zależna została ujemnie wypaczona, a następująca transformacja zbliżyła ją do normy: Y=50−Yorig−−−−−−−−√Y=50−YorigY=\sqrt{50-Y_{orig}} gdzie jest zmienną zależną w oryginalnej skali.YorigYorigY_{orig} Myślę, że warto zastosować transformację współczynników aby wrócić do oryginalnej skali. Używając następującego równania …

2
Po co logować transformację danych przed przeprowadzeniem analizy głównych składników?
Im podążam za tutorialem tutaj: http://www.r-bloggers.com/computing-and-visualizing-pca-in-r/, aby lepiej zrozumieć PCA. Samouczek używa zestawu danych Iris i stosuje transformację dziennika przed PCA: Zauważ, że w poniższym kodzie stosujemy transformację logarytmiczną do zmiennych ciągłych, zgodnie z sugestią [1], i ustawiamy centeri scalerównoważymy TRUEw wywołaniu prcompstandaryzacji zmiennych przed zastosowaniem PCA. Czy ktoś mógłby …

2
Dlaczego GLM różni się od LM z transformowaną zmienną
Jak wyjaśniono w tym podręczniku kursu (strona 1) , model liniowy można zapisać w postaci: y=β1x1+⋯+βpxp+εi,y=β1x1+⋯+βpxp+εi, y = \beta_1 x_{1} + \cdots + \beta_p x_{p} + \varepsilon_i, gdzie jest zmienną odpowiedzi, a jest zmienną objaśniającą .yyyxixix_{i}ithithi^{th} Często w celu spełnienia założeń testowych można przekształcić zmienną odpowiedzi. Na przykład, stosujemy funkcję …

2
Wyprowadzenie transformacji normalizującej dla GLM
\newcommand{\E}{\mathbb{E}} Jaka jest transformacja normalizująca dla rodziny wykładniczej pochodny? A(⋅)=∫duV1/3(μ)A(⋅)=∫duV1/3(μ)A(\cdot) = \displaystyle\int\frac{du}{V^{1/3}(\mu)} Mówiąc dokładniej : Próbowałem postępować zgodnie ze szkicem rozszerzenia Taylora na stronie 3, slajd 1 tutaj, ale mam kilka pytań. Gdy z rodziny wykładniczej, transformacja h (X) i \ kappa _i oznaczają i ^ {th} kumulant, slajdy twierdzą, …

4
Pułapki, których należy unikać podczas przekształcania danych?
Osiągnąłem silną liniową zależność między moją zmienną XXX i YYY po podwójnej transformacji odpowiedzi. Model to Y∼XY∼XY\sim X ale przekształciłem go w YX−−√∼X−−√YX∼X\sqrt{\frac{Y}{X}}\sim \sqrt{X} poprawyR2R2R^2od .19 do .76. Najwyraźniej zrobiłem porządną operację związaną z tym związkiem. Czy ktoś może dyskutować o pułapkach takich działań, takich jak niebezpieczeństwo nadmiernych przekształceń lub …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.