Pytania otagowane jako data-transformation

Ponowne wyrażanie matematyczne, często nieliniowe, wartości danych. Dane są często przekształcane w celu spełnienia założeń modelu statystycznego lub w celu ułatwienia interpretacji wyników analizy.


2
Kanoniczna analiza korelacji z korelacją rang
Kanoniczna analiza korelacji (CCA) ma na celu maksymalizację zwykłej korelacji iloczynu Pearsona z momentem produktu (tj. Współczynnik korelacji liniowej) kombinacji liniowych dwóch zestawów danych. Rozważmy teraz fakt, że ten współczynnik korelacji mierzy tylko asocjacje liniowe - właśnie dlatego używamy na przykład współczynników korelacji Spearmana- lub Kendall- τ (ranga), które mierzą …


3
CDF podniesiony do władzy?
Jeśli FZFZF_Z jest CDF, wygląda na to, że FZ(z)αFZ(z)αF_Z(z)^\alpha ( α>0α>0\alpha \gt 0 ) również jest CDF. P: Czy to wynik standardowy? P: Czy istnieje dobry sposób na znalezienie funkcji ggg pomocą X≡g(Z)X≡g(Z)X \equiv g(Z) st FX(x)=FZ(z)αFX(x)=FZ(z)αF_X(x) = F_Z(z)^\alpha , gdzie x≡g(z)x≡g(z) x \equiv g(z) Zasadniczo mam w ręku inny …

1
Przekształć dane w pożądaną średnią i odchylenie standardowe
Szukam metody przekształcenia mojego zestawu danych z jego bieżącej średniej i standardowego odchylenia do docelowej średniej i docelowego standardowego odchylenia. Zasadniczo chcę zmniejszyć / rozszerzyć dyspersję i przeskalować wszystkie liczby do średniej. To nie działa, aby wykonać dwie oddzielne transformacje liniowe, jedną dla odchylenia standardowego, a drugą dla średniej. Jakiej …

2
Przekształcanie danych: wszystkie zmienne czy tylko niestandardowe?
W odkrywaniu statystyk Andy Fielda za pomocą SPSS stwierdza, że ​​wszystkie zmienne muszą zostać przekształcone. Jednak w publikacji: „Badanie zróżnicowanych przestrzennie zależności między użytkowaniem gruntów a jakością wody przy użyciu regresji ważonej geograficznie I: Projektowanie i ocena modelu” wyraźnie stwierdzają, że transformowane były tylko zmienne niestandardowe. Czy ta analiza jest …

1
Jak radzić sobie z kombinacją wejść binarnych i ciągłych w sieciach neuronowych?
Używam pakietu nnet w R, aby spróbować zbudować ANN, aby przewidzieć ceny nieruchomości na mieszkanie (prywatny projekt). Jestem w tym nowy i nie mam doświadczenia w matematyce, więc proszę o kontakt ze mną. Mam zmienne wejściowe, które są zarówno binarne, jak i ciągłe. Na przykład niektóre zmienne binarne, które były …



1
Jak entropia zależy od lokalizacji i skali?
Entropia ciągłego rozkładu z funkcją gęstości faff określa się jako ujemny z oczekiwaniem log( f) ,log⁡(f),\log(f), a zatem jest równa H.fa= - ∫∞- ∞log( f( x ) ) f( x ) d x .Hf=−∫−∞∞log⁡(f(x))f(x)dx.H_f = -\int_{-\infty}^{\infty} \log(f(x)) f(x)\mathrm{d}x. Także, że każdej zmiennej losowej XXX , której rozkład jest gęstości faff …

3
centrowanie i skalowanie zmiennych zastępczych
Mam zestaw danych, który zawiera zarówno zmienne jakościowe, jak i zmienne ciągłe. Poradzono mi, aby przekształcić zmienne kategorialne jako zmienne binarne dla każdego poziomu (tj. A_level1: {0,1}, A_level2: {0,1}) - Myślę, że niektórzy nazywają to „zmiennymi obojętnymi”. Mając to na uwadze, czy wprowadzanie w błąd i wyśrodkowanie całego zestawu danych …

3
Przekształcanie bardzo wypaczonych rozkładów
Załóżmy, że mam zmienną, której rozkład jest wypaczony w bardzo dużym stopniu pozytywnie, tak że pobranie logu nie będzie wystarczające, aby umieścić go w zakresie skośności dla rozkładu normalnego. Jakie są moje opcje w tym momencie? Co mogę zrobić, aby przekształcić zmienną w rozkład normalny?

4
Odpowiednik Boxplot dla dystrybucji o grubych ogonach?
W przypadku normalnie dystrybuowanych danych wykresy pudełkowe są świetnym sposobem na szybką wizualizację mediany i rozprzestrzeniania się danych, a także obecności jakichkolwiek wartości odstających. Jednak w przypadku bardziej ciężkich rozkładów wiele punktów jest pokazanych jako wartości odstające, ponieważ wartości odstające są zdefiniowane jako znajdujące się poza stałym współczynnikiem IQR, i …



Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.