Statystyki i duże zbiory danych interpretation

1

Interpretacja wyników regresji logistycznej w R.

Pracuję na wielokrotnej regresji logistycznej w R użyciem glm. Zmienne predykcyjne są ciągłe i kategoryczne. Wyciąg z podsumowania modelu pokazuje, co następuje: Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) 2.451e+00 2.439e+00 1.005 0.3150 Age 5.747e-02 3.466e-02 1.658 0.0973 . BMI -7.750e-02 7.090e-02 -1.093 0.2743 ... --- Signif. codes: 0 …

13 r logistic interpretation p-value

1

Interpretowanie proporcji, które sumują się jako jedna zmienna niezależna w regresji liniowej

Znam pojęcie zmiennych kategorialnych i odpowiednie kodowanie zmiennych zastępczych, które pozwalają nam dopasować jeden poziom jako poziom podstawowy, aby uniknąć kolinearności. Znam również sposób interpretacji oszacowań parametrów z takich modeli: Przewidywana zmiana wyniku dla danego dopasowanego poziomu predyktora jakościowego w stosunku do kategorii podstawowej. Nie jestem pewien, jak interpretować zestaw …

13 regression interpretation proportion multicollinearity

1

Znaczenie osi y na wykresie częściowej zależności losowego lasu

Korzystam z RandomForestpakietu R i nie rozumiem, jak interpretować wartości osi Y na ich wykresach częściowej zależności. Dokumenty pomocnicze stwierdzają, że wykres jest „graficznym przedstawieniem marginalnego wpływu zmiennej na prawdopodobieństwo klasowe”. Nadal jednak nie rozumiem, co dokładnie reprezentuje oś y. W szczególności, co oznaczają wartości ujemne? Co to znaczy mieć …

13 r interpretation random-forest partial-plot

1

Jak interpretować wykres autokorelacji w MCMC

Zapoznam się ze statystykami bayesowskimi, czytając książkę Doing Bayesian Data Analysis autorstwa Johna K. Kruschke znaną również jako „książkę o szczeniętach”. W rozdziale 9 przedstawiono modele hierarchiczne na tym prostym przykładzie: a obserwacje Bernoulliego to 3 monety, każde 10 rzutów. Jeden pokazuje 9 głów, drugi 5 głów, a drugi 1 …

12 bayesian interpretation python mcmc autocorrelation

3

Jak mogę zinterpretować wykres procentu przycięcia w porównaniu ze średnią przyciętą?

W przypadku części zadania domowego poproszono mnie o obliczenie skróconej średniej dla zbioru danych poprzez usunięcie najmniejszej i największej obserwacji oraz o interpretację wyniku. Średnia obcięta była niższa niż średnia nieprzycięta. Z mojej interpretacji wynika, że było to spowodowane dodatnim wypaczeniem leżącego u podstaw rozkładu, więc lewy ogon jest gęstszy …

12 data-visualization interpretation mean trimmed-mean

2

Interpretacja macierzy wariancji-kowariancji

Załóżmy, że mamy model liniowy Model1i vcov(Model1)daje następującą macierz: (Intercept) latitude sea.distance altitude (Intercept) 28.898100 -23.6439000 -34.1523000 0.50790600 latitude -23.643900 19.7032500 28.4602500 -0.42471450 sea.distance -34.152300 28.4602500 42.4714500 -0.62612550 altitude 0.507906 -0.4247145 -0.6261255 0.00928242 W tym przykładzie, co faktycznie wyświetla ta macierz? Jakie założenia możemy bezpiecznie przyjąć dla naszego modelu i …

12 r interpretation multicollinearity assumptions covariance-matrix

2

Statystyki pizzy dla mas

Krótki wpis na stronie internetowej NY Times zawiera Fakty i liczby dotyczące konsumpcji pizzy w Stanach Zjednoczonych. Interesująco interesuje mnie sposób, w jaki statystyki są wykorzystywane (lub nadużywane) w celu dostarczania informacji ogółowi odbiorców, a na podstawie przedstawionych statystyk pojawiło się kilka pytań: Jeśli 1 na 8 Amerykanów zje dzisiaj …

12 interpretation descriptive-statistics

3

Intuicyjny powód, dla którego informacja dwumianowa Fishera jest odwrotnie proporcjonalna do

Myli / wieje, że dwumian ma wariancję proporcjonalną do . Odpowiednio informacja Fishera jest proporcjonalna do . Jaki jest tego powód? Dlaczego informacja Fisher jest zminimalizowana przy ? To znaczy, dlaczego wnioskowanie jest najtrudniejsze przy ?1p ( 1 - p )p(1-p)p(1-p) p=0,5p=0,51p ( 1 - p )1p(1-p)\frac{1}{p(1-p)}p = 0,5p=0,5p=0.5p = …

12 variance binomial interpretation

1

Czy mogę interpretować włączenie kwadratowego terminu do regresji logistycznej jako wskazujący punkt zwrotny?

Czy w regresji logistycznej zawierającej tylko warunki liniowe i kwadratowe, jeśli mam współczynnik liniowy i współczynnik kwadratowy , czy mogę powiedzieć, że istnieje punkt zwrotny prawdopodobieństwa na ?β 2 - β 1 / ( 2 β 2 )β1β1\beta_1β2β2\beta_2−β1/(2β2)−β1/(2β2)-\beta_1 / (2\beta_2)

12 interpretation logit polynomial

1

Interpretacja współczynników regresji LASSO

Obecnie pracuję nad budowaniem modelu predykcyjnego dla wyniku binarnego na zbiorze danych z ~ 300 zmiennymi i 800 obserwacjami. Dużo przeczytałem na tej stronie o problemach związanych z regresją krokową i dlaczego jej nie używać. Czytałem o regresji LASSO i jej możliwościach wyboru funkcji i udało mi się ją wdrożyć …

12 multiple-regression predictive-models interpretation regression-coefficients lasso

2

Interpretacja wyniku k-średnich w R

Użyłem kmeansinstrukcji R do wykonania algorytmu k-średnich w zestawie danych tęczówki Andersona. Mam pytanie dotyczące niektórych parametrów, które otrzymałem. Wyniki są następujące: Cluster means: Sepal.Length Sepal.Width Petal.Length Petal.Width 1 5.006000 3.428000 1.462000 0.246000 W takim przypadku, co oznacza „klaster”? Czy jest to średnia odległości wszystkich obiektów w klastrze? Również w …

12 r machine-learning clustering interpretation k-means

3

Efekt krańcowy modelu Probit i Logit

Czy ktoś może wyjaśnić, jak obliczyć marginalny efekt modelu Probit i Logit w kategoriach laika? Jestem nowy w statystyce i jestem zdezorientowany co do tych dwóch modeli.

12 logistic interpretation logit probit

1

Jak interpretować ujemny współczynnik regresji liniowej dla zarejestrowanej zmiennej wyniku?

Mam model regresji liniowej, w którym zmienna zależna jest rejestrowana, a zmienna niezależna jest liniowa. Współczynnik nachylenia dla kluczowej zmiennej niezależnej jest ujemny: . Nie jestem pewien, jak interpretować.- .0564-.0564-.0564 Czy używam wartości bezwzględnej, a następnie zmieniam ją na ujemną w następujący sposób: ( exp( 0,0564 ) - 1 ) …

11 linear-model interpretation regression-coefficients

2

Interpretacja wykresu QQ

Rozważ następujący kod i wynik: par(mfrow=c(3,2)) # generate random data from weibull distribution x = rweibull(20, 8, 2) # Quantile-Quantile Plot for different distributions qqPlot(x, "log-normal") qqPlot(x, "normal") qqPlot(x, "exponential", DB = TRUE) qqPlot(x, "cauchy") qqPlot(x, "weibull") qqPlot(x, "logistic") Wydaje się, że wykres QQ dla log-normal jest prawie taki sam …

11 r data-visualization interpretation qq-plot

1

Czy mogę założyć (log-) normalność dla tej próbki?

Oto wykres QQ dla mojej próbki (zwróć uwagę na logarytmiczną oś Y); :n=1000n=1000n = 1000 Jak wskazał whuber, oznacza to, że leżący u podstaw rozkład jest przekrzywiony w lewo (prawy ogon jest krótszy). shapiro.testW=0.9718W=0.9718W = 0.97185.172⋅10−135.172⋅10−135.172\cdot10^{-13}H0:the sample is normal distributedH0:the sample is normal distributedH_0 : \text{the sample is normal distributed} …

11 interpretation lognormal qq-plot

Pytania otagowane jako interpretation