Pytania otagowane jako assumptions

Odnosi się do warunków, w których procedura statystyczna daje prawidłowe oszacowania i / lub wnioskowanie. Na przykład wiele technik statystycznych wymaga założenia, że ​​dane są w jakiś sposób losowo próbkowane. Teoretyczne wyniki dotyczące estymatorów zwykle wymagają założeń dotyczących mechanizmu generowania danych.

6
Wielkość próby regresji logistycznej?
Chcę stworzyć model logistyczny z moich danych ankietowych. To niewielka ankieta dotycząca czterech kolonii mieszkalnych, w której przeprowadzono wywiad tylko z 154 respondentami. Moja zmienna zależna to „zadowalające przejście do pracy”. Stwierdziłem, że spośród 154 respondentów 73 stwierdziło, że zadowalająco przeszły do ​​pracy, a reszta nie. Zatem zmienna zależna ma …

4
Sprawdzanie założeń mieszanych modeli lmer / lme w R.
Przeprowadziłem powtarzający się projekt, w którym przetestowałem 30 mężczyzn i 30 kobiet w trzech różnych zadaniach. Chcę zrozumieć, jak różni się zachowanie mężczyzn i kobiet i jak to zależy od zadania. Użyłem zarówno pakietu lmer, jak i lme4, aby to zbadać, jednak utknąłem przy próbie sprawdzenia założeń dla każdej z …


5
Założenia modeli liniowych i co zrobić, jeśli reszty nie są normalnie rozłożone
Jestem trochę zdezorientowany, jakie są założenia regresji liniowej. Do tej pory sprawdziłem, czy: wszystkie zmienne objaśniające korelowały liniowo ze zmienną odpowiedzi. (Tak było) między zmiennymi objaśniającymi była jakakolwiek kolinearność. (była niewielka kolinearność). odległości Cooka od punktów danych mojego modelu są mniejsze niż 1 (tak jest, wszystkie odległości są mniejsze niż …

4
Różnica między założeniami leżącymi u podstaw korelacji a regresywnymi testami nachylenia istotności
Moje pytanie wyrosło z dyskusji z @whuber w komentarzach do innego pytania . W szczególności komentarz @whuber był następujący: Jednym z powodów, dla których może cię zaskoczyć, jest to, że założenia leżące u podstaw testu korelacji i testu nachylenia regresji są różne - więc nawet jeśli rozumiemy, że korelacja i …

2
Dlaczego normalność reszt jest „w ogóle nieistotna” w celu oszacowania linii regresji?
Gelman i Hill (2006) piszą na s. 46, że: Założeniem regresji, które jest na ogół najmniej ważne, jest to, że błędy są zwykle rozkładane. W rzeczywistości, w celu oszacowania linii regresji (w porównaniu z przewidywaniem poszczególnych punktów danych), założenie normalności nie jest wcale ważne. Zatem, w przeciwieństwie do wielu podręczników …

2
Jakie są założenia regresji grzbietu i jak je przetestować?
Rozważmy standardowy model regresji wielokrotnej gdzie , więc normalność, homoscedastyczność i nieskorelacja błędów pozostają w mocy.Y= Xβ+ εY=Xβ+εY=X\beta+\varepsilonε ∼ N( 0 , σ2)jan)ε∼N(0,σ2In)\varepsilon \sim \mathcal N(0, \sigma^2I_n) Załóżmy, że wykonujemy regresję grzbietu, dodając tę ​​samą niewielką ilość do wszystkich elementów przekątnej :XXX βr i d g e= [ X′X+ k …

5
Założenia regresji wielokrotnej: czym różni się założenie normalności od założenia o stałej wariancji?
Przeczytałem, że są to warunki korzystania z modelu regresji wielokrotnej: reszty modelu są prawie normalne, zmienność reszt jest prawie stała reszty są niezależne i każda zmienna jest liniowo powiązana z wynikiem. Czym różnią się 1 i 2? Możesz go zobaczyć tutaj: Tak więc powyższy wykres mówi, że reszta, która wynosi …


2
Wybieranie między testem i testem
Tło: Przedstawiam kolegom w pracy prezentację na temat testowania hipotez i rozumiem większość z nich dobrze, ale jest jeden aspekt, który wiążę się w węzły, próbując zrozumieć i wyjaśnić innym. Tak myślę, że wiem (proszę poprawić, jeśli źle!) Statystyki, które byłyby normalne, gdyby wariancja była znana, postępuj zgodnie z rozkładem …

4
W praktyce, w jaki sposób ludzie obsługują ANOVA, gdy dane nie spełniają założeń?
To nie jest pytanie ściśle statystyczne - mogę przeczytać wszystkie podręczniki dotyczące założeń ANOVA - Staram się dowiedzieć, jak prawdziwi pracujący analitycy radzą sobie z danymi, które nie do końca spełniają założenia. Przeszedłem wiele pytań na tej stronie w poszukiwaniu odpowiedzi i ciągle znajduję posty o tym, kiedy nie używać …

1
Modelowanie predykcyjne - czy powinniśmy dbać o modelowanie mieszane?
Czy w przypadku modelowania predykcyjnego musimy zajmować się pojęciami statystycznymi, takimi jak efekty losowe i nie- niezależność obserwacji (powtarzane pomiary)? Na przykład.... Mam dane z 5 kampanii mailowych (które miały miejsce w ciągu roku) z różnymi atrybutami i flagą do zakupu. Idealnie byłoby użyć wszystkich tych danych łącznie, aby zbudować …

2
Czy istnieje założenie regresji logistycznej?
Czy istnieje założenie dotyczące zmiennej odpowiedzi regresji logistycznej? Załóżmy na przykład, że mamy punktów danych. Wygląda na to, że odpowiedź pochodzi z dystrybucji Bernoulliego z . Dlatego powinniśmy mieć rozkładów Bernoulliego z innym parametrem .100010001000YiYiY_ipi=logit(β0+β1xi)pi=logit(β0+β1xi)p_i=\text{logit}(\beta_0+\beta_1 x_i)100010001000ppp Są więc „niezależni”, ale nie są „identyczni”. Czy mam rację? PS. Nauczyłem się regresji …

1
Założenia LASSO
W scenariuszu regresji LASSO, w którym y=Xβ+ϵy=Xβ+ϵy= X \beta + \epsilon , a oszacowania LASSO są podane przez następujący problem optymalizacji minβ||y−Xβ||+τ||β||1minβ||y−Xβ||+τ||β||1 \min_\beta ||y - X \beta|| + \tau||\beta||_1 Czy są jakieś założenia dystrybucyjne dotyczące ϵϵ\epsilon ? W scenariuszu OLS można oczekiwać, że ϵϵ\epsilon są niezależne i zwykle dystrybuowane. Czy …

4
Założenia analizy skupień
Przepraszam za podstawowe pytanie, jestem nowy w tej formie analizy i jak dotąd mam bardzo ograniczone rozumienie zasad. Zastanawiałem się tylko, czy wiele z parametrycznych założeń dla testów wielowymiarowych / jednowymiarowych ma zastosowanie do analizy skupień? Wiele źródeł informacji, które przeczytałem na temat analizy skupień, nie określa żadnych założeń. Szczególnie …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.