SPSS to statystyczny pakiet oprogramowania. Tego znacznika należy używać w przypadku dowolnego pytania na temat, które (a) dotyczy SPSS albo jako krytycznej części pytania, albo oczekiwanej odpowiedzi, a (b) nie dotyczy tylko sposobu używania SPSS.
Wiele osób korzysta z głównego narzędzia, takiego jak Excel lub inny arkusz kalkulacyjny, SPSS, Stata lub R do swoich potrzeb statystycznych. Mogą zwrócić się do konkretnego pakietu dla bardzo specjalnych potrzeb, ale wiele rzeczy można zrobić za pomocą prostego arkusza kalkulacyjnego lub ogólnego pakietu statystyk lub środowiska programowania statystyk. Zawsze …
Mi się, że nie mogą być ujemne, jak to jest kwadratem R. Jednakże uruchomiony prostą regresję liniową w SPSS z jedną zmienną niezależną i zmienną zależną. Moje wyjście SPSS dają mi ujemną wartość R 2 . Jeśli nie było obliczyć tego ręką z R wówczas R 2 to pozytywny. Co …
Próbowałem odtworzyć niektóre badania (używając PCA) z SPSS w R. Z mojego doświadczenia wynika, że principal() funkcja z pakietu psychbyła jedyną funkcją, która się zbliżyła (lub jeśli moja pamięć służy mi dobrze, martwa), aby dopasować wynik. Aby dopasować te same wyniki co w SPSS, musiałem użyć parametru principal(..., rotate = …
Zakończyłem analizę danych i uzyskałem „statystycznie znaczące wyniki”, co jest zgodne z moją hipotezą. Jednak student statystyki powiedział mi, że jest to przedwczesny wniosek. Dlaczego? Czy w moim raporcie jest coś jeszcze?
Zastanawiam się, czy ma to znaczenie w interpretacji, czy transformowane są tylko zmienne zależne, zależne i niezależne, czy tylko zmienne niezależne. Rozważ przypadek log(DV) = Intercept + B1*IV + Error Mogę interpretować IV jako wzrost procentowy, ale jak to się zmienia, kiedy mam log(DV) = Intercept + B1*log(IV) + Error …
Drodzy wszyscy - zauważyłem coś dziwnego, czego nie potrafię wyjaśnić, prawda? Podsumowując: ręczne podejście do obliczania przedziału ufności w modelu regresji logistycznej oraz funkcja R confint()dają różne wyniki. Przechodziłem przez regresję logistyczną stosowaną przez Hosmer & Lemeshow (2. edycja). W trzecim rozdziale znajduje się przykład obliczenia ilorazu szans i 95% …
Mam zestaw danych z dużą liczbą odpowiedzi Tak / Nie. Czy mogę korzystać z głównych składników (PCA) lub innych analiz redukcji danych (takich jak analiza czynnikowa) dla tego rodzaju danych? Proszę doradzić, jak mam to zrobić za pomocą SPSS.
Wyjaśnię mój problem na przykładzie. Załóżmy, że chcesz przewidzieć dochód danej osoby na podstawie niektórych atrybutów: {Wiek, płeć, kraj, region, miasto}. Masz taki zestaw danych szkoleniowych train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) train CountryID RegionID CityID …
SPSS oferuje kilka metod ekstrakcji czynników: Główne składniki (które wcale nie są analizą czynnikową) Nieważone najmniejsze kwadraty Uogólnione najmniejsze kwadraty Maksymalne prawdopodobieństwo Głównej osi Faktoring alfa Faktoring obrazu Ignorując pierwszą metodę, która nie jest analizą czynnikową (ale analizą głównego składnika, PCA), która z tych metod jest „najlepsza”? Jakie są względne …
Nauczono mnie, aby stosować dokładny test Fishera tylko w tabelach awaryjnych, które były 2x2. Pytania: Czy sam Fisher kiedykolwiek przewidywał, że ten test zostanie zastosowany w tabelach większych niż 2x2 (Zdaję sobie sprawę z opowieści o tym, że opracował test, próbując zgadnąć, czy stara kobieta wiedziała, czy do herbaty dodano …
Właśnie natknąłem się na ten artykuł , który opisuje, jak obliczyć powtarzalność (aka niezawodność, aka korelacja wewnątrzklasowa) pomiaru za pomocą modelowania efektów mieszanych. Kod R byłby następujący: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute the unadjusted repeatability …
Szukam informacji na temat różnicy między regresją dwumianową, ujemną dwumianową i regresją Poissona i dla jakich sytuacji ta regresja najlepiej pasuje. Czy są jakieś testy, które mogę wykonać w SPSS, które mogą mi powiedzieć, która z tych regresji jest najlepsza w mojej sytuacji? Ponadto, jak uruchomić Poissona lub dwumian ujemny …
Korzystam z klasyfikacji drzewa decyzyjnego za pomocą SPSS na zestawie danych z około 20 predyktorami (kategorycznie z kilkoma kategoriami). CHAID (chi-kwadrat automatyczne wykrywanie interakcji) i CRT / CART (drzewa klasyfikacji i regresji) dają mi różne drzewa. Czy ktoś może wyjaśnić względne zalety CHAID vs CRT? Jakie są konsekwencje korzystania z …
Mam pytanie dotyczące analizy skupień. Istnieje 3000 firm, które muszą być grupowane w zależności od zużycia energii przez 5 lat. Każda firma ma wartości dla każdej godziny przez 5 lat. Chciałbym dowiedzieć się, czy niektóre firmy mają taki sam wzorzec mocy użytkowej w danym okresie. Wyniki należy wykorzystać do codziennego …
Jak rozumiem, w PCA opartym na korelacjach otrzymujemy ładunki czynnikowe (= główny składnik w tym przypadku), które są niczym innym jak korelacjami między zmiennymi i czynnikami. Teraz, gdy muszę wygenerować wyniki czynnikowe w SPSS, mogę bezpośrednio uzyskać wyniki czynnikowe każdego respondenta dla każdego czynnika. Zauważyłem również, że jeśli pomnożę „ …
Precyzja jest zdefiniowana jako: p = true positives / (true positives + false positives) Czy jest to prawidłowe, że, jak true positivesi false positivespodejście 0, precyzja zbliża 1? To samo pytanie do przypomnienia: r = true positives / (true positives + false negatives) Obecnie wdrażam test statystyczny, w którym muszę …
Mam 82 respondentów w 2 grupach (43 w grupie A i 39 w grupie B), którzy wypełnili ankietę obejmującą 65 pytań Likerta w zakresie od 1 do 5 (zdecydowanie się zgadzam - zdecydowanie się nie zgadzam). Mam zatem ramkę danych z 66 kolumnami (1 dla każdego pytania + 1 wskazująca …
Mam problem z normalnością niektórych danych, które mam: Zrobiłem test Kołmogorowa, który mówi, że nie jest normalne z p = 0,0000, nie rozumiem: skośność mojej dystrybucji = -. 497, i kurtoza = -0,024 Oto fabuła mojej dystrybucji, która wygląda bardzo normalnie ... (Mam trzy wyniki i każdy z nich nie …
Próbuję wykonać regresję danych heteroscedastycznych, w których próbuję przewidzieć wariancje błędów, a także wartości średnie w odniesieniu do modelu liniowego. Coś takiego: y(x,t)ξ(x,t)y¯(x,t)σ(x,t)=y¯(x,t)+ξ(x,t),∼N(0,σ(x,t)),=y0+ax+bt,=σ0+cx+dt.y(x,t)=y¯(x,t)+ξ(x,t),ξ(x,t)∼N(0,σ(x,t)),y¯(x,t)=y0+ax+bt,σ(x,t)=σ0+cx+dt.\begin{align}\\ y\left(x,t\right) &= \bar{y}\left(x,t\right)+\xi\left(x,t\right),\\ \xi\left(x,t\right) &\sim N\left(0,\sigma\left(x,t\right)\right),\\ \bar{y}\left(x,t\right) &= y_{0}+ax+bt,\\ \sigma\left(x,t\right) &= \sigma_{0}+cx+dt. \end{align} Słowami, dane składa się z powtarzalnych pomiarów przy różnych wartościach i . Sądzę pomiary …
Jestem absolwentem informatyki. Przeprowadziłem eksploracyjną analizę czynników dla projektu badawczego. Moi koledzy (którzy prowadzą projekt) używają SPSS, podczas gdy ja wolę używać R. To nie miało znaczenia, dopóki nie odkryliśmy dużej rozbieżności między dwoma pakietami statystycznymi. Używamy faktoringu osi głównej jako metody ekstrakcji (pamiętaj, że jestem świadomy różnicy między PCA …
Dopasowuję krokową regresję logistyczną dla zestawu danych w SPSS. W procedurze dopasowuję mój model do losowego podzbioru, który jest ok. 60% całej próby, co stanowi około 330 przypadków. Interesujące jest dla mnie to, że za każdym razem, gdy ponownie próbkuję moje dane, pojawiają się różne zmienne w końcowym modelu. Kilka …
Chciałbym użyć imputacji do zastąpienia brakujących wartości w moim zbiorze danych z pewnymi ograniczeniami. Na przykład chciałbym, aby zmienna przypisana x1była większa lub równa sumie moich dwóch innych zmiennych, powiedzmy x2i x3. Chcę też x3zostać przypisany przez jeden 0lub >= 14i chcę x2zostać przypisany przez jeden 0lub >= 16. Próbowałem …
Mam zestaw danych szeregów czasowych, do którego próbuję dopasować ukryty model Markowa (HMM) w celu oszacowania liczby stanów ukrytych w danych. Mój pseudo-kod do tego jest następujący: for( i in 2 : max_number_of_states ){ ... calculate HMM with i states ... optimal_number_of_states = "model with smallest BIC" ... } Teraz, …
Wygląda na to, że możesz użyć kodowania dla jednej zmiennej jakościowej, ale mam dwie zmienne jakościowe i jedną zmienną predykcyjną ciągłą. Czy mogę użyć do tego wielokrotnej regresji w SPSS, a jeśli tak, to w jaki sposób? dzięki!
Pełne ujawnienie: To zadanie domowe. Zamieściłem link do zestawu danych ( http://www.bertelsen.ca/R/logistic-regression.sav ) Moim celem jest zmaksymalizowanie prognozy osób spłacających zaległości kredytowe w tym zbiorze danych. Każdy model, który do tej pory wymyśliłem, przewiduje> 90% domyślnych, ale <40% domyślnych, co daje ogólną skuteczność klasyfikacji ~ 80%. Zastanawiam się więc, czy …
Przeprowadziłem test Kruskala Wallisa i dla niektórych pytań wartość p nie jest znacząca. Czy zgłosiłbym to w ten sam sposób, jakby był znaczący, podając wartość df, statystykę testową i wartość p? Byłoby więc coś takiego: przeprowadzono test Kruskala Wallisa, ale stwierdzono, że wyniki nie są znaczące H (3) = 2,119, …
Mam pewne dane porządkowe, które zwykle nie są dystrybuowane, więc postanowiłem przeprowadzić testy nieparametryczne przy użyciu testu U Manna-Whitneya. Patrzę na różnice między grupami dla siedmiu wyników - te wyniki to 0, 1, 2 lub 3 dla każdego przedmiotu. Trudno mi znaleźć sposób na wyświetlenie moich danych! Jeśli przedstawię dane …
Używając Amelii w R, uzyskałem wiele przypisanych zestawów danych. Następnie wykonałem test z powtarzanymi pomiarami w SPSS. Teraz chcę połączyć wyniki testu. Wiem, że mogę używać reguł Rubina (zaimplementowanych w dowolnym pakiecie wielokrotnej imputacji w R) do łączenia średnich i standardowych błędów, ale jak mam łączyć wartości p? Czy to …
Przeprowadzono ankietę, w której ludzie wybrali to, czego używają do wywołania określonej buźki, i wjechali do kraju pochodzenia. Przekodowałem odpowiedzi tekstowe na numeryczne. Jaką formę analizy należy zastosować (najlepiej w SPSS), aby sprawdzić poziom korelacji między tym, skąd pochodzą ludzie, a reprezentacjami, które wybrali?
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.