Analiza przeżycia modeluje dane czasu do zdarzenia, zwykle czas do śmierci lub czas awarii. Dane ocenzurowane są częstym problemem w analizach przeżycia.
Dla badań symulacyjnych mam do generowania zmiennych losowych, które wykazują prefined (populacji) korelację do istniejącej zmiennej .YYY I spojrzał w Ropakowaniach copula, a CDVinektóre mogą powodować przypadkowe wielowymiarowych rozkładów danej struktury zależności. Nie można jednak naprawić jednej z powstałych zmiennych do istniejącej zmiennej. Wszelkie pomysły i linki do istniejących funkcji …
Zastanawiałem się, czy istnieje sposób na określenie prawdopodobieństwa wystąpienia awarii (produktu), jeśli mamy 100 000 produktów w terenie przez 1 rok i bez żadnych awarii? Jakie jest prawdopodobieństwo, że jeden z następnych 10 000 sprzedanych produktów zawiedzie?
Zastanawiam się, czy są jakieś pakiety dla Pythona, które są w stanie przeprowadzić analizę przeżycia. Korzystam z pakietu przetrwania w R, ale chciałbym przenieść moją pracę do Pythona.
Robię wielowymiarową regresję Coxa, mam swoje znaczące zmienne niezależne i wartości beta. Model bardzo dobrze pasuje do moich danych. Teraz chciałbym użyć mojego modelu i przewidzieć przetrwanie nowej obserwacji. Nie jestem pewien, jak to zrobić za pomocą modelu Coxa. W regresji liniowej lub logistycznej byłoby łatwo, po prostu wstawić wartości …
Uczę się analizy przeżycia z tego postu na UCLA IDRE i potknąłem się w sekcji 1.2.1. Samouczek mówi: ... jeśli wiadomo, że czasy przeżycia są rozkładane wykładniczo , to prawdopodobieństwo zaobserwowania czasu przeżycia ... Dlaczego zakłada się, że czasy przeżycia rozkładają się wykładniczo? Wydaje mi się to bardzo nienaturalne. Dlaczego …
Szukam dobrej książki / samouczka, aby dowiedzieć się o analizie przeżycia. Interesują mnie również referencje dotyczące przeprowadzania analizy przeżycia w języku R.
Powiedzmy, że mam 1000 komponentów i zbieram dane o tym, ile razy rejestrują awarię i za każdym razem, gdy logują awarię, śledzę również, ile czasu zajęło mojemu zespołowi usunięcie problemu. Krótko mówiąc, rejestrowałem czas naprawy (w sekundach) dla każdego z tych 1000 elementów. Dane podano na końcu tego pytania. Wziąłem …
Wyjaśnię mój problem na przykładzie. Załóżmy, że chcesz przewidzieć dochód danej osoby na podstawie niektórych atrybutów: {Wiek, płeć, kraj, region, miasto}. Masz taki zestaw danych szkoleniowych train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) train CountryID RegionID CityID …
Kiedy korzystam z GAM, daje mi resztkowy DF (ostatni wiersz kodu). Co to znaczy? Wychodząc poza przykład GAM, ogólnie, czy liczba stopni swobody może być liczbą niecałkowitą?26.626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) Deviance Residuals: Min 1Q Median 3Q Max -4.1470 -1.6217 -0.8971 …
To pytanie zostało przeniesione z Mathematics Stack Exchange, ponieważ można na nie odpowiedzieć podczas weryfikacji krzyżowej. Migrował 6 lat temu . Studiowałem model Cox Proporcjonalnych Zagrożeń i to pytanie jest przerzucone w większości tekstów. Cox zaproponował dopasowanie współczynników funkcji Hazard przy użyciu metody częściowego prawdopodobieństwa, ale dlaczego nie po prostu …
Rozważ obserwacje dobrze ocenzurowane z wydarzeniami czasami . Liczba podatnych osobników w czasie wynosi , a liczba zdarzeń w czasie wynosi .t1, t2), …t1,t2,…t_1, t_2, \dotsn I I d Ijaiinjanin_ijaiirejadid_i Kaplan-Meier lub estymator produktu powstaje naturalnie jako MLE, gdy funkcja przeżycia jest funkcją krokową . Prawdopodobieństwo to a MLE to …
Precyzja jest zdefiniowana jako: p = true positives / (true positives + false positives) Czy jest to prawidłowe, że, jak true positivesi false positivespodejście 0, precyzja zbliża 1? To samo pytanie do przypomnienia: r = true positives / (true positives + false negatives) Obecnie wdrażam test statystyczny, w którym muszę …
Nie jestem pewien, jak zdecydować, czy traktować czas jako ciągły czy dyskretny w analizie przeżycia. W szczególności chcę użyć analizy przeżycia, aby zidentyfikować zmienne na poziomie dziecka i gospodarstwa domowego, które mają największą rozbieżność w ich wpływie na przeżycie chłopców i dziewcząt (do 5 roku życia). Mam zestaw danych dotyczących …
Jaka jest wartość podana w podsumowaniu modelu Coxpha w R? Na przykład,R2)R2R^2 Rsquare= 0.186 (max possible= 0.991 ) Głupio włączyłem go jako wartość a recenzent wskoczył na niego, mówiąc, że nie jest świadomy analogii statystyki z klasycznej regresji liniowej opracowanej dla modelu Coxa, a jeśli był, to proszę podać odniesienie. …
Mam zestaw danych z N ~ 5000 i brakuje mi około 1/2 co najmniej jednej ważnej zmiennej. Główną metodą analityczną będą proporcjonalne zagrożenia Coxa. Planuję zastosować wielokrotne przypisanie. Podzielę się również na pociąg i zestaw testowy. Czy należy podzielić dane, a następnie przypisać osobno, czy przypisać, a następnie podzielić? Jeżeli …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.