Technika pobierania próbek, w której populację będącą przedmiotem zainteresowania dzieli się na podzbiory („warstwy”) na podstawie cech znanych wszystkich jednostek przed pobraniem próbek.
Jaka jest różnica między walidacją krzyżową a walidacją krzyżową ? Wikipedia mówi: W warstwowej walidacji krzyżowej k-krotnie fałdy są wybierane tak, aby średnia wartość odpowiedzi była w przybliżeniu równa we wszystkich fałdach. W przypadku klasyfikacji dychotomicznej oznacza to, że każda fałda zawiera w przybliżeniu te same proporcje dwóch rodzajów etykiet …
Powiedziano mi, że korzystne jest stosowanie warstwowej weryfikacji krzyżowej, zwłaszcza gdy klasy odpowiedzi są niezrównoważone. Jeśli jednym z celów walidacji krzyżowej jest pomoc w rozliczeniu losowości naszej oryginalnej próbki danych treningowych, na pewno sprawienie, by każda zakładka miała taki sam rozkład klas, działałoby przeciwko temu, chyba że byłeś pewien, że …
Chciałbym wiedzieć, czy są jakieś / jakieś zalety stosowania próbkowania warstwowego zamiast próbkowania losowego, podczas dzielenia oryginalnego zestawu danych na zestaw szkoleniowy i testowy do klasyfikacji. Ponadto, czy próbkowanie warstwowe wprowadza więcej uprzedzeń do klasyfikatora niż próbkowanie losowe? Aplikacja, dla której chciałbym zastosować próbkowanie warstwowe do przygotowania danych, jest klasyfikatorem …
W Strategii modelowania regresji autorstwa Harrella (druga edycja) znajduje się sekcja (S. 20.1.7) omawiająca modele Coxa, w tym interakcję między zmienną towarzyszącą, której główny wpływ na przeżycie chcemy również oszacować (wiek w przykładzie poniżej) i zmienna towarzysząca, której głównego efektu nie chcemy oszacować (płeć w poniższym przykładzie). Konkretnie: załóżmy, że …
HOJNOŚĆ: Pełne nagroda zostanie przyznana osobie, która stanowi odniesienie do wszelkich opublikowanych papieru, który używa lub wymienia prognozy F~F~\tilde{F} poniżej. Motywacja: Ta sekcja prawdopodobnie nie jest dla ciebie ważna i podejrzewam, że nie pomoże ci zdobyć nagrody, ale ponieważ ktoś zapytał o motywację, oto nad czym pracuję. Pracuję nad problemem …
Mam więc macierz o wymiarach około 60 x 1000. Patrzę na nią jako na 60 obiektów z 1000 cechami; 60 obiektów jest pogrupowanych w 3 klasy (a, b, c). 20 obiektów w każdej klasie i znamy prawdziwą klasyfikację. Chciałbym przeprowadzić nadzorowaną naukę na tym zestawie 60 przykładów szkoleniowych. Interesuję się …
Implementacja randomForest nie pozwala na pobieranie próbek poza liczbę obserwacji, nawet w przypadku pobierania próbek z wymianą. Dlaczego to? Działa w porządku: rf <- randomForest(Species ~ ., iris, sampsize=c(1, 1, 1), replace=TRUE) rf <- randomForest(Species ~ ., iris, sampsize=3, replace=TRUE) Co chcę robić: rf <- randomForest(Species ~ ., iris, sampsize=c(51, …
Jakie są zalety i wady uruchamiania osobnych modeli w porównaniu z modelowaniem wielopoziomowym? W szczególności załóżmy, że w badaniu przebadano pacjentów zagnieżdżonych w gabinetach lekarskich zagnieżdżonych w poszczególnych krajach. Jakie są zalety / wady prowadzenia osobnych modeli dla każdego kraju w porównaniu z trójpoziomowym modelem zagnieżdżonym?
Mam GLMM w postaci: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Kiedy używam drop1(model, test="Chi"), otrzymuję inne wyniki niż w przypadku korzystania Anova(model, type="III")z pakietu samochodowego lub summary(model). Te dwa ostatnie dają te same odpowiedzi. Korzystając z wielu sfabrykowanych danych, odkryłem, że te …
Powiedzmy, że mam kilka wierszy dotyczących problemu z klasyfikacją: X1, . . .XN., YX1,...XN,YX_1, ... X_N, Y Gdzie są cechami / predyktorami, a to klasa, do której należy kombinacja cech wiersza.X1, . . . ,XN.X1,...,XNX_1, ..., X_NYYY Wiele kombinacji cech i ich klas jest powtarzanych w zestawie danych, którego używam …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.