To tylko przykład, na który natknąłem się kilka razy, więc nie mam żadnych przykładowych danych. Uruchamianie modelu regresji liniowej w R: a.lm = lm(Y ~ x1 + x2) x1jest zmienną ciągłą. x2jest kategoryczny i ma trzy wartości, np. „Niska”, „Średnia” i „Wysoka”. Jednak dane wyjściowe podane przez R byłyby mniej …
Przykłady: w opisie stanowiska mam zdanie: „Starszy inżynier Java w Wielkiej Brytanii”. Chcę użyć modelu głębokiego uczenia się, aby przewidzieć go jako 2 kategorie: English i IT jobs. Jeśli użyję tradycyjnego modelu klasyfikacji, może on przewidzieć tylko 1 etykietę z softmaxfunkcją na ostatniej warstwie. Dlatego mogę użyć 2 modelowych sieci …
Jakie są alternatywy dla testu chi-kwadrat dla zmiennych kategorialnych z tabelami większymi niż 2 x 2 i komórkami o liczbie mniejszej niż 5, jeśli nie chcę scalać klas?
Mam zestaw danych ze zmienną ciągłą i binarną zmienną docelową (0 i 1). Muszę zdyskretyzować zmienne ciągłe (w przypadku regresji logistycznej) w odniesieniu do zmiennej docelowej oraz z ograniczeniem, że częstotliwość obserwacji w każdym przedziale powinna być zrównoważona. Próbowałem algorytmów uczenia maszynowego, takich jak Chi Merge, drzewa decyzyjne. Scalanie chi …
Patrzę na arkusz programu Excel, który twierdzi, że oblicza χ2)χ2\chi^2, ale nie rozpoznaję tego sposobu i zastanawiałem się, czy coś mi umknęło. Oto dane, które analizuje: +------------------+----------+----------+ | Total Population | Observed | Expected | +------------------+----------+----------+ | 2000 | 42 | 32.5 | | 2000 | 42 | 32.5 | …
Chciałbym zrozumieć zastosowanie symulacji Monte Carlo w chisq.test()funkcji w R. Mam zmienną jakościową, która ma 128 poziomów / klas. Moja próbka to 26 (nie mogłem próbkować więcej „osób”). Więc oczywiście będę mieć kilka poziomów z 0 „osobami”. Ale faktem jest, że mam bardzo małą liczbę klas reprezentowanych z 127 możliwych. …
Mam zestaw danych, w którym testuję pod kątem znaczących różnic między trzema populacjami w odniesieniu do około 50 różnych zmiennych. Robię to z jednej strony za pomocą testów Kruskala-Wallisa, az drugiej za pomocą testów współczynnika prawdopodobieństwa zagnieżdżonych modeli GLM (z populacją i bez jako niezależna zmienna). W rezultacie, mam listę …
Mój zestaw danych obejmuje zarówno całkowitą śmiertelność, jak i przeżycie organizmu w trzech typach miejsc: przybrzeżnym, śródokanałowym i przybrzeżnym. Liczby w poniższej tabeli reprezentują liczbę witryn. 100% Mortality 100% Survival Inshore 30 31 Midchannel 10 20 Offshore 1 10 Chciałbym wiedzieć, czy liczba witryn, w których wystąpiła 100% śmiertelność, jest …
Mam więc 16 prób, w których próbuję uwierzytelnić osobę z cechy biometrycznej za pomocą Hamminga. Mój próg jest ustawiony na 3,5. Moje dane są poniżej i tylko próba 1 jest prawdziwie pozytywna: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 7 0.47 8 …
Chciałbym zebrać informacje od ludzi w terenie na temat korekty ciągłości Yatesa dla tabel awaryjności 2 x 2. Artykuł w Wikipedii wspomina, że może się za bardzo dostosować, dlatego jest używany tylko w ograniczonym sensie. Związane post tutaj nie oferuje znacznie głębszy wgląd. Więc co myślisz o ludziach, którzy regularnie …
Opisana tutaj procedura Marascuilo wydaje się być testem, który rozwiązuje problem wielokrotnych porównań proporcji, gdy chcesz sprawdzić, które konkretne proporcje różnią się od siebie po odrzuceniu wartości zerowej w ogólnym teście chi-kwadrat. Jednak nie znam tego testu. Więc moje pytania: O jakie niuanse (jeśli w ogóle) powinienem się martwić podczas …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.