Próbuję uzyskać globalną perspektywę na niektóre z podstawowych pomysłów w uczeniu maszynowym i zastanawiałem się, czy istnieje kompleksowe podejście do różnych pojęć utraty (kwadrat, log, zawias, proxy itp.). Zastanawiałem się nad bardziej kompleksową, formalną prezentacją doskonałego postu Johna Langforda na temat Lant Function Semantics .
Nadal jestem całkiem nowy w uogólnionych modelach liniowych i mam problem z notacją w większości tekstów GLM, które wybrałem. Czy istnieją bardzo popularne książki GLM, które lepiej nadają się do czytelności?
Nie jestem statystykiem, ale bardzo interesuję się statystykami i chciałbym kupić książkę, aby zachować ją jako punkt odniesienia. Mam kilka książek na określone tematy (np . Elementy uczenia statystycznego for machine learning lub Bayesian Data Analysis for ... cóż, Bayesian Data Analysis :) Szukałem również bardziej ogólnej książki. Książki Freedmana …
Analizuję zestaw danych przy użyciu modelu efektów mieszanych z jednym ustalonym efektem (warunkiem) i dwoma efektami losowymi (uczestnik ze względu na projekt i parę wewnątrz przedmiotu). Model ten został wygenerowany z lme4pakietu: exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp). Następnie wykonałem test współczynnika wiarygodności tego modelu względem modelu bez ustalonego efektu (warunku) i mam znaczącą różnicę. …
Niech będzie rodziną losowych zmiennych iid przyjmujących wartości w , mających średnią i wariancję . Prosty przedział ufności dla średniej, przy użyciu ilekroć jest znany, podaje P (| \ bar X - \ mu |> \ varepsilon) \ le \ frac {\ sigma ^ 2} {n \ varepsilon ^ 2} …
Eksperymentuję z algorytmem maszyny do zwiększania gradientu za pośrednictwem caretpakietu w R. Korzystając z małego zestawu danych o przyjęciach na studia, uruchomiłem następujący kod: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine …
W obecnej formie to pytanie nie pasuje do naszego formatu pytań i odpowiedzi. Oczekujemy, że odpowiedzi poparte będą faktami, referencjami lub wiedzą fachową, ale to pytanie prawdopodobnie będzie wymagało debaty, argumentów, ankiet lub rozszerzonej dyskusji. Jeśli uważasz, że to pytanie można poprawić i ewentualnie ponownie otworzyć, odwiedź centrum pomocy w …
Myślałem o tym problemie. Zwykłą funkcją logistyczną do modelowania danych binarnych jest: Jednak czy funkcja logit, która jest krzywą w kształcie litery S, zawsze jest najlepsza do modelowania danych? Być może masz powód, by sądzić, że twoje dane nie są zgodne z normalną krzywą w kształcie litery S, ale z …
Jaki jest najlepszy gotowy do użycia klasyfikator 2 klas? Tak, myślę, że to pytanie za milion dolarów i tak, jestem świadomy twierdzenia o braku darmowego lunchu , a także przeczytałem poprzednie pytania: Jaki jest najlepszy gotowy do użycia 2-klasowy klasyfikator dla Twojej aplikacji? i najgorszy klasyfikator Nadal jestem zainteresowany czytaniem …
Mam niejasne wyczucie, czym jest metoda przekazywania wiadomości: algorytm, który buduje aproksymację do rozkładu poprzez iteracyjne budowanie aproksymacji każdego z czynników rozkładu, zależnie od wszystkich aproksymacji wszystkich innych czynników. Uważam, że oba są przykładami Przekazywanie komunikatów wariacyjnych i propagowanie oczekiwań . Co to jest algorytm przekazywania komunikatów bardziej jawnie / …
Obecnie zbieram dane do eksperymentu dotyczącego cech psychospołecznych związanych z odczuwaniem bólu. W ramach tego zbieram pomiary GSR i BP elektronicznie od moich uczestników, wraz z różnymi raportami własnymi i niejawnymi pomiarami. Mam pochodzenie psychologiczne i nie mam nic przeciwko analizie czynnikowej, modelom liniowym i analizie eksperymentalnej. Moje pytanie brzmi, …
Jako inżynier oprogramowania interesuję się takimi tematami, jak algorytmy statystyczne, eksploracja danych, uczenie maszynowe, sieci bayesowskie, algorytmy klasyfikacji, sieci neuronowe, łańcuchy Markowa, metody Monte Carlo i generowanie liczb losowych. Osobiście nie miałem przyjemności pracy z żadną z tych technik, ale musiałem pracować z oprogramowaniem, które pod maską je zastosowało i …
Mam kilka (około 1000) oszacowań i wszystkie one mają być oszacowaniami długoterminowej elastyczności. Nieco ponad połowa z nich jest szacowana za pomocą metody A, a reszta za pomocą metody B. Gdzieś czytam coś w stylu „Myślę, że metoda B ocenia coś zupełnie innego niż metoda A, ponieważ szacunki są znacznie …
Często zadaję sobie takie pytania, jak: „Wiem, że ta zmienna leży w a większość masy leży w a następnie stale spada w kierunku 1. Jakiego rozkładu mogę użyć do jej modelowania? „( 0 , 1 ) ( 0 , .20 )xxx( 0 , 1 )(0,1)(0,1)( 0 , .20 )(0,.20)(0,.20) W …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.