Support Vector Machine odnosi się do „zestawu powiązanych nadzorowanych metod uczenia się, które analizują dane i rozpoznają wzorce, stosowanych do klasyfikacji i analizy regresji”.
Próbuję klasyfikować wiadomości do różnych kategorii za pomocą SVM. Przygotowałem listę pożądanych słów / symboli z zestawu szkoleniowego. Dla każdego wektora, który reprezentuje komunikat, ustawiam odpowiedni wiersz, 1jeśli słowo jest obecne: „ciało” to: [mary, mała, jagnięca, gwiazda, migotanie] pierwsza wiadomość: „Mary miała małą owieczkę” -> [1 1 1 0 0] …
Mam 2 ogólne / bardziej teoretyczne pytanie. 1) Jestem ciekawy, jak maszyny SVM radzą sobie ze zmiennymi interakcjami podczas budowania modeli predykcyjnych. Na przykład, jeśli mam dwie funkcje f1 i f2, a cel zależy od f1, f2 i powiedzmy f1 * f2 (lub jakąś funkcję h (f1, f2)), czy SVM …
Próbuję zbudować maszynę SVM na podstawie danych szkoleniowych, w których jedna grupa jest reprezentowana bardziej niż druga. Grupy będą jednakowo reprezentowane w ostatecznych danych testowych. Dlatego chciałbym użyć class.weightsparametru e1071interfejsu pakietu R, libsvmaby zrównoważyć wpływ dwóch grup na dane treningowe. Ponieważ nie byłem pewien, jak dokładnie określić te wagi, przygotowałem …
SVM do klasyfikacji mają dla mnie intuicyjny sens: rozumiem, jak minimalizacja daje maksymalny margines. Nie rozumiem jednak tego celu w kontekście regresji. Różne teksty ( tu i tutaj ) opisują to jako maksymalizujące „płaskość”. Dlaczego mielibyśmy to zrobić? Co w regresji odpowiada koncepcji „marginesu”?||θ||2||θ||2||\theta||^2 Oto kilka prób odpowiedzi, ale żadne …
W uczeniu maszynowym (w przypadku problemów z regresją) często widzę błąd średniej kwadratowej (MSE) lub średni błąd bezwzględny (MAE) jako funkcję błędu w celu zminimalizowania (plus termin regularyzacji). Zastanawiam się, czy istnieją sytuacje, w których zastosowanie współczynnika korelacji byłoby bardziej odpowiednie? jeżeli taka sytuacja istnieje, to: W jakich sytuacjach współczynnik …
W tym pytaniu - Czy istnieje metoda konstruowania drzew decyzyjnych uwzględniająca predyktory strukturalne / hierarchiczne / wielopoziomowe? - wspominają o metodzie danych panelowych dla drzew. Czy istnieją specjalne metody danych panelowych do obsługi maszyn wektorowych i sieci neuronowych? Jeśli tak, czy możesz przytoczyć dokumenty dotyczące algorytmów i (jeśli są dostępne) …
Mam 12 pozytywnych zestawów treningowych (komórki rakowe leczone lekami z każdym z 12 różnych mechanizmów działania). Dla każdego z tych pozytywnych zestawów treningowych chciałbym wytrenować maszynę wektora nośnego, aby odróżniała ją od ujemnego zestawu o równej wielkości próbkowanego z eksperymentu. Każdy zestaw ma od 1000 do 6000 komórek, a dla …
Próbuję zrozumieć proces szkolenia maszyny wektora liniowego wsparcia . Zdaję sobie sprawę, że właściwości SMV pozwalają na ich optymalizację znacznie szybciej niż za pomocą kwadratowego solvera programistycznego, ale do celów edukacyjnych chciałbym zobaczyć, jak to działa. Dane treningowe set.seed(2015) df <- data.frame(X1=c(rnorm(5), rnorm(5)+5), X2=c(rnorm(5), rnorm(5)+3), Y=c(rep(1,5), rep(-1, 5))) df X1 …
Z mojego zrozumienia, CNN składają się z dwóch części. Pierwsza część (warstwy konw / pula), która wykonuje ekstrakcję cech, a druga część (warstwy fc), która dokonuje klasyfikacji na podstawie cech. Skoro w pełni połączone sieci neuronowe nie są najlepszymi klasyfikatorami (tzn. Osiągają lepsze wyniki od SVM i RF przez większość …
Interesują mnie teoretyczne wyniki zdolności uogólniających maszyn wektorów podporowych, np. Granice prawdopodobieństwa błędu klasyfikacji i wymiaru Vapnika-Chervonenkisa (VC) tych maszyn. Jednak czytając literaturę, miałem wrażenie, że niektóre podobne powtarzające się wyniki różnią się nieznacznie w zależności od autora, szczególnie jeśli chodzi o warunki techniczne wymagane dla danego obowiązku. W dalszej …
Znam podstawy SVM i SVR, ale wciąż nie rozumiem, jak problem znalezienia hiperpłaszczyzny, która maksymalizuje margines, pasuje do SVR. Po drugie, przeczytałem coś o używanym jako margines tolerancji w SVR. Co to znaczy?ϵϵ\epsilon Po trzecie, czy jest jakaś różnica między parametrami funkcji decyzyjnej stosowanymi w SVM i SVR?
Optymalna hiperpłaszczyzna w SVM jest zdefiniowana jako: w⋅x+b=0,w⋅x+b=0,\mathbf w \cdot \mathbf x+b=0, gdzie oznacza próg. Jeśli mamy jakieś mapowanie które mapuje przestrzeń wejściową na jakąś przestrzeń , możemy zdefiniować SVM w przestrzeni , gdzie optymalna hiperplantu będzie:bbbϕϕ\mathbf \phiZZZZZZ w⋅ϕ(x)+b=0.w⋅ϕ(x)+b=0.\mathbf w \cdot \mathbf \phi(\mathbf x)+b=0. Zawsze możemy jednak zdefiniować mapowanie tak …
Wiem, że Adaboost próbuje wygenerować silny klasyfikator za pomocą liniowej kombinacji zestawu słabych klasyfikatorów. Jednak przeczytałem kilka artykułów sugerujących, że Adaboost i SVM działają harmonijnie (nawet jeśli SVM jest silnym klasyfikatorem) w pewnych warunkach i przypadkach . Nie jestem w stanie zrozumieć z perspektywy architektury i programowania, jak działają one …
Chcę wytrenować klasyfikator, powiedzmy SVM, losowy las lub inny klasyfikator. Jedną z cech zestawu danych jest zmienna kategoryczna z 1000 poziomami. Jaki jest najlepszy sposób na zmniejszenie liczby poziomów w tej zmiennej. W R jest funkcja wywoływana combine.levels()w pakiecie Hmisc , która łączy rzadkie poziomy, ale szukałem innych sugestii.
Rozumiem, że SVM jest bardzo podobny do regresji logistycznej (LR), tj. Ważona suma funkcji jest przekazywana do funkcji sigmoidalnej w celu uzyskania prawdopodobieństwa przynależności do klasy, ale zamiast utraty entropii krzyżowej (logistycznej) funkcja, trening odbywa się przy użyciu utraty zawiasu. Zaletą stosowania utraty zawiasu jest to, że można wykonywać różne …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.