Pytania otagowane jako data-mining

Eksploracja danych wykorzystuje metody sztucznej inteligencji w kontekście bazy danych do odkrywania nieznanych wcześniej wzorców. W związku z tym metody te zwykle nie są nadzorowane. Jest ściśle powiązany, ale nie identyczny z uczeniem maszynowym. Kluczowymi zadaniami eksploracji danych są analiza skupień, wykrywanie wartości odstających i wyszukiwanie reguł asocjacyjnych.

2
Jak przewidzieć, kiedy nastąpi kolejne wydarzenie, na podstawie czasów poprzednich wydarzeń?
Jestem uczniem szkoły średniej i pracuję nad projektem programowania komputerowego, ale nie mam dużego doświadczenia w statystyce i modelowaniu danych poza kursem statystyki w szkole średniej, więc jestem trochę zdezorientowany. Zasadniczo mam dość dużą listę (zakładając, że jest wystarczająco duża, aby spełnić założenia dla wszelkich testów lub miar statystycznych) czasów, …

7
Błędne dane w uczeniu maszynowym
Pracuję nad projektem Machine Learning z danymi, które są już (w dużym stopniu) stronnicze w wyniku selekcji danych. Załóżmy, że masz zestaw zakodowanych reguł. Jak zbudować model uczenia maszynowego, aby go zastąpić, skoro wszystkie dane, których może użyć, to dane, które zostały już odfiltrowane według tych reguł? Aby to wyjaśnić, …

3
Kiedy warto korzystać z interaktywnej wizualizacji danych?
Przygotowując się do wykładu, który wkrótce przedstawię, niedawno zacząłem zagłębiać się w dwa główne (bezpłatne) narzędzia do interaktywnej wizualizacji danych: GGobi i Mondrian - oba oferują szeroki zakres możliwości (nawet jeśli są nieco wadliwe). Chciałbym prosić o twoją pomoc w artykułowaniu (zarówno dla siebie, jak i dla mojej przyszłej publiczności) …


2
podejścia szkoleniowe dla wysoce niezrównoważonego zestawu danych
Mam wysoce niezrównoważony zestaw danych testowych. Zestaw dodatni składa się ze 100 przypadków, a zestaw ujemny składa się z 1500 przypadków. Po stronie treningowej mam większą pulę kandydatów: pozytywny zestaw treningowy ma 1200 przypadków, a negatywny zestaw treningowy ma 12000 przypadków. W przypadku tego rodzaju scenariusza mam kilka możliwości: 1) …


10
Ankieta dotycząca narzędzi do eksploracji danych
Chociaż zostałem przeszkolony jako inżynier, odkryłem, że coraz bardziej interesuję się eksploracją danych. W tej chwili próbuję dokładniej zbadać tę dziedzinę. W szczególności chciałbym zrozumieć różne kategorie narzędzi programowych, które istnieją i które narzędzia są godne uwagi w każdej kategorii i dlaczego. (Zauważ, że nie powiedziałem „najlepszych” narzędzi, tylko te …

4
Znaczenie ukrytych cech?
Próbuję zrozumieć modele faktoryzacji macierzy dla systemów rekomendujących i zawsze czytam „ukryte funkcje”, ale co to znaczy? Wiem, co oznacza funkcja dla zestawu danych szkoleniowych, ale nie jestem w stanie zrozumieć idei ukrytych funkcji. Każdy artykuł na ten temat, który mogę znaleźć, jest po prostu zbyt płytki. Edytować: jeśli przynajmniej …

1
Różnica między regresją logistyczną a maszynami wektorów wsparcia?
Wiem, że regresja logistyczna znajduje hiperpłaszczyznę, która oddziela próbki szkoleniowe. Wiem również, że maszyny wektorowe wsparcia znajdują hiperpłaszczyznę z maksymalnym marginesem. Moje pytanie: czy zatem różnica między regresją logistyczną (LR) a maszynami wektorów wsparcia (SVM) polega na tym, że LR znajduje jakąkolwiek hiperpłaszczyznę, która oddziela próbki szkoleniowe, podczas gdy SVM …

3
Dlaczego używamy k-średnich zamiast innych algorytmów?
Badałem k-średnich i oto, co otrzymałem: k-średnich jest jednym z najprostszych algorytmów, który wykorzystuje metodę uczenia bez nadzoru w celu rozwiązania znanych problemów związanych z klastrowaniem. Działa naprawdę dobrze z dużymi zestawami danych. Istnieją jednak także wady K-Means: Silna wrażliwość na wartości odstające i hałas Nie działa dobrze w przypadku …





2
Matematyka za drzewami klasyfikacji i regresji
Czy ktoś może wyjaśnić matematykę związaną z klasyfikacją w CART? Chcę zrozumieć, jak przebiegają dwa główne etapy. Na przykład przeszkoliłem klasyfikator CART na zestawie danych i użyłem testowego zestawu danych, aby oznaczyć jego predykcyjne działanie, ale: Jak wybiera się początkowy korzeń drzewa? Dlaczego i jak powstaje każda gałąź? Mój zestaw …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.