Ilekroć stosuje się regularyzację, jest ona często dodawana do funkcji kosztu, na przykład w poniższej funkcji kosztu. Ma to dla mnie intuicyjny sens, ponieważ minimalizuję funkcja kosztu oznacza minimalizację błędu (lewy element) i minimalizację wielkości współczynników (prawy element) w tym samym czasie (lub przynajmniej równoważenie dwóch minimalizacji).J(θ)=12(y−θXT)(y−θXT)T+α∥θ∥22J(θ)=12(y−θXT)(y−θXT)T+α‖θ‖22 J(\theta)=\frac 1 2(y-\theta …
Widziałem różne teoretyczne sposoby obróbki grafiki, takie jak gramatyka grafiki . Ale nie widziałem nic równoważnego w odniesieniu do tabel. Z czasem opracowałem nieformalny model dobrych praktyk w projektowaniu stołów. Chciałbym jednak zapewnić dobre referencje dla studentów. Instrukcja APA Style ma kilka wskazówek na temat projektowania tabeli, ale to tylko …
Niektóre materiały, które widziałem na temat uczenia maszynowego, mówiły, że podejście do problemu klasyfikacji poprzez regresję jest złym pomysłem. Ale myślę, że zawsze można wykonać ciągłą regresję, aby dopasować dane i obciąć ciągłą prognozę, aby uzyskać dyskretne klasyfikacje. Dlaczego to zły pomysł?
Mam dane z testu, który można by wykorzystać do rozróżnienia komórek normalnych i nowotworowych. Zgodnie z krzywą ROC wygląda dobrze do tego celu (pole pod krzywą wynosi 0,9): Moje pytania to: Jak ustalić punkt odcięcia dla tego testu i przedział ufności, w którym odczyty należy oceniać jako niejednoznaczne? Jaki jest …
W swoim artykule z 1984 r. „Statystyka i wnioskowanie przyczynowe” Paul Holland podniósł jedno z najbardziej podstawowych pytań w statystyce: Co model statystyczny może powiedzieć o związku przyczynowym? Doprowadziło to do jego motto: BRAK PRZYCZYN BEZ MANIPULACJI co podkreślało znaczenie ograniczeń wokół eksperymentów uwzględniających związek przyczynowy. Andrew Gelman mówi podobnie …
Filtr cząstek , a filtr Kalmana są zarówno rekurencyjne Bayesa estymatory . Często spotykam filtry Kalmana w mojej dziedzinie, ale bardzo rzadko widzę użycie filtra cząstek. Kiedy jeden z nich będzie używany?
Dlaczego i kiedy powinniśmy używać informacji wzajemnych zamiast pomiarów korelacji statystycznych, takich jak „Pearson”, „włócznik” lub „tau Kendalla”?
Wiem, może to zabrzmieć nie na temat, ale wysłuchaj mnie. W Stack Overflow i tutaj otrzymujemy głosy na posty, wszystko to jest przechowywane w formie tabelarycznej. Na przykład: post id identyfikator wyborcy typ głosowania datetime ------- -------- --------- -------- 10 1 2 2000-1-1 10:00:01 11 3 3 2000-1-1 10:00:01 10 …
Krótka definicja wzmocnienia : Czy zestaw słabych uczniów może stworzyć jednego silnego ucznia? Słaby uczeń jest zdefiniowany jako klasyfikator, który jest tylko nieznacznie skorelowany z prawdziwą klasyfikacją (może lepiej opisywać przykłady niż losowe zgadywanie). Krótka definicja lasu losowego : Losowe lasy wyrastają z wielu drzew klasyfikacyjnych. Aby sklasyfikować nowy obiekt …
Ponieważ RF może poradzić sobie z nieliniowością, ale nie może zapewnić współczynników, czy mądrze byłoby użyć losowego lasu do zebrania najważniejszych cech, a następnie podłączyć je do modelu wielokrotnej regresji liniowej w celu uzyskania ich współczynników?
Zastanawiałem się, czy istnieje sposób na określenie prawdopodobieństwa wystąpienia awarii (produktu), jeśli mamy 100 000 produktów w terenie przez 1 rok i bez żadnych awarii? Jakie jest prawdopodobieństwo, że jeden z następnych 10 000 sprzedanych produktów zawiedzie?
Mam do czynienia z danymi liniowymi z wartościami odstającymi, z których niektóre są o 5 standardowych odchyleń od szacowanej linii regresji. Szukam techniki regresji liniowej, która zmniejsza wpływ tych punktów. Jak dotąd oszacowałem linię regresji ze wszystkimi danymi, a następnie odrzuciłem punkt danych z bardzo dużymi kwadratowymi resztkami (powiedzmy 10%) …
Ostatnio natknąłem się na Tableau i próbowałem wizualizować dane z bazy danych i pliku csv. Interfejs użytkownika umożliwia wizualizację danych czasowych i przestrzennych oraz błyskawiczne tworzenie wykresów. Takie narzędzie jest naprawdę przydatne, ponieważ umożliwia graficzną obserwację danych bez pisania kodu. Ponieważ istnieje wiele źródeł danych, z których muszę pobierać i …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.