Pytania otagowane jako predictive-models

Modele predykcyjne to modele statystyczne, których głównym celem jest optymalne przewidywanie innych obserwacji systemu, w przeciwieństwie do modeli, których celem jest sprawdzenie konkretnej hipotezy lub wyjaśnienie zjawiska mechanicznie. Jako takie, modele predykcyjne kładą mniejszy nacisk na interpretację, a większy nacisk na wydajność.

1
Czy solidne metody są naprawdę lepsze?
Mam dwie grupy badanych, A i B, każda o wielkości około 400 i około 300 predyktorów. Moim celem jest zbudowanie modelu predykcyjnego dla zmiennej odpowiedzi binarnej. Mój klient chce zobaczyć wynik zastosowania modelu zbudowanego z A na B. (W swojej książce „Strategie modelowania regresji” @FrankHarrell wspomina, że ​​lepiej jest połączyć …

2
Model przeżycia dla prognozowania rezygnacji - predyktory zmieniające się w czasie?
Chcę zbudować model predykcyjny do przewidywania odejścia i chcę zastosować dyskretny model przetrwania dopasowany do zestawu danych szkoleniowych na okres personalny (jeden wiersz dla każdego klienta i dyskretny okres, w którym byli narażeni, ze wskaźnikiem zdarzenia - równym 1 jeśli rezygnacja nastąpiła w tym okresie, w przeciwnym razie 0). Dopasowuję …

1
Jak zinterpretować wynik prognozy.coxph?
Po dopasowaniu modelu koxmodelu możliwe jest przewidywanie i wyszukiwanie względnego ryzyka nowych danych. Nie rozumiem, w jaki sposób obliczane jest ryzyko względne dla osoby i do czego jest ono powiązane (tj. Średnia populacji)? Wszelkie zalecenia dotyczące zasobów, które pomogą zrozumieć (nie jestem bardzo zaawansowany w analizie przeżycia, więc im prościej, …


6
Najszybsza implementacja SVM
Bardziej ogólne pytanie. Korzystam z SVM rbf do modelowania predykcyjnego. Myślę, że mój obecny program zdecydowanie potrzebuje przyspieszenia. Używam scikit learning z prostym do dokładnego wyszukiwania siatki + sprawdzania poprawności. Każdy przebieg SVM zajmuje około minuty, ale mimo wszystkich iteracji wciąż uważam, że jest zbyt wolny. Zakładając, że w końcu …


5
Czy oszustwo polega na usuwaniu wartości odstających na podstawie wykresu średniego błędu bezwzględnego w celu ulepszenia modelu regresji
Mam model predykcyjny przetestowany czterema metodami, jak widać na poniższym rysunku. Atrybut prognozowany przez model mieści się w zakresie 0–8. Możesz zauważyć, że istnieje jedna górna granica i trzy dolne granice wskazane przez wszystkie metody. Zastanawiam się, czy właściwe jest usunięcie tych wystąpień z danych? Czy jest to rodzaj oszustwa …

2
Jak przeprowadzić walidację krzyżową za pomocą proporcjonalnego modelu zagrożeń Coxa?
Załóżmy, że zbudowałem model predykcyjny dla wystąpienia określonej choroby w jednym zestawie danych (zestaw danych budowania modelu) i teraz chcę sprawdzić, jak dobrze model działa w nowym zestawie danych (zestaw danych sprawdzania poprawności). Dla modelu zbudowanego z regresją logistyczną obliczałbym przewidywane prawdopodobieństwo dla każdej osoby w zbiorze danych sprawdzania poprawności …

1
Minimalizowanie stronniczości w modelowaniu objaśniającym, dlaczego? (Galit Shmueli „Wyjaśnić lub przewidzieć”)
To pytanie odnosi się do pracy Galit Shmueli „Wyjaśnić lub przewidzieć” . W szczególności w sekcji 1.5 „Wyjaśnianie i przewidywanie są różne” profesor Shmueli pisze: W modelowaniu objaśniającym nacisk kładziony jest na minimalizowanie stronniczości w celu uzyskania jak najdokładniejszej reprezentacji podstawowej teorii. To mnie intrygowało za każdym razem, gdy czytam …

2
Dlaczego ta prognoza szeregów czasowych jest „dość słaba”?
Próbuję nauczyć się korzystać z sieci neuronowych. Czytałem ten samouczek . Po dopasowaniu sieci neuronowej do szeregu czasowego przy użyciu wartości aby przewidzieć wartość przy autor otrzymuje następujący wykres, w którym niebieska linia to szereg czasowy, zielony to prognoza danych pociągu, czerwony to prognoza danych testowych (wykorzystał podział pociągu testowego)tttt …

4
Modele predykcyjne: statystyki nie są w stanie pokonać uczenia maszynowego? [Zamknięte]
Zamknięte . To pytanie musi być bardziej skoncentrowane . Obecnie nie przyjmuje odpowiedzi. Chcesz poprawić to pytanie? Zaktualizuj pytanie, aby skupiało się tylko na jednym problemie, edytując ten post . Zamknięte 2 lata temu . Obecnie śledzę program główny koncentrujący się na statystyce / ekonometrii. U mojego mistrza wszyscy studenci …

4
Czy do regresji liniowych można zastosować metodologię losowego lasu?
Losowe lasy pracują, tworząc zestaw drzew decyzyjnych, w których każde drzewo jest tworzone przy użyciu próbki początkowej oryginalnych danych treningowych (próbka zmiennych wejściowych i obserwacji). Czy podobny proces można zastosować do regresji liniowej? Utwórz k modeli regresji liniowej za pomocą losowej próbki bootstrap dla każdej z k regresji Z jakich …


1
Prognozowanie wydajności zależy bardziej od wiedzy analityka danych niż od metody?
Natknąłem się na pogłoskę, że niektóre badania wykazały, że wydajność modeli predykcyjnych zależy bardziej od wiedzy specjalisty analityka danych w zakresie wybranej metody niż od wyboru metody. Innymi słowy, twierdzenie jest takie, że ważniejsze jest, aby analityk danych znał wybraną metodę, niż to, jak „odpowiednia” metoda wydaje się dla problemu …

1
Caret glmnet vs cv.glmnet
Wydaje się, że istnieje wiele zamieszania w porównaniu używania glmnetwewnątrz w caretcelu znalezienia optymalnej lambdy i korzystania cv.glmnetz tego samego zadania. Zadano wiele pytań, np .: Model klasyfikacji train.glmnet vs. cv.glmnet? Jaki jest właściwy sposób używania glmnet z karetką? Cross-validation `glmnet` za pomocą` caret` ale nie udzielono odpowiedzi, co może …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.