Pytania otagowane jako model-evaluation

O ocenie modeli, zarówno w próbie, jak i poza próbą.

1
Ocenianie wydajności modelu regresji za pomocą zestawów szkoleniowych i testowych?
Często słyszę o ocenie wydajności modelu klasyfikacyjnego poprzez trzymanie zestawu testowego i szkolenie modelu na zestawie treningowym. Następnie tworzymy 2 wektory, jeden dla przewidywanych wartości i jeden dla prawdziwych wartości. Oczywiście dokonanie porównania pozwala ocenić wydajność modelu na podstawie jego mocy predykcyjnej przy użyciu takich parametrów, jak F-Score, statystyki Kappa, …

1
Jak włączyć innowacyjną wartość odstającą przy obserwacji 48 w moim modelu ARIMA?
Pracuję nad zestawem danych. Po zastosowaniu niektórych technik identyfikacji modelu, wyszłam z modelem ARIMA (0,2,1). Użyłem detectIOfunkcji w pakiecie TSAw R do wykrycia innowacyjnej wartości odstającej (IO) przy 48. obserwacji mojego oryginalnego zestawu danych. Jak włączyć tę wartość odstającą do mojego modelu, aby móc jej używać do celów prognozowania? Nie …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 


3
Podejścia przy uczeniu się z ogromnych zestawów danych?
Zasadniczo istnieją dwa typowe sposoby uczenia się przeciwko ogromnym zestawom danych (gdy napotykasz ograniczenia czasowe / przestrzenne): Oszukiwanie :) - użyj tylko „zarządzalnego” podzbioru do treningu. Utrata dokładności może być nieistotna z uwagi na prawo malejących zwrotów - predykcyjne działanie modelu często spłaszcza się na długo przed włączeniem do niego …

3
Najlepszy sposób oceny metod szacowania PDF
Chciałbym przetestować niektóre z moich pomysłów, które moim zdaniem są lepsze niż cokolwiek, co widziałem. Mogę się mylić, ale chciałbym przetestować swoje pomysły i rozwiać moje wątpliwości bardziej pewnymi spostrzeżeniami. To, o czym myślałem, to: Analitycznie zdefiniuj zestaw rozkładów. Niektóre z nich są łatwe, takie jak Gaussa, mundur lub Tophat. …

1
Ocena wydajności prognozowania szeregów czasowych
Mam Dynamiczny Naiwny model Bayesa wyszkolony w zakresie kilku zmiennych czasowych. Dane wyjściowe modelu są prognozami P(Event) @ t+1szacowanymi dla każdego t. Fabuła P(Event)versus timejest taka, jak podano na poniższym rysunku. Na tym rysunku czarna linia przedstawia P(Event)zgodnie z przewidywaniami mojego modelu; pozioma linia czerwona oznacza uprzedniej prawdopodobieństwo zdarzenia zdarzeń; …

2
Miara wydajności klasyfikatora, która łączy czułość i swoistość?
Mam dane z 2 klasami, na których przeprowadzam klasyfikację przy użyciu wielu klasyfikatorów. A zestawy danych są dobrze wyważone. Oceniając skuteczność klasyfikatorów, muszę wziąć pod uwagę, jak dokładny jest klasyfikator w określaniu nie tylko prawdziwych pozytywów, ale także prawdziwych negatywów. Dlatego jeśli użyję dokładności, a jeśli klasyfikator jest stronniczy w …

5
Jak zmierzyć wydajność klasyfikatora, gdy blisko 100% etykiet klasy należy do jednej klasy?
W moich danych mam zmienną klasy, oznaczoną jako CCC. Wartościami tej klasy są0,10,1{0, 1}(dwójkowy). Prawie wszystkie obserwacjeCCCwynoszą 0 (blisko 100%, a dokładniej 97%). Chciałbym przeprowadzić test „wydajności” na różnych modelach klasyfikacyjnych (może to być dokładność). Obawiam się, że jeśli mam model klasyfikacji, który zawsze klasyfikuje jakąkolwiek obserwację do klasy 0, …

2
Nauka przyrostowa dla modelu szeregów czasowych LOESS
Obecnie pracuję nad danymi z szeregów czasowych, wiem, że mogę używać modelu LOESS / ARIMA. Dane są zapisywane w wektorze, którego długość wynosi 1000, co jest kolejką, aktualizowaną co 15 minut, W ten sposób stare dane wyskoczą, a nowe dane wepchną wektor. Mogę ponownie uruchomić cały model na harmonogramie, np. …
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.