Nie jestem nawet pewien, czy pytanie ma sens, ale wydaje mi się, że widziałem kilka tytułów artykułów, w których zaproponowano losowy las z losowymi efektami. Czy jest to możliwe w R?
Nie jestem nawet pewien, czy pytanie ma sens, ale wydaje mi się, że widziałem kilka tytułów artykułów, w których zaproponowano losowy las z losowymi efektami. Czy jest to możliwe w R?
Odpowiedzi:
Nie są one powszechnie stosowane razem, dlatego należy zachować ostrożność przed ich połączeniem.
Losowe lasy są zwykle używane jako klasyfikatory. Powodem, dla którego użyjesz losowego lasu zamiast innej metody (np. K-oznacza grupowanie) jest to, że możesz mieć dużą liczbę wymiarów, według których chcesz sklasyfikować. Problem z dużą liczbą wymiarów polega na tym, że jeśli chcesz przetestować wszystkie kombinacje rzędów wymiarów, będziesz mieć dużą liczbę opcji (rośnie szybciej niż liczba silni wymiarów).
Losowe efekty są zwykle stosowane w regresji z powtarzanymi pomiarami tego samego. Są one powszechnie stosowane w modelach efektów mieszanych, w których pojęcie mieszane odnosi się zarówno do efektów stałych, jak i losowych. Uważa się, że ustalone efekty reprezentują parametry, które zobaczysz ponownie (np. Lek lub wiek osoby). Uważa się, że efekty losowe reprezentują przypadek zmienności wokół parametru, którego już nie zobaczysz (np. Konkretna osoba).
Istnieją przykłady używania ich razem, gdy istnieją dane klastrowe http://dx.doi.org/10.1080/00949655.2012.741599 i http://www2.ims.nus.edu.sg/Programs/014swclass/files/denis.pdf .
Nie znam żadnych pakietów R, które mogą wykonać tę analizę.
Tak, to możliwe. Powinieneś sprawdzić „ RE-EM Drzewa: Podejście eksploracji danych dla danych wzdłużnych i klastrowych ” oraz powiązany pakiet R REEMtree .
Minęło trochę czasu, odkąd spojrzałem na gazetę. Pamiętam, że autorzy nie próbowali jeszcze tworzyć zespołów tych drzew, ale nic nie sugerowało, że to nie zadziała.
Mieszane efekty Losowe lasy (MERF) to coś. Jak wynika z powyższej odpowiedzi, istnieje kilka świetnych badań na ten temat przeprowadzonych przez grupę dr Larocque'a w HEC Montreal. Artykuł znajduje się tutaj: http://www.tandfonline.com/doi/abs/10.1080/00949655.2012.741599 .
Zasadniczo jest to teoretycznie rozsądny sposób łączenia nieliniowego modelowania losowych lasów z liniowymi efektami losowymi.
Właśnie wydaliśmy pakiet open source w Pythonie implementujący MERF przy użyciu powyższego algorytmu w artykule.
Napisaliśmy szczegółowy post na blogu o pakiecie i tym, jak go używać do klastrowych zestawów danych.