Znaczenie osi y na wykresie częściowej zależności losowego lasu

Korzystam z RandomForestpakietu R i nie rozumiem, jak interpretować wartości osi Y na ich wykresach częściowej zależności. Dokumenty pomocnicze stwierdzają, że wykres jest „graficznym przedstawieniem marginalnego wpływu zmiennej na prawdopodobieństwo klasowe”. Nadal jednak nie rozumiem, co dokładnie reprezentuje oś y.

W szczególności, co oznaczają wartości ujemne?
Co to znaczy mieć negatywny wpływ na dokładne przewidywanie klasy?
A co jest najważniejszą cechą tych liczb, czy jest to maksymalna wartość, kształt trendu itp.?
Czy możesz porównać wykresy częściowe z wykresami częściowymi innych zmiennych?
Jak te wykresy mogą się porównać z krzywymi odpowiedzi utworzonymi w Maxent (oprogramowanie do modelowania dystrybucji)?

Niektóre przykładowe wykresy częściowej zależności

r interpretation random-forest partial-plot

— jacobsap
źródło

Najpierw odpowiadając na te dwa:

W szczególności, co oznaczają wartości ujemne? Co to znaczy mieć negatywny wpływ na dokładne przewidywanie klasy?

Jeśli spojrzysz na definicję sposobu obliczania wykresu częściowego w dokumentacji pakietu Losowy las , to powiedziano, że wykresy pokazują względny udział logitu zmiennej w prawdopodobieństwie klasy z perspektywy modelu. Innymi słowy wartości ujemne (na osi y) oznaczają, że klasa dodatnia jest mniej prawdopodobna dla tej wartości zmiennej niezależnej (oś x) zgodnie z modelem. Podobnie wartości dodatnie oznaczają, że klasa dodatnia jest bardziej prawdopodobna dla tej wartości zmiennej niezależnej zgodnie z modelem. Oczywiście zero oznacza, że nie ma żadnego średniego wpływu na prawdopodobieństwo klasowe według modelu.

A co jest najważniejszą cechą tych liczb, czy jest to maksymalna wartość, kształt trendu itp.?

Istnieje wiele różnych podejść do określania ważności cech, a maksymalna wartość bezwzględna to tylko jedna prosta miara. Zazwyczaj ludzie patrzą na kształt wykresów częściowych, aby uzyskać zrozumienie tego, co model sugeruje na temat związku między zmiennymi a etykietami klas.

Czy możesz porównać wykresy częściowe z wykresami częściowymi innych zmiennych?

Odpowiedź na to pytanie jest mniej czarno-biała. Możesz z pewnością spojrzeć na zakres osi y dla każdego wykresu; Jeśli częściowa zależność od jednej zmiennej jest bliska zeru dla całego zakresu zmiennej, oznacza to, że model nie ma żadnego związku ze zmienną do etykiety klasy. Wracając do pytania, im większy zakres, tym większy ogólny wpływ, więc w tym sensie można je porównać.

Nie mam doświadczenia z Maxentem.

— Chris A.
źródło

Powiedzmy, że model służy do klasyfikacji 2 klas, jak ustalić, która klasa jest klasą dodatnią, a która ujemną?

— Kumar Vaibhav,

To dobre pytanie, musisz eksperymentować i zobaczyć. Dokumentacja mówi tutaj na stronie 17, że jeśli yjest czynnikiem, to zakłada, że jest to problem z klasyfikacją. Jednak nie mówi, który czynnik odwzoruje na klasę dodatnią lub ujemną. Mam nadzieję, że 1 lub prawda jest odwzorowana na klasę dodatnią, a 0, -1, lub fałsz jest odwzorowana na klasę ujemną, ale nie przyjmuję tego za pewnik w R.

— Chris A.

jest which.classargument partialPloti domyślnie ustawiony jest pierwszy poziom czynnika y. Jeśli więc pierwszym poziomem yjest przypadek ujemny, wówczas partialPlotprzewidujemy przypadki ujemne, co może nie być tym, czego się spodziewasz.

— qoheleth,