Jak obliczyć z kwadratu próbki R?

Wiem, że prawdopodobnie zostało to omówione gdzie indziej, ale nie udało mi się znaleźć jednoznacznej odpowiedzi. Próbuję użyć wzoru aby obliczyć poza próbą modelu regresji liniowej, gdzie jest sumą kwadratów reszt, a jest sumą kwadratów. W przypadku zestawu treningowego jasne jest, że $R^2 = 1 - SSR/SST$ $R^2$ $SSR$ $SST$

S S T = Σ (y - {\bar{y}}_{t r a i n})^{2}

$SST = \Sigma (y - \bar{y}_{train})^2$

Co z zestawem testowym? Czy powinienem nadal używać $\bar{y}_{train}$ dla próbki poza próbą $y$ , czy zamiast tego używać $\bar{y}_{test}$ ?

Odkryłem, że jeśli użyję $\bar{y}_{test}$ , wynikowe $R^2$ może czasami być ujemne. Jest to zgodne z opisem funkcji sklearn r2_score(), w której użyli $\bar{y}_{test}$ (który jest również wykorzystywany przez funkcję ich model_liniowy score()do testowania próbek). Twierdzą, że „stały model, który zawsze przewiduje oczekiwaną wartość y, bez względu na cechy wejściowe, uzyskałby wynik R ^ 2 wynoszący 0,0”.

Jednak w innych miejscach ludzie używali $\bar{y}_{train}$ jak tutaj i tutaj (druga odpowiedź dmi3kno). Zastanawiałem się, co ma więcej sensu? Wszelkie uwagi będą mile widziane!

— szalony kierowca
źródło

Masz rację.

Resztki OSR opierają się na danych testowych, ale punktem odniesienia powinny być nadal dane treningowe. Powiedziawszy to, twój SST to ; zauważ, że to samo jest dla $^2$ $SST=Σ(y−\bar y_{train})^2$ $R^2$

— użytkownik152317
źródło

Chociaż naprawiłem pewne oczywiste i pozorne błędy z poprzednich edycji, niektóre zapisy i niektóre zamierzone znaczenie są nadal niejasne.

— Nick Cox,

Dziękuję za odpowiedź! Czy masz na to jakieś odniesienia? Wygląda na to, że oprogramowanie stat często używa alternatywnej definicji, używając y_test?

— Matifou,

Czy masz na to referencje? To prawda, że jeśli weźmiesz za porównanie odchyleń, ergo porównanie prawdopodobieństw, które moim zdaniem masz rację. Ale jeśli weźmiesz za proporcję wyjaśnionej wariancji, to nie, ponieważ całkowita suma kwadratów nigdzie się nie pojawi.

R^{2}

$R^2$

R^{2}

$R^2$

— Firebug