tl; dr - w przypadku regresji OLS, czy wyższy R-kwadrat oznacza również wyższą wartość P? W szczególności dla jednej zmiennej objaśniającej (Y = a + bX + e), ale chciałbym również wiedzieć o n wielu zmiennych objaśniających (Y = a + b1X + ... bnX + e).
Kontekst - Przeprowadzam regresję OLS dla szeregu zmiennych i staram się opracować najlepszą objaśniającą formę funkcjonalną, tworząc tabelę zawierającą wartości R-kwadrat między liniową, logarytmiczną itp. Transformacjami każdej zmiennej objaśniającej (niezależnej) oraz zmienna odpowiedzi (zależna). To wygląda trochę jak:
Nazwa zmiennej - forma liniowa - --ln (zmienna) --exp (zmienna) - ... itd
Zmienna 1 ------- R-kwadrat ---- R-kwadrat ---- R-kwadrat -
... itd ...
Zastanawiam się, czy R-kwadrat jest właściwe, czy też wartości P byłyby lepsze. Przypuszczalnie istnieje pewien związek, ponieważ związek bardziej znaczący oznaczałby wyższą moc wyjaśniającą, ale nie jestem pewien, czy jest to prawdą w sposób rygorystyczny.