Rozumiem teraz, że zależy to od rozkładów i normalności w predyktorach
transformacja logów sprawia, że dane są bardziej jednolite
Zasadniczo jest to nieprawda --- ale nawet gdyby tak było, dlaczego jednolitość byłaby ważna?
Zastanów się na przykład
i) binarny predyktor przyjmujący tylko wartości 1 i 2. Zapisywanie logów pozostawiłoby go jako predyktor binarny przyjmujący tylko wartości 0 i log 2. To tak naprawdę nie wpływa na nic poza przechwytywaniem i skalowaniem terminów obejmujących ten predyktor. Nawet wartość p predyktora pozostanie niezmieniona, podobnie jak wartości dopasowane.
ii) weź pod uwagę predyktor pochylenia w lewo. Teraz weź dzienniki. Zwykle staje się bardziej pochylony w lewo.
iii) jednolite dane stają się zniekształcone
(często zmiana nie zawsze jest tak ekstremalna)
mniej dotknięte wartościami odstającymi
Zasadniczo jest to nieprawda. Rozważ niskie wartości odstające w predyktorze.
Myślałem o transformacji logów wszystkich moich ciągłych zmiennych, które nie są przedmiotem głównego zainteresowania
W jakim celu? Gdyby pierwotnie relacje były liniowe, nie byłyby dłużej.
A jeśli były już zakrzywione, robienie tego automatycznie może pogorszyć je (bardziej zakrzywione), a nie lepsze.
-
Wykonywanie dzienników predyktora (niezależnie od tego, czy jest to główny interes, czy nie) może czasami być odpowiednie, ale nie zawsze tak jest.