Ten post dotyczy dwuwymiarowego modelu regresji liniowej, . Zawsze brałem pod uwagę podział sumy kwadratów (SSTO) na sumę kwadratów dla błędu (SSE) i sumę kwadratów dla modelu (SSR) na wiarę, ale kiedy naprawdę zacząłem o tym myśleć, nie rozumiem dlaczego to działa ...
Część I nie rozumiem:
: Obserwowana wartość y
: Średnia ze wszystkich zaobserwowanych s
: Dopasowana / przewidywana wartość y dla danej obserwacji x
: Resztkowe / błąd (jeśli do kwadratu i sumy dla wszystkich obserwacji jest to SSE)
: Jak bardzo dopasowana wartość modelu różni się od średniej (jeśli do kwadratu i sumy dla wszystkich obserwacji jest to SSR)
: Jak bardzo zaobserwowana wartość różni się od średniej (jeśli jest sprawdzana i sumowana dla wszystkich obserwacji, jest to SSTO).
Rozumiem, dlaczego dla pojedynczej obserwacji, nic nie podnosząc kwadratu, . I rozumiem, dlaczego, jeśli chcesz dodać rzeczy do wszystkich obserwacji, musisz je wyrównać, bo w przeciwnym razie sumują się do zera.
Nie rozumiem tylko, dlaczego (np. SSTO = SSR + SSE). Wydaje się, że jeśli masz sytuację, w której, następnie , nie . Dlaczego tak nie jest w tym przypadku?