Uczęszczam na klasę analizy danych i niektóre z moich głęboko zakorzenionych pomysłów są wstrząśnięte. Mianowicie idea, że błąd (epsilon), a także jakakolwiek inna wariancja, odnosi się tylko (tak myślałem) do grupy (próbki lub całej populacji). Teraz uczymy się, że jednym z założeń regresji jest to, że wariancja jest „taka sama dla wszystkich osób”. To mnie w jakiś sposób szokuje. Zawsze myślałem, że to wariancja Y we wszystkich wartościach X była założona jako stała.
Rozmawiałem z profesorem, który powiedział mi, że kiedy przeprowadzamy regresję, zakładamy, że nasz model jest prawdziwy. I myślę, że to trudna część. Dla mnie termin błędu (epsilon) zawsze oznaczał coś w rodzaju „dowolnych elementów, których nie znamy i które mogą wpłynąć na naszą zmienną wyniku plus błąd pomiaru”. W sposobie nauczania klasy nie ma czegoś takiego jak „inne rzeczy”; zakłada się, że nasz model jest prawdziwy i kompletny. Oznacza to, że wszelkie zmiany rezydualne należy traktować jako iloczyn błędu pomiaru (dlatego należy oczekiwać, że pomiar pojedynczego 20 razy spowoduje taką samą wariancję, jak jednorazowy pomiar 20 osobników).
Czuję, że coś jest gdzieś nie tak, chciałbym zasięgnąć opinii eksperta na ten temat ... Czy jest miejsce na interpretację tego, co oznacza błąd, pod względem koncepcyjnym?