Przy ciągłych danych regresja liniowa zakłada, że termin błędu jest rozproszony N (0, )
1) Czy zakładamy, że Var (Y | x) jest również ~ N (0, )?
2) Czym jest ten rozkład błędów w regresji logistycznej? Gdy dane mają postać 1 rekordu na przypadek, gdzie „Y” wynosi 1 lub 0, oznacza to błąd błędu rozproszonego Bernoulliego (tzn. Wariancja wynosi p (1-p))) i gdy dane mają postać # sukcesy z # prób, czy przyjmuje się, że jest dwumianowy (tzn. wariancja wynosi np (1-p)), gdzie p jest prawdopodobieństwem, że Y wynosi 1?