Potrzebny jest rzetelny przegląd metodologii regresji. Te pytania są jednak wystarczająco podstawowe (nie bierz tego w niewłaściwy sposób), aby nawet dobry przegląd podstawowych statystyk prawdopodobnie byłby dla Ciebie korzystny. Howell napisał bardzo popularny podręcznik, który zapewnia szerokie podstawy koncepcyjne, nie wymagając gęstej matematyki. Warto go przeczytać. Nie można tutaj opisać wszystkich tych materiałów. Jednak mogę spróbować zacząć od niektórych szczegółowych pytań.
Po pierwsze, dni tygodnia są uwzględniane za pomocą schematu kodowania. Najpopularniejsze jest kodowanie „kategorii referencyjnej” (zwykle nazywane kodowaniem pozorowanym). Wyobraźmy sobie, że dane są reprezentowane w macierzy, z przypadkami w wierszach, a zmiennymi w kolumnach. W tym schemacie, jeśli miałbyś 7 zmiennych kategorialnych (np. Dla dni tygodnia), dodałbyś 6 nowych kolumn. Wybrałbyś jeden dzień jako kategorię odniesienia, ogólnie ten, który jest uważany za domyślny. Często wynika to z teorii, kontekstu lub pytania badawczego. Nie mam pojęcia, który byłby najlepszy na dni tygodnia, ale to też nie ma większego znaczenia, możesz po prostu wybrać dowolny stary. Gdy masz już kategorię referencyjną, możesz przypisać pozostałe do twoich 6 nowych zmiennych, a następnie po prostu wskazujesz, czy zmienna ta występuje dla każdego przypadku. Załóżmy na przykład, że wybierasz niedzielę jako kategorię referencyjną, twoje nowe kolumny / zmienne byłyby od poniedziałku do soboty. Każda obserwacja, która miała miejsce w poniedziałek, będzie oznaczona symbolem1010
Dawno nie patrzyłem na to, jak Excel robi statystyki, i nie pamiętam tego bardzo wyraźnie, więc ktoś inny może ci w tym pomóc. Ta strona zawiera pewne informacje na temat specyfiki regresji w programie Excel. Mogę powiedzieć trochę więcej na temat statystyk zwykle zgłaszanych w wyniku regresji:
- r1
- rrrrr
- rr × r10r1R2)1rR2)) jest bardzo stronniczy w regresji wielokrotnej. Oznacza to, że im więcej predyktorów dodasz do swojego modelu, tym wyższe będą te statystyki, niezależnie od tego, czy istnieje związek, czy nie. Dlatego należy zachować ostrożność przy ich interpretacji.
- tfa
- p
- tfapfa1fa
- faF
Na koniec warto podkreślić, że tego procesu nie można oddzielić od kontekstu. Aby dobrze wykonać analizę danych, musisz mieć na uwadze swoją wiedzę ogólną i pytanie badawcze. Nawiązałem do powyższego w odniesieniu do wyboru kategorii odniesienia. Na przykład zauważasz, że rozmiar buta nie powinien być odpowiedni, ale dla Flintstonów prawdopodobnie tak było! Chcę tylko uwzględnić ten fakt, ponieważ często wydaje się, że jest zapomniany.