Kilka miesięcy temu odbyłem staż w tej organizacji; i jako prezent na wyjazd postanowiłem spędzić ostatni tydzień, bez względu na czas wolny, na zbadanie czynników wpływających na wynagrodzenie nauczycieli. Jednym z problemów, z jakim spotkałem się z wynagrodzeniami nauczycieli, było to, że rozkład dla danego stanu był wypaczony. Miałem wiele obserwacji, które przylgnęły do dolnej granicy spektrum płac. Próbowałem rozwiązać ten problem, włączając Porównywalny Indeks Płacy do mojej zmiennej zależnej (płace nauczycieli), ale wyniki, które znalazłem, były całkowicie nieaktualne w zakresie mojego projektu. Zamiast tego postanowiłem zarejestrować moją zmienną zależną. To było miłe, ponieważ teraz moje zarobki miały normalny rozkład i po prostu wyglądało idealnie na histogramie. Kiedy zacząłem testować, doszedłem do momentu, w którym zostałem z ostatnią niezależną zmienną, zeznaniami podatkowymi od nieruchomości. Problem z moimi normatywnymi płacami był również widoczny w moich spostrzeżeniach dotyczących zwrotu podatku od nieruchomości. Miałem ogromną liczbę zwrotów podatku od nieruchomości w dolnej części spektrum. Tak więc zarejestrowałem również tę zmienną i nadal dobrze przechodzi test hipotezy zerowej.
Nie jestem pewien, czy jest to dokładnie poprawne, ale porównanie zmiany jednej zarejestrowanej zmiennej z inną zarejestrowaną zmienną dało mi elastyczność. Zakładając, że jest to poprawne, moje równanie regresji (coś w rodzaju LogWages = B0 + B1 (LogPropertyTaxReturns)) pokazuje elastyczność między dwiema zmiennymi. Czy to ma jednak sens? Jeśli moim celem było sprawdzenie, która zmienna najbardziej wpłynęła na wynagrodzenie nauczycieli w danym hrabstwie mojego stanu, to czy pomocna jest elastyczność między tymi dwiema zmiennymi? Chcemy podnieść powiaty o najniższych wynagrodzeniach nauczycieli, aby podnieść ich standard życia, ale obawiam się, że ekstrapolowałem tak daleko od prawdziwych obserwacji, że moje końcowe równanie regresji jest bez znaczenia.
Edycja: Jednym z moich większych obaw jest to, że powinienem był zastosować model nieliniowy, aby pokazać związek. Wydaje mi się, że zmuszanie zarówno zależnej, jak i niezależnej zmiennej do współpracy w regresji liniowej jest w pewien sposób mylące.