Wielokoliniowość jest zwykle podejrzanym, jak wspomniał JoFrhwld. Zasadniczo, jeśli twoje zmienne są dodatnio skorelowane, wówczas współczynniki będą skorelowane ujemnie, co może prowadzić do błędnego znaku na jednym ze współczynników.
Jednym z nich byłoby wykonanie regresji głównych składników lub regresji kalenicowej. Zmniejsza to wymiarowość przestrzeni regresji, obsługując wielokoliniowość. Skończysz z tendencyjnymi szacunkami, ale prawdopodobnie niższym MSE i poprawionymi znakami. Niezależnie od tego, czy wybierasz te konkretne wyniki, czy nie, jest to dobra kontrola diagnostyczna. Jeśli nadal pojawiają się zmiany znaków, może to być teoretycznie interesujące.
AKTUALIZACJA
Po komentarzu w odpowiedzi Johna Christie może to być interesujące. Odwrócenie w powiązaniu (wielkość lub kierunek) to przykłady Paradoksu Simpsona, Paradoksu Lorda i Efektu Tłumienia. Różnice dotyczą głównie rodzaju zmiennej. Bardziej przydatne jest zrozumienie podstawowego zjawiska niż myślenie w kategoriach konkretnego „paradoksu” lub efektu. Z przyczyn przyczynowych poniższy artykuł dobrze wyjaśnia, dlaczego, i przytoczę szczegółowo ich wprowadzenie i wnioski, aby pobudzić apetyt.
Tu i wsp. Przedstawili analizę równoważności trzech paradoksów, stwierdzając, że wszystkie trzy po prostu powtarzają nieoczekiwaną zmianę w powiązaniu dowolnych dwóch zmiennych, gdy trzecia zmienna jest statystycznie kontrolowana. Nazywam to zaskakującym, ponieważ odwrócenie lub zmiana wielkości jest powszechna w analizie warunkowej. Aby tego uniknąć, musimy całkowicie uniknąć analizy warunkowej. Co jest takiego w paradoksach Simpsona i Lorda, czy też tłumieniu, poza tym, że wskazują na oczywiste, co przyciąga sporadyczne, a czasem alarmistyczne zainteresowania, które można znaleźć w literaturze?
[...]
Podsumowując, nie można przecenić faktu, że chociaż paradoksy Simpsona i pokrewne ujawniają niebezpieczeństwa wynikające ze stosowania kryteriów statystycznych do kierowania analizą przyczynową, nie zawierają ani wyjaśnienia zjawiska, które rzekomo przedstawiają, ani wskazówek, jak ich uniknąć. Wyjaśnienia i rozwiązania opierają się na rozumowaniu przyczynowym, które opiera się na wiedzy ogólnej, a nie kryteriach statystycznych. Najwyższy czas, abyśmy przestali leczyć źle interpretowane oznaki i objawy („paradoksy”) i zajęli się sprawą radzenia sobie z chorobą („przyczynowość”). Słusznie powinniśmy zwrócić uwagę na odwieczny problem selekcji zmiennych towarzyszących do analizy przyczynowej z wykorzystaniem danych nie eksperymentalnych.