Mierzysz nierówności na poziomie kodu pocztowego lub hrabstwa w Stanach Zjednoczonych?


2

Próbuję obliczyć statystykę nierówności na poziomie kodu pocztowego lub województwa, aby połączyć się z innym zestawem danych. Korzystam z danych IRS SOI, ale podane dane są zwracane przez bin AGI (tj. 1-25k, 25-50k, ..., 200k +)

Nie wydaje się to wystarczająco szczegółowe, aby obliczyć współczynnik Giniego, ponieważ nie ma ogólnie dostępnych mikrodanych, a udziały percentylowe nie są podane.

  1. Jak mogę obliczyć miarę nierówności na podstawie danych w zestawach danych IRS SOI?

  2. Czy istnieją lepsze metody rozwiązania tego problemu?

Odpowiedzi:


2

Nie jestem pewien, jakie konkretnie masz dane, ale wygląda na to, że masz wystarczającą ilość danych, aby obliczyć przybliżone oszacowanie gini.

Gini jest równa: (Średnia wariancja dochodów) / (2 * średnia)

Ponieważ Gini jest znormalizowanym wskaźnikiem i nie zależy od poziomu dochodu, tylko wariancję, możesz zbudować przybliżoną miarę gini na podstawie swoich danych.

Jeśli założymy, że 0-25 K = 0, 25 K-50 K = 1, 50 K-75 K = 2 itd. Możesz traktować wiadra jak dochody. Następnie można obliczyć średnią wariancję między dochodami ważonymi liczbą osób w każdym segmencie i podzielić ją przez dwukrotność średniego dochodu (segmentu). W ten sposób stworzyłeś przybliżony współczynnik gini dla każdego kodu pocztowego.

Należy zauważyć, że ta statystyka jest przybliżona i nie do końca dokładna, ponieważ ignoruje wszelkie zmiany w rozkładzie dochodów w ramach koszyka. Może się zdarzyć, że wiadro 25–50 tys. Ma większość swoich ludzi o dochodzie 40 tys. I niewiele w dochodzie 25 tys., Co negatywnie wpłynęłoby na twoje oszacowanie gini.

Zakładając, że jest to dokument badawczy, należy omówić tę metodologię i ujawnić ewentualne wady tego oszacowania. Zapewnia jednak najlepsze przybliżenie nierówności, biorąc pod uwagę posiadane informacje.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.