Nie jestem pewien, jakie konkretnie masz dane, ale wygląda na to, że masz wystarczającą ilość danych, aby obliczyć przybliżone oszacowanie gini.
Gini jest równa: (Średnia wariancja dochodów) / (2 * średnia)
Ponieważ Gini jest znormalizowanym wskaźnikiem i nie zależy od poziomu dochodu, tylko wariancję, możesz zbudować przybliżoną miarę gini na podstawie swoich danych.
Jeśli założymy, że 0-25 K = 0, 25 K-50 K = 1, 50 K-75 K = 2 itd. Możesz traktować wiadra jak dochody. Następnie można obliczyć średnią wariancję między dochodami ważonymi liczbą osób w każdym segmencie i podzielić ją przez dwukrotność średniego dochodu (segmentu). W ten sposób stworzyłeś przybliżony współczynnik gini dla każdego kodu pocztowego.
Należy zauważyć, że ta statystyka jest przybliżona i nie do końca dokładna, ponieważ ignoruje wszelkie zmiany w rozkładzie dochodów w ramach koszyka. Może się zdarzyć, że wiadro 25–50 tys. Ma większość swoich ludzi o dochodzie 40 tys. I niewiele w dochodzie 25 tys., Co negatywnie wpłynęłoby na twoje oszacowanie gini.
Zakładając, że jest to dokument badawczy, należy omówić tę metodologię i ujawnić ewentualne wady tego oszacowania. Zapewnia jednak najlepsze przybliżenie nierówności, biorąc pod uwagę posiadane informacje.