Imię: pierwsze, ewentualnie środkowe i nazwisko.
Jestem ciekawy, ile informacji możesz wydobyć z nazwy, używając publicznie dostępnych zestawów danych. Wiem, że możesz uzyskać następujące z dowolnym między niskim a wysokim prawdopodobieństwem (w zależności od danych wejściowych) przy użyciu danych ze spisu powszechnego w USA: 1) Płeć. 2) Wyścig.
Na przykład Facebook wykorzystał dokładnie to, aby z przyzwoitym poziomem dokładności ustalić rasową dystrybucję użytkowników ich witryny (https://www.facebook.com/note.php?note_id=205925658858).
Co jeszcze można wydobywać? Nie szukam niczego konkretnego, to bardzo otwarte pytanie, aby uspokoić moją ciekawość.
Moje przykłady są specyficzne dla Stanów Zjednoczonych, więc założymy, że imię i nazwisko osoby znajdującej się w USA; ale jeśli ktoś wie o publicznie dostępnych zestawach danych dla innych krajów, jestem dla nich więcej niż otwarty.
Nie jestem do końca pewien, czy jest to właściwe miejsce, jeśli tak nie jest, doceniłbym, gdyby ktoś mógł wskazać mi bardziej odpowiednie miejsce.
Mam nadzieję, że jest to interesujące pytanie i jest to właściwe miejsce!