To doskonałe pytanie, które zadawano mi ostatnio kilka razy, odkąd pracuję dla firmy weryfikującej adresy o nazwie SmartyStreets.
Po pierwsze, adres pocztowy reprezentuje pojedynczy punkt lokalizowalny na mapie. Sam adres jest z natury łagodny, ponieważ nie zawiera żadnych dodatkowych informacji. Rysowanie punktu na mapie nic nie robi. Dopiero gdy zaczniesz przypisywać KONTEKST do tego punktu (adresu), zaczyna on coś znaczyć.
Mając to na uwadze, adres pocztowy może reprezentować osobę, organizację, budynek, samochód, cokolwiek innego. Po rozpoczęciu gromadzenia wielu adresów pocztowych zwiększasz kontekst, który można wyprowadzić z tej grupy. Podobieństwa można ustalić, aby zobaczyć, co mają wspólnego adresy. Jednak tylko grupowanie adresów w podobnym obszarze nie oznacza dużego kontekstu. Mogę spojrzeć na mapę Google i zobaczyć wszystkie domy w określonym obszarze. Nie stanowi to naruszenia prywatności, chyba że mam nieautoryzowany dostęp do uprzywilejowanych informacji.
Inne punkty kontekstu muszą być łączone, aby faktycznie ujawniać jakiekolwiek dane prywatne. Na przykład grupa adresów pocztowych przesłanych do usługi online w celu weryfikacji adresu i / lub geokodowania nie podaje informacji, chyba że wiesz, kto przesłał listę do przetworzenia. Po poznaniu właściciela listy można wyciągnąć pewne wnioski na temat zamierzonego wykorzystania listy. Znajomość tego dodatkowego kontekstu, takiego jak właściciel listy i zamierzone użycie, z pewnością kwalifikuje się jako informacja uprzywilejowana i może stanowić źródło naruszenia prywatności.
Opcjonalnym rozwiązaniem jest udostępnienie przetwarzania „we własnym zakresie”, tak aby nie była zaangażowana żadna zewnętrzna usługa danych. Z pewnością wyklucza to wszelkiego rodzaju nieautoryzowany dostęp do informacji uprzywilejowanych. Weryfikacja adresu i geokodowanie nie są zadaniami niewtajemniczonych i z pewnością wymagają zaawansowanych umiejętności (co oznacza doświadczenie zdobyte z czasem) w celu przetwarzania bardzo dużych list bez zużywania nadmiernej ilości czasu i zasobów. Więc wprowadzenie go do domu jest z pewnością opcją, ale czy każda firma, która ma poufne informacje o adresie, ma zasoby do własnego własnego „bezpiecznego” przetwarzania adresu (w tym geokodowania) we własnym zakresie? Nie. (Chociaż z pewnością oznaczałoby to bezpieczeństwo pracy dla czytelników tej witryny).
Istnieją sposoby na zachowanie wymaganej prywatności i korzystanie z usług online. Jedną z metod byłoby założenie konta, przetestowanie wszystkiego i ustalenie, a następnie, korzystając z tymczasowego adresu e-mail, założyć nowe konto z niepowiązanym adresem rozliczeniowym powiązanym z kartą kredytową, którego nie można zidentyfikować. Przetwarzanie adresów na tym koncie teoretycznie nie ujawniłoby żadnego cennego kontekstu, a tym samym zachowałoby prywatność osób na liście. (To zaczyna brzmieć jak film Enemy Of The State .
Jeśli brzmi to skomplikowanie i jest zbędne, zgadzam się. Prostszą metodą byłoby skorzystanie z interfejsu API korzystającego z HTTPS i POST, który nie przechowuje ani nie rejestruje żadnych przetwarzanych danych. Zastosowanie HTTPS oznacza, że jedynym rekordem byłby znacznik czasu i adres IP, z którego dzwonisz. Podstawowy adres URL nie byłby znany. Oczywiście konto, którego używasz, prowadzi do ciebie, ALE, to nie jest problem, ponieważ użycie żądania POST pozwala na dołączenie ładunku (w tym przypadku partii adresów), a zawartość ładunku nie jest rejestrowana. Dlatego przesłane adresy nie znajdują się w żadnym dzienniku serwera. A fakt, że pamięć jest czyszczona między poszczególnymi procesami, oznacza, że adresy te nigdy nie są przechowywane ani rejestrowane, a ich przesyłanie z powrotem do Ciebie odbywa się za pośrednictwem bezpiecznego połączenia.
13Mar2012 06:31 (-6) IP: 12.134.223.12 UserID: 875564 - POST QTY: 3439942 - [przetworzony]
Każdy, kto spojrzy na dzienniki, zobaczy tylko, że przetworzyłeś niektóre adresy i nie miałby pojęcia, jakie adresy zostały przetworzone. Spełnia to nawet najostrzejsze wymagania polityki prywatności. Nie miałbym sensu zaznaczać, że ten rodzaj usługi jest dostępny (i bardzo szybki ), nie wspominając, gdzie go znaleźć. Jest już wbudowany w usługę API LiveAddress od SmartyStreets. Inne usługi, takie jak Cdyne, QAS i ServiceObjects, mogą również oferować podobne usługi, ale jeszcze o nich nie słyszałem.