W przypadku aplikacji uczenia maszynowego moja grupa musi obliczyć odległość euklidesową do tego najbliższego sąsiada w zbiorze dla każdego (dla od 5 do około 100 oraz kilkaset do kilku milionów). Obecnie podejście albo oczywiste z drzewem kd na , które gdy jest wysokie, ajest stosunkowo niski, nigdy nie wygrywa. (Wszystko jest w pamięci.)
Wydaje się jednak, że musi istnieć lepszy sposób niż brutalna siła - przynajmniej taki, który wykorzystuje nierówność trójkąta, a może z hashami wrażliwymi na lokalizację. Racjonalnie ścisłe zbliżenie jest również potencjalnie w porządku.
Badania, które udało mi się znaleźć, wydają się koncentrować na problemie znalezienia pojedynczego najbliższego sąsiada (lub takiego, który jest w przybliżeniu najbliższy). Czy problem, którego szukam, ma inną nazwę, czy jest związek z powiązanym problemem, o którym nie myślałem?