Uogólniając „sztuczkę środkową” do wyższych wymiarów?


22

W przypadku algorytmów losowych przyjmujących rzeczywiste wartości „sztuczka medianowa” jest prostym sposobem zmniejszenia prawdopodobieństwa niepowodzenia do dowolnego progu , kosztem tylko wielokrotności narzut. Mianowicie, jeśli wyjście mieści się w „dobrym zakresie” z prawdopodobieństwem (co najmniej) , to uruchamianie niezależnych kopii i przyjmując medianę swoich wyników spowoduje, że wartość spadnie do z prawdopodobieństwem co najmniej granicach Chernoffa / Hoeffdinga.Aδ>0t=O(log1δ)AI=[a,b]2/3A1,,Ata1,,atI1δ

Czy istnieje jakieś uogólnienie tej „sztuczki” do wyższych wymiarów, powiedzmy , gdzie dobrym zasięgiem jest teraz zestaw wypukły (lub kula lub jakikolwiek wystarczająco ładny i uporządkowany zestaw)? To znaczy, biorąc pod uwagę zrandomizowany algorytm wyprowadzający wartości w oraz „dobry zestaw” taki, że dla wszystkich , w jaki sposób można zwiększyć prawdopodobieństwo sukcesu do przy koszcie logarytmicznym tylko w ?RdARdSRdPr{A(x,r)S}2/3x1δ1/δ

(Odmiennie sformułowane: biorąc pod uwagę ustalone, arbirary z gwarancją, że co najmniej z należy do , czy istnieje procedura wyprowadzanie wartości z ? Jeśli tak, to czy istnieje efektywna?)2 ta1,,atRd aiSS2t3aiSS

A jaki jest minimalny zestaw założeń, których potrzebuje aby powyższe było możliwe do osiągnięcia?S

Przepraszam, jeśli okaże się to trywialne - nie mogłem znaleźć odniesienia do tego pytania ...


3
Czy w szczególnym przypadku, gdy jest prostopadłościanem, działa, jeśli zastosujesz lewą sztuczkę w każdym wymiarze indywidualnie? Próbkuj więc kilka punktów, a następnie weź środkową ich współrzędne w wymiarze 1, 2, ..., d, a następnie uzyskasz punkt w . Być może będziesz potrzebować próbek z tą strategią? R d O ( log ( d / ϵ ) )SRdO(log(d/ϵ))
Robin Kothari,

1
W przypadku jednowymiarowym zwykle znasz ale nie dokładny przedział (chociaż nawet jeśli nie znasz sztuczka mediana nadal działa). Czy powinniśmy założyć, że znamy ale tylko do tłumaczenia? Do tłumaczenia i skalowania? b - a S.babaS
Sasho Nikolov

@SashoNikolov Sądzę, że byłby to najbardziej „ogólny uogólnienie” (np. Wiemy tylko, że jest „dobrą kulą o średnicy ”). εSε
Klemens C.

1
Cóż, to, co napisał Thomas w swojej odpowiedzi, jest jeszcze bardziej ogólne: zakłada, że ( w swojej odpowiedzi) jest nieznanym zbiorem wypukłym. GSG
Sasho Nikolov

Odpowiedzi:


17

To, czego szukasz, to prawie ta sama silna tendencja centralna : sposób zredukowania chmury punktów danych do jednego punktu, tak że jeśli wiele punktów danych jest zbliżonych do jakiejś „podstawowej prawdy”, ale reszta z nich są dowolnie daleko, wtedy twój wynik będzie również bliski prawdzie podstawowej. „Punktem podziału” takiej metody jest ułamek arbitralnie złych wartości odstających, które może tolerować. Różnica polega na tym, że w twoim przypadku chcesz zastąpić „blisko” przez „w wypukłym kadłubie”.

Jednym ze sposobów na uchwycenie tego jest pojęcie głębokości Tukey. Punkt ma głębokość Tukeya (w odniesieniu do danego zestawu punktów danych), jeśli każda półprzestrzeń zawierająca dany punkt zawiera również co najmniej punktów danych. Jeśli istnieje dobra wypukła podprzestrzeń, w której chcesz się znaleźć, to punkt o głębokości Tukeya będzie w niej, dopóki będzie w niej co najmniej punktów danych. Zatem punktem podziału tej metody jest największa wartość , jaką można uzyskać.n p n p ( 1 - p ) n ppnpnp(1p)np

Niestety ten punkt podziału wynosi , nie jest blisko 1/2, zarówno dla głębokości Tukey, jak i dla twojego problemu. Oto dlaczego: jeśli twoje dane są skupione w pobliżu wierzchołków jednostronnych, to tak długo, jak mniej niż część jest wartościami odstającymi (ale nie wiesz, które), to dowolny punkt w simplex jest bezpieczny do wybrania, ponieważ zawsze znajdzie się w wypukłym kadłubie elementów odstających. Ale jeśli więcej niż punktów może być wartościami odstającymi, to nie ma bezpiecznego miejsca do wybrania: niezależnie od tego, który punkt w elemencie wybranym wybierzesz, wartościami odstającymi mogą być wszystkie punkty z najbliższego wierzchołka liczby pojedynczej i byłbyś poza kadłubem nietypowych.d + 1 1 / ( d + 1 ) 1 / ( d + 1 )1/(d+1)d+11/(d+1)1/(d+1)

Jeśli jesteś gotów tolerować gorszy punkt przebicia, bardziej jak , jest to metoda na znalezienie randomizowane głęboki punkt, który jest wielomian zarówno i : patrz mój papiern dO(1/d2)nd

Przybliżenie punktów środkowych za pomocą iterowanych punktów Radona, K. Clarkson, D. Eppstein, GL Miller, C. Sturtivant i S.-H. Teng, 9. ACM Symp. Komp. Geom. , San Diego, 1993, ss. 91–98, Int. J. Comp. Geom. I Appl. 6 (3): 357–377, 1996, http://kenclarkson.org/center/p.pdf


Tak. Ponadto wspomnę, że można użyć aproksymacji eps-eps i ich różnych przyjaciół jako sposobu na uzyskanie małej próbki, która dobrze przybliża takie miary głębokości. Nie dostajesz ani jednego punktu, ale dostajesz znacznie więcej informacji.
Sariel Har-Peled,

Czy w znanej terminologii twojego artykułu istnieje znany skuteczny sposób weryfikacji zastrzeżonego centrum dla liczb wymiernych ? βββ

Jeśli przez „wydajny” rozumiesz wielomian w wymiarze, to nie wiem o takim wyniku. W mojej pracy znajduje się tylko jeden punkt, nie zawiera więcej informacji na temat przestrzennego rozkładu głębokości (jak na przykład Sariel wspomina powyżej).
David Eppstein,

Dziękuję Ci! Odkładając na bok rozważania dotyczące wydajności (na razie), wygląda to na powiedzenie, że w ogólnym przypadku arbitralnych zbiorów wypukłych nie ma sposobu, aby zwiększyć stałe prawdopodobieństwo do dowolnego prawdopodobieństwa? (skoro ułamek dobrych punktów musi być większy niż ? pomysł „niezależnych powtórzeń”, w którym mielibyśmy pod ręką kilka zestawów punktów, z których każdy miałby co najmniej ułamka dobrych punktów.) 2/311d+12/3
Clement C.

1
Jeden punkt, kilka punktów lub nie, jeśli wszystko, co wiesz, to że istnieje zestaw wypukły, ale nie tam, gdzie on jest, i chcesz być w stanie zwiększyć prawdopodobieństwo znalezienia się w prawidłowym zestawie na lepszym niż d / (d + 1), to ułamek dobrych punktów musi wynosić co najmniej d / (d + 1), aby obejść przykład simpleks. W przeciwnym razie przeciwnik mógłby podać dane w postaci simpleksu i losowo wybrać sąsiedztwo epsilon jednej powierzchni simpleksu jako zestaw wypukły; nawet jeśli zgadniesz losowo punkt w pobliżu wierzchołka simpleksu, będziesz miał co najmniej 1 / (d + 1) prawdopodobieństwo niewłaściwego wyboru.
David Eppstein,

14

To miłe pytanie i już o tym myślałem. Oto, co wymyśliliśmy:

Uruchomieniu algorytmu razy, aby dostać wyjścia i wiesz, co z dużym prawdopodobieństwem duża część s upadku na jakiegoś dobrego zestawu . Nie wiesz, co to jest , tylko to, że jest wypukłe. Dobrą wiadomością jest to, że istnieje sposób na uzyskanie punktu w bez dalszych informacji na ten temat. Nazwij ten punkt .nx1,,xnRdxiGGGf(x1,,xn)

Twierdzenie. Dla wszystkich liczb naturalnych i istnieje funkcja taka, że ​​zachowane są następujące elementy. Niech i niech będzie wypukłym zestawem spełniającymNastępnie . Ponadto jest obliczalne w czasie wielomianu w . ndf:(Rd)nRdx1...xnRdGRd
1n|{i[n]:xiG}|>dd+1.
f(x1,...,xn)Gfnd

Zauważ, że dla możemy ustawić na medianę. To pokazuje, jak uogólnić medianę dla .d=1fd>1

Przed udowodnieniem tego wyniku, zwróć uwagę, że jest ciasny: Niech i niech będą standardowymi elementami podstawowymi, a . Każdy podzbiór punktów jest zawarty w afinicznej przestrzeni o wymiarze (który jest jednoznacznie określony przez te punkty). Ale nie ma sensu we wszystkich tych afinicznych przestrzeniach. Stąd jest wypukły który zawiera punktów, ale nie zawiera , bez względu na jaką wartość.n=d+1x1,,xdxd+1=0dGd1Gnd/(d+1)=df(x1,,xn)

Dowód. Używamy następującego wyniku.

Twierdzenie Helly. Niech będą wypukłymi podzbiorami . Załóżmy, że przecięcie dowolnego s jest niepuste. Zatem przecięcie wszystkich jest niepuste.K1...KmRdd+1 KiKi

Kliknij tutaj, aby uzyskać dowód twierdzenia Helly.

Teraz, aby udowodnić nasze twierdzenie:

Niech za górną granicę liczby punktów nie w . Rozważ wszystkie zamknięte półprzestrzenie zawierający co najmniej punktów, a ich granica zawiera zestaw punktów o maksymalnej wartości (jest to skończona liczba półprzestrzeni, ponieważ każde jest zdefiniowane przez punktów na granicy).k<n/(d+1)GK1...KmRdnkKid+1

Uzupełnienie każdego zawiera najwyżej punktów. Przez granicę związkową przecięcie dowolnych zawiera co najmniej > 0 punktów. Zgodnie z twierdzeniem Helly (ponieważ półprzestrzenie jest wypukłe) istnieje punkt na przecięciu wszystkich . Pozwalamy być funkcją, która oblicza dowolny punkt na przecięciu .Kikd+1 Kink(d+1)KisfKi

Pozostaje to, aby pokazać, że przecięcie się y zawarty jest w .KiG

Bez utraty ogólności jest wypukłym kadłubem podzbioru punktów o pełnej randze. Oznacza to, że możemy zastąpić wypukłym kadłubem punktów w nim zawartych. Jeśli to nie ma pełnej rangi, możemy po prostu zastosować nasze twierdzenie w niższym wymiarze.GG

Każda ściana definiuje półprzestrzeń, gdzie jest przecięciem tych półprzestrzeni. Każda z tych półprzestrzeni zawiera a zatem zawiera co najmniej punktów. Granica jednego z tych półprzestrzeni zawiera twarz a zatem zawiera zestaw punktów o maksymalnej wartości. Zatem każda z tych półprzestrzeni jest . Zatem przecięcie wszystkich jest zawarte w , zgodnie z wymaganiami.GGGnkGKiKiG

Aby obliczyć , skonfiguruj program liniowy, w którym ograniczenia liniowe odpowiadają s, a wykonalne rozwiązanie odpowiada punktowi przecięcia wszystkich s. CO BYŁO DO OKAZANIAfKiKi

Niestety, ten wynik nie jest zbyt praktyczny w ustawieniach wysokowymiarowych. Dobrym pytaniem jest, czy możemy obliczać bardziej wydajnie:f

Otwarty problem. Udowodnić wyżej twierdzenia z dodatkowym wniosku, że może być obliczony czas wielomian i . fnd

Poza tym: Możemy również zmienić problem, aby uzyskać wydajne rozwiązanie: jeśli mają właściwość, że ściśle ponad połowa z nich leży w kulce , możemy znaleźć punkt który znajduje się w w czasie wielomian i . W szczególności możemy ustawić dla dowolnego tak że dokładnie więcej niż połowa punktów znajduje się w .x1,,xnB(y,ε)zB(y,3ε)ndz=xiiB(z,2ε)


Myślę, że w zasadzie odkryłeś na nowo głębię Tukey, jak opisuje David Eppstein poniżej :)
Suresh Venkat

7

Istnieje pojęcie mediany zbioru punktów w wysokich wymiarach i ogólnych normach, które jest znane pod różnymi nazwami. To tylko punkt, który minimalizuje sumę odległości do wszystkich punktów w zestawie. Wiadomo, że ma podobną właściwość wzmocnienia ufności jak zwykła mediana z niewielkim multiplikatywnym wzrostem odległości. Szczegóły znajdują się w Twierdzeniu 3.1 tego dokumentu: http://arxiv.org/pdf/1308.1334.pdf

Jedną fajną rzeczą, którą pokazuje ten artykuł, jest to, że czynnikiem, dzięki któremu zwiększa się odległość, można ustawić dowolną stałą> 1, jeśli można zwiększyć z arbitralnie wysokiej (ale stałej <1) pewności.

Edycja: istnieje inny niedawny artykuł na ten temat autorstwa Hsu i Sabato http://arxiv.org/pdf/1307.1827v6.pdf Przeważnie analizuje i stosuje procedurę, w której punkt w zestawie o najmniejszej medianie odległości do reszty punktów jest używany. Tę procedurę można zastosować z dowolną miarą, ale daje ona jedynie współczynnik przybliżenia 3.


Dzięki, to ładnie wygląda! Do tej pory tylko go przejrzałem, ale (chyba że się mylę lub przeskoczyłem zbyt szybko), dotyczy to konkretnego przypadku, gdy jest kulą; czy to jest poprawne? Sp
Klemens C.

1
Nie całkiem. Wynik podano dla wszystkich pól Banacha. Dla każdego ciała, które jest wyśrodkowane i symetryczne wokół jego środka, istnieje odpowiednia norma, w której to ciało jest kulą jednostkową. Ponieważ do celów twojego pytania możemy założyć bez utraty ogólności, że wypukłe ciało jest zorientowane na pochodzenie, otrzymujemy wyniki dla każdego centralnie symetrycznego wypukłego ciała. Być może przy niewielkim wysiłku wynik można rozszerzyć na ogólnie wypukłe ciała.
Witalij

1
Musisz jednak znać normę, aby obliczyć minimalizator dla tej normy - jeśli wiesz tylko, że istnieje norma, ale nie jest to, czym ona jest, nie masz szczęścia.
David Eppstein,

1
Masz rację, David. Musisz znać normę. (Przekłada się to na znajomość wypukłego ciała do środka i skalowanie).
Witalij

Myślałem o takim podejściu, ale potem pomyślałem o tym kontrprzykładzie dla dowolnych zbiorów wypukłych. Jak to wpływa na te wyniki? Niech będzie rozmieszczony w płaszczyźnie w następujący sposób: z prawdopodobieństwem , równomiernie na i , z prawdopodobieństwem , równym . Wypukły „dobry” zestaw to linia od do . Ale jeśli weźmiemy wiele próbek, uogólniona mediana będzie jednym z próbkowanych punktów położonych w . Uogólnij to łatwo do wyższych wymiarów za pomocą hiperpłaszczyzny i punktu lekko przesuniętego. 0,9 ( - 1 , 0 ) ( + 1 , 0 ) 0,1 ( 0 , 0,0001 ) ( - 1 , 0 ) ( 1 , 0 ) ( 0 , 0,0001 )X0.9(1,0)(+1,0)0.1(0,0.0001)(1,0)(1,0)(0,0.0001)
usul
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.