Próbkowanie Agnostic PAC w dolnej granicy


10

Dobrze wiadomo, że do klasycznego uczenia się PAC, przykłady są konieczne, aby osiągnąć granicę błędu whp, gdzie jest wymiarem VC klasy koncepcyjnej.Ω(re/ε)εre

Czy wiadomo, że w przypadku agnostyki potrzebne są przykłady ?Ω(re/ε2))


3
Nie jestem pewien, jak wygląda dolna granica, należy istnieć, jeśli granica Hoefdinga jest ciasna (i chyba tak jest). To ograniczenie stwierdza, że ​​dla 1 fn, jeśli prawdopodobieństwo błędu wynosi p, to potrzebujesz najwyżej próbek, aby oszacować p do błędu + - whp Więc rozważ dowolną klasę koncepcji z 2 koncepcje, i f 2 i VC wymiaru 2. Należy się rozkład na przykładach, tak że P 1 = p 2 + ε (lub vice versa) - jest to możliwe, ponieważ VC wymiar 2. wydaje się, że przy użyciu algorytmu tylko O ( 1 / ϵ )ϵ f 1m=O(1/ϵ2))ϵfa1fa2)p1=p2)+ϵO(1/ϵ)przykłady sugerują ulepszoną oprawę Hoefdinga.
Aaron Roth,

1
Mianowicie, myślę Hoeffding jest związany mocno w do O ( 1 / ε 2 ) . Myślę, że powyższe rozumowanie jest ogólnie znane ...p=1/2)O(1/ϵ2))
Lew Reyzin

OK - wygląda na to, że mam kolejne ćwiczenie na kurs ML ... :) Dzięki za wkład, Aaron i Lew!
Aryeh

@Aaron, może to powinna być odpowiedź.
Suresh Venkat

Odpowiedzi:


6

Teraz zdaję sobie sprawę, że Anthony i Bartlett ustalili dolną granicę (zobacz prezentację tutaj ).

Edytuj 24 września 2018 r. To pytanie zajmowało mnie przez te wszystkie lata, a ostatnio I. Pinelis i ja uzyskaliśmy dokładnie optymalną stałą w agnostycznym dolnym przedziale PAC, aby pojawić się w Ann. Stat .


W swoim artykule nie cytujesz tej pracy ( jmlr.org/papers/volume17/15-389/15-389.pdf ). Czy optymalna złożoność próbki górnych granic w możliwym do zrealizowania przypadku nie ma żadnego związku z twoją pracą? Czy te odpowiadające optymalnej złożoności próbki górne granice są znane dla przypadku agnostycznego?
gradstudent

Nie wydaje mi się, żeby możliwy do zrealizowania przypadek był z tym związany. W możliwym do zrealizowania przypadku ERM nie gwarantuje optymalnych stawek - stąd cała ciężka praca, jaką Hanneke i inni musieli poświęcić, aby usunąć współczynnik logarytmiczny, i nadal nie wiadomo, czy właściwy uczeń może osiągnąć optymalny wskaźnik. Przeciwnie, w przypadku agnostyki od dawna wiadomo, że ERM osiąga optymalną szybkość.
Aryeh
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.