Algorytmy modelu statystycznego zapytania?


13

Zadałem to pytanie w sprawdzonych krzyżowo pytaniach i odpowiedziach, ale wydaje się, że jest ono bardziej związane z CS niż ze statystykami.

Czy możesz podać mi przykłady algorytmów uczenia maszynowego, które uczą się na podstawie właściwości statystycznych zestawu danych, a nie samych indywidualnych obserwacji, tj. Wykorzystują statystyczny model zapytań ?


1
jaki jest model zapytania statystycznego?
Suresh Venkat

z gazety Kearns portal.acm.org/citation.cfm?doid=293347.293351 : „w tym modelu algorytm uczenia się nie może badać poszczególnych przykładów nieznanej funkcji celu, ale przyznaje dostęp do wyroczni podającej szacunki prawdopodobieństw na próbce przestrzeń losowych przykładów. ”. przepraszam, jeśli nie jest to oczywiste, zaktualizowałem swoje pytanie o link do artykułu
Deyaa

Odpowiedzi:


14

Niemal każdy algorytm działający w modelu PAC (z wyjątkiem algorytmów uczących się przez kontrolę parzystości) może zostać przystosowany do pracy w modelu SQ. Patrz np. Ten artykuł Blum i in. w którym kilka popularnych algorytmów jest tłumaczonych na ich odpowiedniki SQ ( Practical Privacy: the SuLQ framework ). Artykuł zasadniczo dotyczy „prywatności”, ale można to zignorować - tak naprawdę jest to po prostu implementacja algorytmów z zapytaniami SQ.

Z drugiej strony uczenie się agnostyczne jest znacznie trudniejsze w modelu SQ: pomijając kwestie obliczeniowe (choć są one ważne), złożoność próby wymagana do uczenia agnostycznego jest mniej więcej taka sama, jak wymagana do dokładnego uczenia się, jeśli faktycznie masz dostęp do punkty danych. Z drugiej strony, uczenie się agnostyczne staje się znacznie trudniejsze w modelu SQ - zwykle będziesz musiał zadawać wiele wielobiegunowo zapytań, nawet dla klas tak prostych jak rozdźwięki monotoniczne. Zobacz ten artykuł Feldmana ( Pełna charakterystyka uczenia się zapytań statystycznych wraz z aplikacjami do ewolucji ) lub ten ostatni artykuł Gupty i in. ( Zwolnienia prywatne i bariera zapytań statystycznych )


naprawdę miła odpowiedź Aaron :)
wielkie

7

Model SQ został opracowany w celu analizy uczenia się z tolerancją na hałas - mianowicie algorytm, który działa poprzez tworzenie zapytań statystycznych, będzie działał w ramach klasyfikacji hałasu. Jak powiedział Aaron, większość algorytmów PAC, które okazały się mieć odpowiedniki w modelu SQ. Jedynym wyjątkiem jest eliminacja Gaussa, która jest wykorzystywana w parytetach uczenia się (można nawet użyć sprytnej aplikacjinauczyć się logarytmów (n) parytetów wielkości loglogów (n) w modelu szumu klasyfikacyjnego). Wiemy również, że parzystości nie można się nauczyć za pomocą zapytań statystycznych i okazuje się, że najbardziej interesujące klasy, takie jak drzewa decyzyjne, mogą symulować funkcje parzystości. Dlatego w naszym dążeniu do uzyskania algorytmów uczenia się PAC dla wielu interesujących klas (takich jak drzewa decyzyjne, DNF itp.) Wiemy, że potrzebujemy zasadniczo nowych algorytmów uczenia się, które nie działają w statystycznym modelu zapytań.


Ciekawy. Czy masz odniesienie, że parytetów nie można się nauczyć w modelu SQ?
M. Alaggan,

1
zostało to udowodnione przez Kearnsa w jego oryginalnej pracy definiującej model: portal.acm.org/citation.cfm?doid=293347.293351, a następnie ponownie pokazane przez Blum i in., gdzie zdefiniowali wymiar SQ klasy portal.acm.org/citation .cfm? id = 195058.195147 . Zasadniczo argument jest następujący: parytety są „niezależne parami” względem równomiernego rozkładu, więc prawie trzeba odgadnąć prawidłową parzystość, aby się czegoś nauczyć, i istnieje wiele możliwych parytetów ...
Lev Reyzin

5

Chciałbym nieco wyjaśnić odpowiedź Aarona. Niemal każdy algorytm agnostyczny (ponownie, z wyjątkiem czegokolwiek, co wykorzystuje eliminację Gaussa) może zostać uruchomiony w modelu SQ. Oczywiście uczenie się agnostyczne jest trudniejsze niż uczenie się bez agnostyki, ale jest to niezależne pytanie.


/ϵ2
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.