Nie wiem, czy uznasz to za nietrywialne podejście, ale proszę bardzo.
Po pierwsze, aby było jasne, abyśmy się nie mylili c-DNF z k-term DNF (co często robię), an cFormuła -DNF nad zmiennymi x1,…,xn ma formę ∨ki=1(ℓi,1∧ℓi,2...ℓi,c) gdzie ∀1≤i≤k i 1≤j≤c, ℓi,j∈{x1,…,xn,x¯1,…,x¯n}.
Możemy najpierw zapytać, ile różnych terminów może istnieć w c-DNF. Każdy termin będzie miałc z nzmienne, każda zanegowana lub nie - co dla różnych możliwych terminów. W instancji 2-DNF każdy termin pojawi się albo nie, co oznacza możliwe „cele”, gdzie to przestrzeń hipotez.2c(nc)|H|=22c(nc)H
Wyobraź sobie algorytm, który pobiera próbek, a następnie wypróbowuje wszystkiehipotez, dopóki nie znajdzie takiej, która doskonale przewiduje na próbkach. Twierdzenie Brzytwy Ockhama mówi, że wystarczy pobrać około próbek, aby znaleźć algorytm cel z błędemm|H|m=O(1ϵ|(H|+1δ)≤ ϵ z prawdopodobieństwem .≥ 1 - δ
W tym przypadku, dla , , co oznacza, że będziesz potrzebowaćc = 2lg| H | =O(n2))n2) próbek do (właściwego) uczenia się.
Ale cała gra w uczeniu się nie jest tak naprawdę próbką złożoności (choć jest to część gry, szczególnie w uczeniu się wydajnym atrybutami), ale raczej w próbie zaprojektowania algorytmów czasu wielomianowego. Jeśli nie zależy ci na wydajności, ton2) jest najprostszą odpowiedzią na złożoność próbki PAC.
AKTUALIZACJA (ze względu na zmienione pytanie) :
Ponieważ wyraźnie stwierdziłeś, że zależy Ci tylko na złożoności próbki, przedstawiłem algorytm Occam Brute-Force, który jest prawdopodobnie najprostszym argumentem. Jednak moja odpowiedź była nieco nieśmiała. -DNF są faktycznie możliwe do nauczenia się w czasie wielomianowym! Jest to wynik oryginalnej pracy Valianta „ A Theory of the Learnable ”. W rzeczywistości -DNF można się nauczyć dla dowolnego .2)doc = O ( 1 )
Argument jest następujący. Możesz zobaczyć -DNF jako rozłączenie
„meta-zmiennych” i spróbować nauczyć się tego rozłączenia, eliminując meta-zmienne niezgodne z przykładami. Takie rozwiązanie można łatwo przetłumaczyć z powrotem na „właściwe” rozwiązanie i zajmuje czasu. Na marginesie, wciąż pozostaje otwarte, czy istnieje algorytm czasu wielomianowego dlado≈ndoO (ndo)c = ω ( 1 ) .
Jeśli chodzi o to, czy złożoność próbki jest również dolną granicą, odpowiedź jest prawie tak. Ten artykuł autorstwa Ehrenfeucht i in. pokazuje, że granica Occam jest prawie ciasna.n2)