Piszę to dość szybko z powodu poważnych ograniczeń czasowych (i nawet nie dostałem wcześniej odpowiedzi z tego samego powodu), ale pomyślałem, że spróbuję przynajmniej wpłacić moje dwa centy.
Myślę, że to naprawdę świetne pytanie i spędziłem niemiłe ilości czasu w ciągu ostatnich kilku lat, zastanawiając się nad tym. (Pełne ujawnienie: Otrzymałem dużą część mojego obecnego finansowania właśnie po to, aby spróbować znaleźć odpowiedzi na tego typu pytania, a następnie potencjalnie przekształcić głębsze wgląd w SAT w bardziej wydajne rozwiązania SAT.)
Myślę, że gdyby ktoś musiał udzielić odpowiedzi w jednym zdaniu
nikt tak naprawdę nie wie i jest to aktywny obszar badań
jest prawie tak dobry, jak to tylko możliwe. Tyle, że jest o wiele więcej miejsca na większą aktywność, szczególnie od strony teorii.
Niektóre proponowane wyjaśnienia (nie wykluczające się wzajemnie), które zostały już omówione w innych odpowiedziach i komentarzach, są
- a) tylne drzwi,
- (b) sparametryzowane względy złożoności,
- (c) struktura graficzna problemu CNF,
- (d) względy złożoności dowodu oraz
- (e) przejścia fazowe.
Począwszy od końca (e), wydaje się, że istnieje pewne zamieszanie dotyczące przejść fazowych. Krótka odpowiedź tutaj jest taka, że nie ma żadnego powodu, aby sądzić, że stosunek klauzul do zmiennych jest istotny dla zastosowanych problemów lub teoretycznych problemów kombinatorycznych (czyli spreparowanych przypadków). Ale z jakiegoś powodu nie jest zbyt rzadkim nieporozumieniem w stosowanej części społeczności SAT, że stosunek klauzul do zmiennych powinien w jakiś sposób być ogólnie istotną miarą. Stosunek klauzuli do zmiennej jest bardzo istotny dla losowego k-SAT, ale nie dla innych modeli.
Mam wrażenie, że tylne drzwi (a) były popularnym wytłumaczeniem, ale osobiście tak naprawdę nie widziałem przekonujących dowodów, które wyjaśniają, co dzieje się w praktyce.
Sparametryzowana złożoność (b) zapewnia piękną teorię na temat niektórych aspektów SAT, a bardzo atrakcyjną hipotezą jest to, że instancje SAT są łatwe, ponieważ mają tendencję do „zbliżania się do jakiejś wyspy wykonalności”. Myślę, że ta hipoteza otwiera wiele ekscytujących kierunków badań. Jak zauważono w niektórych odpowiedziach, istnieje wiele powiązań między (a) i (b). Jednak do tej pory nie widzę żadnych dowodów na to, że sparametryzowana złożoność zbyt mocno koreluje z tym, co dzieje się w praktyce. W szczególności wydaje się, że możliwe do wykonania instancje mogą być bardzo trudne w praktyce, a instancje bez małych tylnych drzwi mogą być bardzo łatwe.
Wyjaśnienie, które wydaje mi się najbardziej wiarygodne dla instancji przemysłowych, to (c), a mianowicie, że struktura (graficzna) omawianych wzorów CNF powinna być skorelowana z praktyczną wydajnością SAT. Chodzi o to, że zmienne i klauzule instancji przemysłowych mogą być grupowane w dobrze połączone społeczności z kilkoma połączeniami między nimi, a solwery SAT w jakiś sposób wykorzystują tę strukturę. Niestety, bardziej rygorystycznie wydaje się to dość trudne i równie niestety w tym obszarze występuje spory szum. Proponowane wyjaśnienia, które do tej pory widziałem w dokumentach, są dość niezadowalające, a modele wydają się łatwe do zestrzelenia. Problemem wydaje się być to, że jeśli ktoś naprawdę chce to zrobić dokładnie, wtedy matematyka staje się naprawdę trudna (ponieważ jest to trudny problem), a także staje się wyjątkowo nieuporządkowana (ponieważ potrzebujesz modelu, który jest wystarczająco blisko rzeczywistości, aby uzyskać odpowiednie wyniki). W szczególności artykuły, które widziałem wyjaśniające, że wydajność heurystyk VSIDS (suma rozpadu niezależna od stanu zmiennego) dla zmiennych wyborów działa dobrze, ponieważ bada społeczności na graficznej reprezentacji instancji są dość nieprzekonujące, chociaż hipoteza jako taka jest nadal aktualna bardzo atrakcyjny.
Jedną z linii badań, które osobiście przeprowadziłem, jest to, czy praktyczna wydajność SAT w jakiś sposób koreluje z miarami złożoności dowodowej omawianych wzorów CNF. Niestety wydaje się, że krótka odpowiedź brzmi, że tak naprawdę nie ma wyraźnego i przekonującego związku. Być może nadal istnieją nietrywialne korelacje (jest to coś, co obecnie badamy na różne sposoby), ale wydaje się, że teoria jest zbyt ładna, czysta i ładna, a rzeczywistość jest zbyt niechlujna, aby można było naprawdę dobrze dopasować. (Odnosząc się do artykułu dotyczącego miar złożoności dowodu i twardości praktycznej SATJärvisalo, Matsliah, Nordström i Živný w CP '12 okazało się, że bardziej szczegółowe eksperymenty dostarczają o wiele bardziej złożony obraz z mniej jasnymi wnioskami --- mamy nadzieję uzyskać pełną wersję czasopisma informującą o tym w każdej dekadzie, ale jest to skomplikowane, choć mam nadzieję, że interesujące.)
Kolejną, pokrewną linią prac nad złożonością dowodu jest modelowanie supernowoczesnych solverów SAT jako systemów dowodu i dowodzenie twierdzeń w tych modelach w celu wywnioskowania właściwości odpowiednich solverów. Jest to jednak trochę pole minowe, ponieważ małe i pozornie nieszkodliwe wybory projektowe po stronie modelu teoretycznego mogą prowadzić do tego, że wyniki są praktycznie zupełnie nieistotne z praktycznego punktu widzenia. Z drugiej strony, jeśli ktoś chce modelu teoretycznego wystarczająco zbliżonego do rzeczywistości, aby uzyskać odpowiednie wyniki, wówczas model ten staje się wyjątkowo nieuporządkowany. (Wynika to z faktu, że wydajność solvera SAT zależy od globalnej historii wszystkiego, co do tej pory wydarzyło się w niebanalny sposób, a to oznacza, że model nie może być modułowy w sposób, w jaki zwykle konfigurujemy nasze systemy dowodowe --- czy dany krok wyprowadzania jest "poprawny"
Dwa artykuły, które naprawdę należy wymienić jako wyjątki, to [Pipatsrisawat i Darwiche 2011] oraz [Atserias, Fichte i Thurley 2011], w których wykazano, że klauzula ucząca się o konfliktach, rozwiązująca modele SAT w naturalny sposób, ma: potencjał do wielomianowej symulacji pełnej, ogólnej rozdzielczości. Istnieje dość długa lista artykułów poprzedzających [PD11] i [AFT11], które zasadniczo twierdzą, że ten sam wynik, ale wszystkie mają poważne problemy z modelowaniem. (Prawdą jest, że [PD11] i [AFT11] również potrzebują pewnych założeń do działania, ale są to właściwie te minimalne, których można się spodziewać, chyba że poprosisz o dokumenty, które pokazałyby również, że sparametryzowana hierarchia złożoności ulega załamaniu.)
Ponownie piszę to wszystko bardzo szybko, ale jeśli istnieje jakiekolwiek zainteresowanie powyższym, mógłbym spróbować je rozwinąć (chociaż może to chwilę potrwać, aby wrócić do tego ponownie - nie wahaj się ze mną pingować, jeśli tam jest) to wszystko, co chciałbyś, żebym skomentował). Jako szybki sposób na dostarczenie referencji, pozwól mi zrobić kilka bezwstydnych wtyczek (chociaż wstyd nieco się zmniejsza, gdy widzę, że niektóre komentarze cytowały również niektóre z tych referencji):
Dyskusja Tutorial stylu Na interakcji pomiędzy Dowód złożoność i SAT Rozwiązywanie podano w Międzynarodowej Szkole Letniej na spełnialności teorie spełnialności Modulo i Automated rozumowanie w 2016 roku z dużą ilością pełnych odniesień na końcu zjeżdżalni: http://www.csc .kth.se / ~ jakobn / research / TalkInterplaySummerSchool2016.pdf
Nieco nowsza i krótsza dyskusja w ankiecie Zrozumienie rozwiązywania problemów opartych na konflikcie SAT dzięki obiektywowi złożoności dowodu od początku 2017 r. (Również z pełnymi referencjami na końcu): http://www.csc.kth.se/~jakobn/research /TalkProofComplexityLensCDCL1702.pdf
Badanie związków między złożonością dowodu a rozwiązywaniem SAT: http://www.csc.kth.se/~jakobn/research/InterplayProofCplxSAT.pdf [Odniesienia bibliograficzne: Jakob Nordström. O wzajemnym oddziaływaniu złożoności dowodu i rozwiązywania problemów SAT. ACM SIGLOG News, tom 2, numer 3, strony 19-44, lipiec 2015. (Wersja lekko edytowana z poprawionymi literówkami.)]
Artykuł SAT '16 z CDCL wiernie modelowanym jako system dowodowy: http://www.csc.kth.se/~jakobn/research/Trade-offsTimeMemoryModelCDCL_SAT.pdf [Odniesienia bibliograficzne: Jan Elffers, Jan Johannsen, Massimo Lauria, Thomas Magnard , Jakob Nordström i Marc Vinyals. Kompromisy między czasem a pamięcią w ściślejszym modelu solverów CDCL SAT. W materiałach z 19. Międzynarodowej Konferencji Teorii i Zastosowań Testów Satysfakcji (SAT '16), Wykład Notatki z informatyki, tom 9710, strony 160-176, lipiec 2016 r.]