Czy nierozstrzygalne atrybuty P stanowią przeszkodę w podejmowaniu decyzji o P w porównaniu z NP? (odpowiedź: może)


20

Zadaje się pięć powiązanych pytań i oczekuje się jednej zintegrowanej odpowiedzi:

  • P1: Czy istnieją języki które są rozpoznawane wyłącznie przez maszyny Turinga w  których wykładników czasu wykonywania nie można rozstrzygnąć ?P.LP
  • Q2: Czy przykłady tych maszyn Turinga mogą być skończone?
  • P3: Czy te maszyny Turinga mogą być konkretnie tworzone? ( np. przez wyrocznie, które „zgadują” je, a nie skończą je konstruować).
  • P4: Jakie inne atrybuty P (oprócz wykładników czasu wykonywania) są obecnie znane jako nierozstrzygalne? Dla jakich atrybutów pytanie to jest otwarte?P
  • P5: Czy nierozstrzygalne atrybuty stanowią przeszkodę dla rozstrzygalności ?P N PPPNP

Zwróć uwagę na słowo „wyłącznie” w pierwszym kwartale (co wyklucza sugerowaną odpowiedź Lance'a Fortnowa).


Wnioski i konwersja na Wiki Wiki

  • Pytanie, które brzmi: „Czy nierozstrzygalne atrybuty P stanowią przeszkodę w podjęciu decyzji o P w porównaniu z NP?”, Jest otwarte i uważa się je za trudne, podobnie jak wiele szczegółowych pytań (takich jak Q1–4 powyżej), które są z nim naturalnie związane.

  • Monografia Jurisa Hartmanisa z 1978 r. Feasible Computations and Provable Complexity Properties stanowi dobry wstęp do literatury i (najwyraźniej) nie opublikowano żadnej recenzji od czasu Hartmanisa.

  • Ta klasa pytań jest wystarczająco niezbadana, że ​​wyzwanie znalezienia rygorystycznych dowodów jest ściśle zmieszane z wyzwaniem wyboru dobrych definicji początkowych.

  • Przemyślane uwagi i wnikliwe szkice dowodowe dostarczone przez Travis Service i Alex ten Brink są doceniane i doceniane.

Ponieważ pytanie jest otwarte i ponieważ jest omawiane w wielu wątkach matematycznych blogów ( 1 , 2 , 3 , 4 , 5 , 6 ), pytanie to zostało oflagowane do konwersji na Community Wiki.


Aktualizacja II i Podsumowanie

Uświadomiłem sobie, że monografię Jurisa Harmanisa z 1978 r. Wykonalne obliczenia i możliwe do udowodnienia właściwości złożoności można odczytać jako dogłębną odpowiedź na pytania 1–5 . Ponadto (doskonałe) szkice próbne Q1 i Q4 przedstawione poniżej przez Travis Service i Alexa Ten Brink stanowią nowoczesne potwierdzenie i rozszerzenie ogólnych wniosków Hartmanisa, że:

Wyniki dotyczące złożoności obliczeń zmieniają się dość radykalnie, jeśli weźmiemy pod uwagę tylko te właściwości obliczeń, które można formalnie udowodnić (podkreślenie Hartmanisa) ...

Dlatego powinniśmy oczekiwać, że wyniki dotyczące optymalności wszystkich programów wykonujących tę samą funkcję co dany program będą się różnić od wyników optymalizacyjnych dla wszystkich programów, które można formalnie udowodnić, że są równoważne z danym programem. ...

Powinniśmy [rozważyć] możliwość, że ten słynny problem [ ] może nie być rozwiązany w sformalizowanej teorii matematycznej, takiej jak teoria mnogości.P=?NP

W końcu mam nadzieję opublikować, jako formalną „odpowiedź” StackExchange TCS , dalsze cytaty z monografii Hartmanisa (wyjątkowo przewidującej).

Z monografii Hartmanisa i odpowiedzi udzielonych przez Travisa i Alexa wynika, że Q1–5 znacznie wykraczają poza obecny stan wiedzy w zakresie teorii złożoności. Co więcej, te pytania / odpowiedzi najwyraźniej są na tyle subtelne, że wymagają dokładnych korekt definicyjnych i uzasadniają ekspozycje o długości monografii… które, mam nadzieję, nie zniechęcają ludzi do zamieszczania dalszych odpowiedzi. :)

Dalszą dyskusję techniczną można znaleźć w odpowiedzi Joela Davida Hamkinsa na MathOverflow na pytanie Czy problem może być jednocześnie czasem wielomianowym i nierozstrzygalny? (zalecane przez Alex ten Brink).

Jeśli w monografii Hartmanisa zastąpiono „obliczenie funkcji” wyrażeniem „symulacja dynamiki”, wynik można odczytać jako traktat o teoretycznych ograniczeniach złożoności inżynierii systemów… jest to praktyczny powód, dla którego my inżynierowie dbamy o te problemy.

Oded Goldreich wyraził ostatnio przeciwną opinię do Hartmanisa w liście do redaktora CACM zatytułowanym „O złożoności obliczeniowej” :

Niestety, obecnie brakuje dobrych teoretycznych odpowiedzi na najbardziej naturalne pytania dotyczące wydajnego obliczania. Nie dzieje się tak dlatego, że zadajemy niewłaściwe pytania, ale dlatego, że pytania te są bardzo trudne.

Jest (oczywiście) całkowicie możliwe do wyobrażenia, że ​​zarówno opinie Hartmanisa, jak i Goldreicha okażą się słuszne, na przykład formalny dowód nierozstrzygalności rozdzielalności PvsNP można zasadnie uznać za potwierdzający oba punkty widzenia.


Aktualizacja I

Przemyślane komentarze (poniżej) Travisa Service i Alexa Ten Brinka sugerują (w efekcie), że w pierwszym kwartale wyrażenie „nierozstrzygalne” nie jest synonimem „nierozpoznawalnego” i że odpowiedzi na pytania 2–5 mogą zależeć od tego rozróżnienia. Nie jest dla mnie wcale jasne, który definitywny wybór doprowadziłby do najsilniejszych twierdzeń, a także najlepiej uchwycił naszą intuicję klasy P. Odpowiedzi i komentarze dotyczące tego pytania są mile widziane.

Przypomina się uwaga Felixa Kleina w jego elementarnej matematyce z zaawansowanego punktu widzenia: geometria (1939):

Innym przykładem koncepcji, która pojawia się z mniej lub bardziej precyzyjną naiwną percepcją przestrzeni, którą musimy dodać jako uzupełnienie naszego systemu geometrii, jest pojęcie (arbitralnej) krzywej . Każda osoba uważa, że ​​wie, czym jest krzywa, dopóki nie nauczy się tyle matematyki, że niezliczone możliwe nieprawidłowości mylą ją.

Podobnie jak w przypadku krzywych, tak też w przypadku języków akceptowanych przez maszyny Turinga w  … co kiedyś wydawało mi się (najprostsze i najbardziej naturalne ze wszystkich klas złożoności) teraz myli mnie (niezliczoną?) Niemożliwą do zweryfikowania i / lub nierozstrzygalną cechą jego członków . Szeroką motywacją w pytaniu 1–5 było znalezienie drogi przez ten zagmatwany gąszcz, ale dotychczasowe odpowiedzi (Travis Service i Alex ten Brink) dostarczyły dalszych powodów do zamieszania!P

Pokolenie matematyków Kleina ciężko pracowało nad znalezieniem dobrych definicji krzywych i innych podstawowych elementów teorii mnogości, geometrii i analizy. Przegląd na poziomie podstawowym można znaleźć w dyskusji na temat Alexandra Rogatej Sfery w Wikipedii

      Obraz Rogatej Sfery Aleksandra
      Osadzenie kuli w R3

W XX wieku analiza „dzikich rozmaitości”, takich jak sfera Aleksandra, pomogła wyjaśnić różnice między topologicznymi rozmaitościami, fragmentarycznie ciągłymi rozmaitościami i różnorodnymi rozmaitościami. Podobnie w XXI wieku być może udoskonalenia definicji związanych z pomogą oswoić dzikie języki P i dzikie maszyny Turinga… chociaż określenie odpowiednich udoskonaleń nie będzie łatwym zadaniem.PP


tło

Te powiązane pytania wynikają z pytań wiki społeczności MathOverflowJakie są najbardziej atrakcyjne nierozwiązywalne problemy Turinga w matematyce? ” I „ Jakie pojęcia są stosowane, ale nie są jasno zdefiniowane we współczesnej matematyce? ” W szczególności Colin Tan poprosił o postawienie pytania zadanego powyżej opublikowane jako osobne pytanie.

Aby zapoznać się z zapleczem technicznym, zobacz pytanie TCS StackExchangeCzy granice czasu wykonywania w P są rozstrzygalne? ”, W szczególności zwięzły dowód Emanuele Violi, że odpowiedź brzmi „nie”. Należy również zauważyć, że podobne wyniki udowodnił Juris Hartmanis w swojej monografii Wykonalne obliczenia i możliwe do udowodnienia właściwości złożoności (1978).

W tym tygodniu na blogu Lance Fortnow / Bill GASARCH Złożoność obliczeniowa jest gospodarzem ich sondażu Czy czy nie?P=NP - piąte i ostatnie zadane pytanie zachęca do komentowania pytania Fortnow / GASARCH.


1
jak wskazuje @Alex ten Brink, maszyny Turinga, o których mówisz w pierwszym kwartale, nie są dobrze zdefiniowane. Myślę, że trzeba myśleć o 'S i jest w twoim pytaniu, w przeciwieństwie do dowodu Violi.
Sasho Nikolov

@Shasho, dziękuję ... do zadanego pytania dodano potwierdzenie i podsumowanie punktów Alexa (a także punktów Travisa Service).
John Sidles,

1
Należy zauważyć, że dowód Emanuele Viola odnosi się do bardzo szerokiego zakresu zagadnień: wersja uogólnione dowodzi nie pełnią funkcji czasowych konstruowalne z f ( n ) = omów ( n log n ) i g ( n ) = ω ( f ( n ) ), że nie jest możliwe dla TM, dla której obiecano, że zatrzymuje się w czasie t ( n ), a także, że t ( n ) = O (f,gf(n)=ω(nlogn)g(n)=ω(f(n))t(n) w celu podjęcia decyzji, czy T ( n ) = ω ( f ( n ) ) i T ( n ) = O ( g ( n ) ) . I naprawdę nie patrz link do P vs N P tutaj. t(n)=O(f(n))t(n)=ω(f(n))t(n)=O(g(n))PNP
Alex ten Brink

2
Dla mnie związek z P vs NP powstaje przez analogię do geometrii. Definicje, które formalizują pojęcie kontinuum, są szeroko podzielone na warstwy od rozmaitości Kahlera do rozmaitości Riemanna, od gładkich rozmaitości do rozmaitości topologicznych do zbiorów punktów (z wieloma dalszymi różnicami), a sformalizowanie tych różnic było niezbędne dla postępu w matematyce. Podobnie, zestaw maszyn Turinga w P i zestaw języków, które te maszyny akceptują, pozornie obejmują „dzikie” algorytmy, których rola w teorii złożoności jest (być może?) Zasadniczo analogiczna do „egzotycznych” zbiorów punktów w geometrii i topologii.
John Sidles,

1
@John, widziałem podpowiedzi na temat tych myśli w waszych (różnych wcześniej ... może znacznie wcześniej) komentarzach na blogu i bardzo się cieszę, widząc, jak daleko posunęliście się w tym kierunku. Chłodny!
Daniel Apon

Odpowiedzi:


15

Na pytanie 1 odpowiedź brzmi „nie”. Niech jest językiem w P, a M niech będzie dowolnym wielomianowym urządzeniem Turinga rozpoznającym L (którego czas działania przyjmuje się za nierozstrzygalny). Dla każdego k N niech M k będzie maszyną Turinga, która na wejściu x długości n pierwszych pętli dla n k kroków następnie uruchamia M na x dla n k + k kroków i akceptuje, jeśli M akceptuje x (w obrębie tych n k + kLPMLkNMkxnnkMxnk+kMxnk+kkroki) i odrzuca inaczej. Czas działania wynosi Θ ( n k ) dla każdego k .MkΘ(nk)k

Ponieważ przebiega w czasie wielomianowym, istnieje pewne k N, takie że M działa w O ( n k ) (nawet jeśli nie wiemy, co to jest k ), a zatem dla wszystkich k wystarczająco dużych M k rozpoznaje L i ma rozsądny czas działania.MkNMO(nk)kkMkL

EDYTOWAĆ

Myślę, że następująca odpowiedź jest bardziej zgodna z zamierzeniami oryginalnego plakatu z pytaniem 1.

Twierdzenie: Istnieje język taki, że jeśli N jest dowolną maszyną Turinga, która decyduje o L, wówczas spełniony jest przynajmniej jeden z poniższych warunków:LPNL

1) Nie ma dowodu, że akceptuje L lubNL

2) Nie ma dowodu, że zatrzymuje się w krokach f ( n ) (dla dowolnej funkcji f ( n ) ).Nf(n)f(n)

Dowód Szkic: Niech będzie Maszyna Turinga, który nie zatrzymuje się na pustej taśmy i dla których nie istnieje dowód, że M nie zatrzymuje się na pustej taśmie (wyniki niepodległość w Informatyki przez Hartmanis i Hopcroft pokazy takiej M puszkę skutecznie znaleźć).MMM

Niech .L={n:nn s.t. M halts in n steps when run blank tape}

Ponieważ nie zatrzymuje się, L jest w rzeczywistości pustym językiem, ale nie ma na to dowodów (ponieważ to by dowodziło, że M się nie zatrzymuje).MLM

Niech będzie dowolną maszyną Turinga. Jeśli istnieje zarówno dowód, że N decyduje L, jak i dowód, że N działa w krokach f ( n ), wówczas wykonanie N podczas uruchomienia na wejściu 1 zapewnia albo dowód, że M zatrzymuje się (tj. Jeśli N akceptuje) lub że M robi nie zatrzymuj się (tzn. jeśli N odrzuci). Zatem jeśli N w sposób decydujący decyduje o L, czas działania N nie jest rozstrzygalny i odwrotnie.NNLNf(n)N1MNMNNLN


5
Travis odpowiada na przeformułowane pytanie, ale jest to dziwna sytuacja, w której istnieje wykładnik możliwy do udowodnienia, ale tylko w przypadku maszyn, których nie można udowodnić, rozwiązuje problem.
Lance Fortnow,

To ładna odpowiedź na pytanie 1 ... i całkowicie zgadzam się z Lance, że ten algorytm jest bardzo dziwnym członkiem klasy P. Częścią motywacji pytania było uchwycenie intuicji (poprzez definicje, które są przydatne do dowodzenia twierdzeń ), że algorytmy w P, o które „dbamy” (w pewnym sensie), są algorytmami, których wydajność możemy „zweryfikować” (w pewnym sensie) ... ten przykład całkowicie pokonuje ten cel! Niezła odpowiedź! :)
John Sidles

Ten drobny komentarz (o którym wciąż myślę) przypomniał uwagę Felixa Kleina: „Pojęcie, które pojawia się mniej lub bardziej precyzyjnie w naiwnym postrzeganiu przestrzeni, które musimy dodać jako uzupełnienie naszego systemu geometrii, jest pojęciem (arbitralnej) krzywej . Każda osoba wierzy, że wie, czym jest krzywa, dopóki nie nauczy się tyle matematyki, że niezliczone możliwe nieprawidłowości mylą ją ”. Chodzi o to, że aby osiągnąć postęp w porównaniu z NP, być może kluczowym krokiem jest dopracowanie definicji P, aby wykluczyć „niezliczone możliwe nieprawidłowości”.
John Sidles,

2
Twoja odpowiedź jest bardzo interesująca. Jednak predykat 1 może być dokładniej opisany jako „Nie istnieje dowód, że akceptuje L, zaczynając od poniższej definicji.”, Ponieważ mogę łatwo skonstruować TM decydującą o L (który jest pustym językiem) i udowodnić, że zawsze zatrzymuje się i decyduje o pustym języku. Ponownie nauczyłem się czegoś miłego i zamierzam sprawdzić odniesienie, o którym wspomniałeś: DNLL
Alex ten Brink

Edycja jego i tak dobrej odpowiedzi przez Travisa daje jeszcze więcej do myślenia. Ponieważ ten proces zajmie trochę czasu (dla mnie), chciałbym wyrazić moje uznanie i podziękowania (i uwagi techniczne później) zarówno Travisowi (Service), jak i Alexowi (ten Brink). Choć są studentami, ich komentarze (IMHO) są dojrzałe i interesujące. Powszechnie wiadomo, że Alan Turing opracował „Liczby obliczalne z zastosowaniem do Entscheidungsproblem ” między 21 a 23 rokiem życia; dlatego uczniowie zaatakowali podobne problemy z sukcesem ... możemy mieć taką samą nadzieję dla Alexa i Travisa.
John Sidles,

13

ni+1nii


Tak ... ta sztuczka jest esencją dowodów Emanuele Violi i Jurisa Harmanisa na nierozstrzygalność P w środowisku wykonawczym (na przykład). Z drugiej strony, trywialnym przypadkiem jest to, że maszyny Turinga zbudowane za pomocą tej sztuczki rozpoznają języki L, które są również rozpoznawane przez maszyny Turinga w P, których czas działania jest rozstrzygalny. Właśnie dlatego Q1 jest sformułowane (ostrożnie!) Jako pytanie o języki, a nie o maszyny Turinga ... właśnie w celu wykluczenia konstrukcji Hartmanis / Viola ... bez utrudniania (na twój komentarz) istniejących dowodów, że P \ ne Termin ważności
John Sidles,

... i żeby wspomnieć, te języki L, które są rozpoznawane wyłącznie przez maszyny Turinga, których wykładniki środowiska wykonawczego były nierozstrzygalne, są interesującymi językami z teoretycznego (złożonego) (i kryptograficznego) punktu widzenia ... wydają się istnieć w Godlu -eskowy „szary obszar” między algorytmicznie kompresowalnym (ale z definicji nie weryfikowalnym) i niekompresowalnym (a jednak z definicji również nie w tej klasie).
John Sidles,

8

Po zastanowieniu się bardziej na ten temat, wydaje mi się, że znalazłem (możliwą) odpowiedź na twoje czwarte pytanie .

  • P4: Jakie inne atrybuty P (oprócz wykładników czasu wykonywania) są obecnie znane jako nierozstrzygalne? Dla jakich atrybutówPP

Udowodniłem odmianę twierdzenia Rice'a, która odpowiada na twoje pytanie dla większości właściwości. Tym razem postaram się wyjaśnić (odpowiedź Travis Service była o wiele jaśniejsza i bardziej ogólna niż moja poprzednia odpowiedź).

EEO(f(n))f(n)=Ω(nlogn)f(n)=Ω(g(n))g(n)

f(n)P

SSSSRS

PSP

S

P(E)EPESE(A,i)AiAAi

SsSSCsCg(n)

function H(x)
h := simulate A on i for |X| steps and return whether it halted
if h == 'halted' then
    reject
else
    if C(x) accepts then
        accept
    else
        reject
    fi
fi

O(nlogn)

P(H)AiAitHX|X|tHSP(H)

AiCsSP(H)P(H)


To bardzo mocny i elastyczny argument, który zajmie mi trochę czasu, nim go pojmę ... wśród rolników w środkowych Stanach Zjednoczonych jest takie powiedzenie: „Czuję się jak świnia pokazująca zegarek na rękę!” Wydaje się (przez twój argument), że P jest bogato wyposażony w niezdecydowane atrybuty; nie rozumiem, czy języki L rozpoznawane przez P podobnie są bogato wyposażone w nierozstrzygalne atrybuty ... ćwiczenie konstruowania konkretnych przykładów języków posiadających naturalne nierozstrzygalne atrybuty jest dla mnie szczególnie frustrujące (dla mnie). Dziękuję za doskonałą, prowokującą do myślenia odpowiedź.
John Sidles,

1
PP

Alex, zdecydowanie przyznaję, że jestem zdezorientowany ... ale nie o tym! To, co chciałbym skonstruować lub (mniej pożądane) udowodnić istnienie / nieistnienie, byłoby (na przykład) językiem L w P posiadającym właściwość, że każda maszyna Turinga, która akceptuje L, nie jest weryfikowalna w P lub nie jest weryfikowalna akceptuję L. Te języki L należałyby do P „zdumiewająco”… możliwość, że P obejmuje języki czysto zdumiewające, jest dla mnie myląca… zwłaszcza, że ​​wcale nie jest oczywiste (dla mnie), jak takie czysto zdumiewające języki mogłyby kiedykolwiek być konkretnie próbkowany i wystawiany.
John Sidles,

O tak ... i zadać odwrotne (także mylące) pytanie ... dla danego języka L w NP, który prawdopodobnie jest akceptowany wyłącznie przez cudowne maszyny Turinga ... jaką metodą dowodową moglibyśmy ustalić, że L nie jest rozpoznawany przez jakąkolwiek z cudownych maszyn Turinga P ... a zatem oddzielić P od NP? Albo załóżmy, że udowodniliśmy istnienie języka L w NP nie rozpoznawanego przez żadną maszynę Turinga w P ... z zastrzeżeniem, że L był czysto wyrozumiały ... i nie moglibyśmy pokazać tego języka ... gdybyśmy byli zadowoleni że P! = NP? Te pytania są mylące!
John Sidles

4

Mogę odpowiedzieć na twoje Q1 przecząco, a tym samym odpowiedzieć na Q2 i Q3 przecząco. Nie jestem jednak pewien co do Q4 lub Q5 .

  • LP

MTMT

TkTO(nk)MkTTk T

LPTO(nk)kLMkT

LPTLT

LPMTLTL

LPLO(nk)Mnnk+1nk+2L

MPLLkM

Ten rodzaj myślenia o nierozstrzygalności jest najwyraźniej dość powszechny, pamiętam post (blog?) Na bardzo podobny temat: pytanie brzmiało: „czy można rozstrzygnąć, czy Pi ma„ ostatnie zero ”, więc czy Pi przestaje mieć zera w swoich zerach? dziesiętna reprezentacja, jeśli zejdziesz wystarczająco daleko w dół tej reprezentacji. Obecnie nie wiemy, czy tak jest. Możemy nawet nie być w stanie tego udowodnić, a nawet być niezależni od naszych systemów aksjomatów (a tym samym nie do udowodnienia). Ponieważ jednak odpowiedź brzmi „prawda” lub „fałsz”, TM zwracająca wartość true i TM zwracająca wartość false decydują o tym przypadku, a zatem problem można rozstrzygać.

Zobaczę, czy mogę gdzieś znaleźć ten post w Internecie.

Edytować:

Znalazłem to na Mathoverflow .


zarówno twój komentarz, jak i konto Travis Service są doskonałe. Wydaje się, że w pierwszym kwartale wyrażenie „nierozstrzygalne” nie jest synonimem „nierozpoznawalne” ... i wcale nie jest jasne (dla mnie), która definicja (a) prowadzi do najlepszych twierdzeń, a (b) najlepiej oddaje nasze intuicja klasy P. Uwagi na ten temat są mile widziane.
John Sidles,

Dziękuję Alex za link (do pytania MOF „Czy problem może być jednocześnie wielomianowy i nierozstrzygalny?”) ... Zredagowałem główny post, aby dołączyć ten link.
John Sidles,
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.