Czy zbiór wszystkich pierwotnych słów jest językiem podstawowym?


17

Słowo ww nazywa się prymitywnym , jeśli nie ma słowa i więc . Zbiór wszystkich prymitywnych słów nad alfabetem jest dobrze znanym językiem. WLOG możemy wybrać .vvk>1k>1w=vkw=vkQQΣΣΣ={a,b}Σ={a,b}

Język jest liczbą pierwszą , jeśli dla każdego języka i B z L = A \ cdot B mamy A = \ {\ epsilon \} lub B = \ {\ epsilon \} .LLAABBL=ABL=ABA={ϵ}A={ϵ}B={ϵ}B={ϵ}

Czy Q jest liczbą pierwszą?

Za pomocą solwera SAT mogę pokazać, że albo mamy lub ponieważ w przeciwnym razie nie może zostać podzielony do i , ale utknęli od tego czasu.{a,b}A{a,b}A{a,b}B{a,b}B{ababa,babab}Q{ababa,babab}QAABB

Odpowiedzi:


13

Odpowiedź brzmi tak. Załóżmy, że mamy faktoryzacji Q = A BQ=AB .

Jedną łatwą obserwacją jest to, że AA i BB muszą być rozłączne (ponieważ dla w A BwAB otrzymujemy w 2Qw2Q ). W szczególności tylko jeden z A , BA,B może zawierać ϵϵ . Możemy założyć wlog (ponieważ druga sprawa jest całkowicie symetryczny), że ε BϵB . Następnie od i b nie może być uwzględnione niepustych czynników, musimy mieć , b A .aba,bA

Następnie otrzymujemy, że a m b nAambnA (i całkowicie analogicznie, b m a nAbmanA ) dla wszystkich m , n > 0m,n>0 przez indukcję na mm :

Dla m = 1m=1 , od a b nQabnQ , musimy w B n = u vabn=uv o u A , v BuA,vB . Ponieważ u ϵuϵ , vv musi być b kbk dla niektórych k nkn . Ale jeśli k > 0k>0 , to skoro b AbA otrzymujemy b 1 + kQb1+kQ , sprzeczność. WięcV = εv=ϵ i b n . abnA

W etapie indukcyjnym, ponieważ jest m + 1 b nQam+1bnQ mamy do m + 1 b, n = u vam+1bn=uv o u A , v BuA,vB . Od tego czasu u ϵuϵ mamy albo v = a k b nv=akbn dla niektórych 0 < k < m + 10<k<m+1 , albo v = b kv=bk dla niektórych k < nk<n . Ale w pierwszym przypadku vv jest już w AA według hipotezy indukcyjnej, więc v 2Qv2Q , sprzeczność. W tym ostatnim przypadku, musimy mieć k = 0k=0 (czyli v = εv=ϵ ), ponieważ od b bA otrzymujemy b 1 + kQb1+kQ . Tak więc u = a m + 1 , b nAu=am+1bnA .

Rozważmy teraz przypadek ogólny pierwotnych słów z rr naprzemiennie pomiędzy i b , to w oznacza albo m 1 b n 1 ... danej M s b n a , b m 1 n 1 ... b m s n s (dla R = 2 s - 1 ), a m 1 b n 1a m sabwam1bn1amsbnsbm1an1bmsansr=2s1+1am1bn1ams+1, or bm1an1bms+1bm1an1bms+1 (for r=2sr=2s); we can show that they are all in AA using induction on rr. What we did so far covered the base cases r=0r=0 and r=1r=1.

For r>1r>1, we use another induction on m1m1, which works very much the same way as the one for r=1r=1 above:

If m1=1m1=1, then w=uvw=uv with uA,vBuA,vB, and since uϵuϵ, vv has fewer than rr alternations. So vv (or its root in case vv itself is not primitive) is in AA by the induction hypothesis on rr for a contradiction as above unless v=ϵv=ϵ. So w=uAw=uA.

If m1>1m1>1, in any factorization w=uvw=uv with uϵuϵ, vv either has fewer alternations (and its root is in AA unless v=ϵv=ϵ by the induction hypothesis on rr), or a shorter first block (and its root is in A unless v=ϵv=ϵ by the induction hypothesis on m1m1). In either case we get that we must have v=ϵv=ϵ, i.e. w=uAw=uA.


The case of Q:=Q{ϵ}Q:=Q{ϵ} is rather more complicated. The obvious things to note are that in any decomposition Q=ABQ=AB, both A and B must be subsets of Q with AB={ϵ}. Also, a,b must be contained in AB.

With a bit of extra work, one can show that a and b must be in the same subset. Otherwise, assume wlog that aA and bB. Let us say that wQ has a proper factorization if w=uv with uA{ϵ} and vB{ϵ}. We have two (symmetric) subcases depending on where ba goes (it must be in A or B since it has no proper factorization).

  • If baA, then aba has no proper factorization since ba,aB. Since abaA would imply ababAB, we get abaB. As a consequence, bab is neither in A (which would imply bababaAB) nor in B (which would imply ababAB). Now consider the word babab. It has no proper factorization since babAB and abab,baba are not primitive. If bababA, then since abaB we get (ba)4AB; if bababB, then since aA we get (ab)3AB. So there is no way to have bababAB, contradiction.
  • The case baB is completely symmetric. In a nutshell: bab has no proper factorization and cannot be in B, so it must be in A; therefore aba cannot be in A or B; therefore ababa has no proper factorization but also cannot be in either A or B, contradiction.

I am currently not sure how to proceed beyond this point; it would be interesting to see if the above argument can be systematically generalized.


Wow, you have my respect. I'll go through it later today or tomorrow as I don't have time right now, but I am seriously impressed :) It took me a few hours to get that {a, b} are in A but I didn't exploit that \epsilon is not a primitive word. How did you approach this problem (or was it "just do it"?)? How long did it take you to come up with that proof?
Henning

Thanks! I got the main idea (showing that any nonempty proper suffix of words must be in A) by thinking about what happens to some "simple" words. ϵ,a, and b were relatively straightforward, an or bn were out of the question, and considering ab,abb,abbb, got me on the right path.
Klaus Draeger

4
Your proof is beautiful and not as hard as I thought (I feel quite stupid now, I spent some time thinking about it). However it seems to heavily relay on epsilon not being element of Q. Is Q{ϵ} also prime?
Henning

1
Good question! I'll have to get back to you on that one.
Klaus Draeger

2
Thanks for the comments, and sorry for the delay. The case where we want to include the empty word seems to be more complicated, see update.
Klaus Draeger
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.