Teoria informacji użyta do udowodnienia trafnych twierdzeń kombinatorycznych?

54

Jakie są twoje ulubione przykłady, w których teoria informacji jest wykorzystywana do udowodnienia zgrabnego kombinatorycznego stwierdzenia w prosty sposób?

Niektóre przykłady, które mogę wymyślić, są związane z dolnymi granicami dla dekodowanych lokalnie kodów, np. W tym artykule: załóżmy, że dla wiązki ciągów binarnych długości ma to, że dla każdego , dla różny pary { },Zatem m jest co najmniej wykładnicze w n, gdzie wykładnik zależy liniowo od średniego stosunku . $x_1,...,x_m$ $n$ $i$ $k_i$ $j_1,j_2$

e_{i} = x_{j_{1}} \oplus x_{j_{2}} .

$e_i = x_{j_1} \oplus x_{j_2}.$

k_{i} / m

$k_i/m$

Innym (pokrewnym) przykładem są pewne nierówności izoperymetryczne na kostce boolowskiej (prosimy o rozwinięcie tego w odpowiedziach).

Czy masz więcej fajnych przykładów? Najlepiej krótki i łatwy do wyjaśnienia.

co.combinatorics big-list it.information-theory

— Dana Moshkovitz
źródło

czy ktoś może podać odwołanie do „Innym (pokrewnym) przykładem są pewne nierówności izoperymetryczne na kostce boolowskiej”?

— vzn

40

Dowód Mosera o konstruktywnej lemacie Lovasz . Zasadniczo pokazuje, że w warunkach lokalnego lematu, drugi najprostszy algorytm dla SAT, który można wymyślić, działa. (Pierwszym najprostszym może być po prostu wypróbowanie losowego przydziału, dopóki jedno nie zadziała. Dowód, że działa to w czasie wielomianowym, jest prawdopodobnie najbardziej eleganckim zastosowaniem teorii informacji (lub złożoności Kołmogorowa, jakkolwiek chcesz to nazwać w tym przypadku), jaką kiedykolwiek widziałem.

— Joshua Grochow
źródło

1

Piękny dowód złożoności Mosera na złożoność Kołmogorowa wyjaśniono tutaj: blog.computationalcomplexity.org/2009/06/… , ale muszę przyznać, że szukałem bardziej przykładu typu entropii / wzajemnej informacji / obliczeń ...

— Dana Moshkovitz,

Istnieje kilka bardzo ciekawych zastosowań Złożoność Kołmogorowa podane jako odpowiedzi na to pytanie: cstheory.stackexchange.com/questions/286

— Arnab

Terry Tao omówił również argument Mosera na swoim blogu: terrytao.wordpress.com/2009/08/05/…

— Anthony Leverrier

5

Właściwie w jego drugim artykule (z Tardos) nie musisz już uciekać się do rekurencji. Po prostu szukasz niezadowolonej klauzuli, wybierasz losowe przypisanie jej zmiennych i iterujesz . Otóż to. Z jakiegoś powodu prostszy algorytm (mający tę samą analizę) nie utknął.

— Yuval Filmus

@DanaMoshkovitz: Nie wiem, dlaczego nie przyszło mi do głowy, aby powiedzieć wcześniej w odpowiedzi na twój komentarz: złożoność Kołmogorowa i entropia są pod wieloma względami zasadniczo równoważne. Patrz np młot Romaschenko-Shen-Vershchagin: dx.doi.org/10.1006/jcss.1999.1677 . Na przykład, na podstawie [HRSV], dowód Lemmy Shearera w odpowiedzi arnabu można udowodnić w zasadzie tym samym dowodem, stosując złożoność Kołmogorowa zamiast entropii. Różnica polega tylko na punkcie widzenia: K to długość opisu, H to około

... Czasami jedno jest łatwiejsze / bardziej naturalne niż drugie.

\sum p_{i} \log p_{i}

$\sum p_i \log p_i$

— Joshua Grochow

33

Moim ulubionym przykładem tego typu jest oparty na entropii dowód Lemmy Shearera. (Dowiedziałem się o tym dowodzie i kilku innych bardzo ładnych z Entropii i liczenia Jaikumara Radhakrishnana .)

Twierdzenie: Załóżmy, że punktów w , które odrębne występy na -plane, odrębne występy na -plane i odrębne występy na -plane. Następnie . $n$ $\mathbb{R}^3$ $n_x$ $yz$ $n_y$ $xz$ $n_z$ $xy$ $n^2 \leq n_x n_y n_z$

Dowód: Niech będzie punktem losowo wybranym losowo spośród punktów. Niech , , oznaczają jego rzuty odpowiednio na płaszczyzny , i . $p = (x,y,z)$ $n$ $p_x$ $p_y$ $p_z$ $yz$ $xz$ $xy$

Z jednej strony , , i , przez podstawowe właściwości entropii. $H[p] = \log n$ $H[p_x] \leq \log n_x$ $H[p_y] \leq \log n_y$ $H[p_z] \leq \log n_z$

Z drugiej strony mamy a także

H [p] = H [x] + H [y | x] + H [z | x, y]

$H[p] = H[x] + H[y|x] + H[z | x,y]$

H [p_{x}] = H [y] + H [z | y]

$H[p_x] = H[y] + H[z|y]$

Dodanie trzech ostatnich równań daje nam:

H [p_{y}] = H [x] + H [z | x]

$H[p_y] = H[x] + H[z|x]$

H [p_{z}] = H [x] + H [y | x]

$H[p_z] = H[x] + H[y|x]$

H [p_{x}] + H [p_{y}] + H [p_{z}] =

$H[p_x] + H[p_y] + H[p_z] =$

2 H [x] + H [y] +

$2H[x] + H[y]+$

H [y | x] +

$H[y|x] +$

, gdzie wykorzystaliśmy fakt, że warunkowanie zmniejsza entropię (ogólnie

H [z | x]

$H[z|x]$

+ H [z | y]

$+ H[z|y]$

\geq 2 H [x] + 2 H [y | x] + 2 H [z | x, y] =

$\geq 2H[x] + 2H[y|x] + 2H[z|x,y] =$

2 H [p]

$2H[p]$

H [a] \geq H [a | b]

$H[a] \geq H[a|b]$ dla dowolnych zmiennych losowych

).

a, b

$a,b$

Mamy zatem lub . $2 \log n \leq \log n_x + \log n_y + \log n_z$ $n^2 \leq n_x n_y n_z$

— arnab
źródło

6

Powiązany artykuł do sprawdzenia to „Hypergraphs, Entropia i nierówności” Ehuda Friedguta. Pokazuje, w jaki sposób perspektywa entropii, w szczególności uogólniona lemina Shearera, może łatwo odzyskać wiele standardowych nierówności, a także niektóre niestandardowe, o skomplikowanym wyglądzie. Myślę, że daje to świetną perspektywę. Link: ma.huji.ac.il/~ehudf/docs/KKLBKKKL.pdf

— Andy Drucker

26

Dowód Radhakrishnana dla twierdzenia Bregmana, że liczba idealnych dopasowań na wykresie dwudzielnym wynosi co najwyżej . Dowód wykorzystuje dwa bardzo sprytne pomysły. Oto szkic dowodu: $p$ $(L\cup R, E)$ $\prod_{v \in L} (d(v)!)^{1/d(v)}$

Wybierz idealnie pasujące równomiernie. Entropia tej zmiennej to . $M$ $H(M) = \log p$
Na , niech jest wierzchołek w , który jest dopasowany do w . $v \in L$ $X_v$ $R$ $v$ $M$
Zmienna ma takie same informacje jak , więc . $X = (X_v : v \in L)$ $M$ $H(M) = H(X)$
Sprytna idea 1: Poprzez losowe (i jednolite) wybranie rzędu na , Radhakrishnan zapewnia „losową regułę łańcucha” stwierdzającą . $\leq$ $L$ $H(X) = \sum_{v\in L} H(X_v | { X_u : u < v }, \leq)$
Na podstawie informacji w warunkach ( ) możemy określić (z grubsza: liczba opcji dopasowania ). ${X_u : u < v}, \leq$ $N_v = |N(v) \setminus { X_u : u < v }|$ $v$
Ponieważ jest określana na podstawie tych informacji, uwarunkowana entropia nie zmienia w zakresie równości . $N_v$ $H(X_v | { X_u : u < v }, \leq) = H(X_v | { X_u : u < v }, \leq, N_v)$
Sprytna idea 2: „Zapominając” o informacjach , możemy jedynie zwiększyć entropię: . ${X_u : u < v}, \leq$ $H(X_v | { X_u : u < v }, \leq, N_v) \leq H(X_v | N_v)$
Szalony fakt: Zmienna jest równomiernie rozłożona na zbiorze . $N_v$ ${1,\dots, d(v)}$
Teraz, aby obliczyć entropię , sumujemy wszystkie wartości : $H(X_v | N_v)$ $N_v$ $H(X_v | N_v) = \sum_{i=1}^{d(v)} \frac{1}{d(v)}H(X_v|N_v=i) \leq \frac{1}{d(v)}\sum_{i=1}^{d(v)}\log i = \log((d(v)!)^{1/d(v)}).$
Wynik wynika z połączenia wszystkich nierówności i wzięcia wykładników.

Uogólnienie tej nierówności jest Kahn-Lovász Twierdzenie Numer doskonałych skojarzeń w każdym wykresie wynosi co najwyżej . Dowód entropii tego wyniku został udowodniony przez Cutlera i Radcliffe'a . $G$ $\prod_{v \in V(G)} (d(v)!)^{1/2d(v)}$

— Derrick Stolee
źródło

1

Świetny przykład! Mały punkt: gdy szacujesz

, prawdopodobnie możesz jedynie powiedzieć, że

jest górną granicą

.

H (X_{v} ∣ N_{v})

$H(X_v\mid N_v)$

H (X_{v} ∣ N_{v} = i)

$H(X_v\mid N_v = i)$

\log i

$\log i$

— Srikanth

Masz absolutną rację, a ja zredagowałem odpowiedź, by użyć nierówności.

— Derrick Stolee

20

Bardzo ładne przykłady zawarte są w dwóch artykułach Pippengera Anonimowo-teoretyczna metoda w teorii kombinatorycznej. J. Comb. Teoria, Ser. A 23 (1): 99-104 (1977) oraz Entropia i wyliczenie funkcji boolowskich. Transakcje IEEE dotyczące teorii informacji 45 (6): 2096–2100 (1999). W rzeczywistości kilka prac Pippengera zawiera urocze dowody kombinatorycznych faktów za pomocą entropii / wzajemnej informacji. Dwie książki: Jukna, Extremal Combinatorics With Applications in Computer Science i Aigner, Combinatorial Search mają kilka dobrych przykładów. Lubię też dwa artykuły Madiman i in. Teoretyczne nierówności w addytywnym kombinatoryka i Terence Tao, szacunki sum Entropy (można je znaleźć w Google Scholar). Mam nadzieję, że to pomoże.

— Ugo
źródło

Wygląda jak świetna lista lektur!

— Dana Moshkovitz

17

Innym świetnym przykładem jest alternatywny dowód Terry Tao na lemat o regularności wykresu Szemerédiego . Używa perspektywy teoretycznej, aby udowodnić silną wersję lematu regularności, co okazuje się niezwykle przydatne w jego dowodzie lematu regularności dla hipergraphów . Dowód Tao jest jak dotąd najbardziej zwięzłym dowodem lematu o regularności hipergrafów.

Pozwól, że spróbuję wyjaśnić na bardzo wysokim poziomie tę teoretyczną informację.

Załóżmy, że masz dwuczęściowy wykres z dwoma zestawami wierzchołków i oraz zestawem brzegowym E podzbiorem . Gęstość krawędzi wynosi . Mówimy, jest -regular jeżeli dla wszystkich i $G$ $V_1$ $V_2$ $V_1 \times V_2$ $G$ $\rho = |E|/|V_1||V_2|$ $G$ $\epsilon$ $U_1 \subseteq V_1$ $U_2 \subseteq V_2$ , gęstość krawędzi podsgrafu indukowana przez i wynosi . $U_1$ $U_2$ $\rho \pm \epsilon |U_1||U_2|/|V_1||V_2|$

Teraz rozważ wybranie wierzchołka z i wierzchołka z , niezależnie i równomiernie losowo. Jeśli jest mały i są duże, możemy interpretować -regularity z jak mówienie, że klimatyzacja aby być w i , aby być w nie wpływa znacznie prawdopodobieństwo, że $x_1$ $V_1$ $x_2$ $V_2$ $\epsilon$ $U_1, U_2$ $\epsilon$ $G$ $x_1$ $U_1$ $x_2$ $U_2$ Tworzy krawędź z . Innymi słowy, nawet po otrzymaniu informacji, że jest w a jest w , nie uzyskaliśmy wielu informacji na temat tego, czy jest krawędzią, czy nie. $(x_1,x_2)$ $G$ $x_1$ $U_1$ $x_2$ $U_2$ $(x_1,x_2)$

Lemat Szemeredi (nieformalnie) gwarantuje, że dla każdego wykresu można znaleźć podział i podział na podzbiory o stałej gęstości, tak że dla większości takich par podzbiorów , indukowany wykres podrzędny na jest nieregularny. Dokonując powyższej interpretacji, biorąc pod uwagę dowolne dwie zmienne o wysokiej entropii i , oraz dane dowolne zdarzenie $V_1$ $V_2$ $U_1 \subset V_1, U_2 \subset V_2$ $U_1 \times U_2$ $\epsilon$ $x_1$ $x_2$ , możliwe jest znalezienie zmiennych o niskiej entropii i - „niska entropia”, ponieważ podzbiory i mają stałą gęstość - takie że jest w przybliżeniu niezależne od i $E(x_1,x_2)$ $U_1(x_1)$ $U_2(x_2)$ $U_1$ $U_2$ $E$ $x_1 | U_1$ $x_2 | U_2$ lub że wzajemna informacja między zmiennymi jest bardzo mała. Tao faktycznie formułuje znacznie silniejszą wersję lematu regularności, używając tego ustawienia. Na przykład, nie wymaga on, aby i były zmiennymi niezależnymi (chociaż, o ile wiem, nie było jeszcze zastosowania tego uogólnienia). $x_1$ $x_2$

— rev arnab
źródło

15

Zasadniczo jest to cały kurs poświęcony temu pytaniu:

https://catalyst.uw.edu/workspace/anuprao/15415/86751

Kurs wciąż trwa. Dlatego nie wszystkie notatki są dostępne w chwili pisania tego. Ponadto niektóre przykłady z kursu zostały już wspomniane.

— Moritz
źródło

3

ładny wskaźnik: wygląda jak świetna klasa.

— Suresh Venkat

1

O ile mi wiadomo, ta oferta jest w połowie kursu, z notatkami zawierającymi przykłady, które dają dobre odpowiedzi na moje pytanie, i w połowie seminarium, obejmujące przykłady takie jak komunikacja dolnej granicy, ekstraktory, równoległe powtarzanie itp., Które wymagają znacznie więcej niż tylko teoria informacji (tutaj nie ma notatek, tylko linki do oryginalnych prac).

— Dana Moshkovitz,

7

$n$ $\ell_2^d$ $1 \pm \epsilon$ $d$ $O(\log n / \epsilon^2)$ $\Omega(\log n / (\epsilon^2 \log(1 / \epsilon)))$ $\sim \log(1 / \epsilon)$

— ilyaraz
źródło

4

ℓ_{1}^{d}

$\ell_1^d$

Wydaje się bardzo naturalne i fajne, że te czysto geometryczne wyniki zostały udowodnione przez ludzi z TCS!

— ilyaraz,

6

$m$ $u \in [m]$ $x \in [m]$ $x=u$ $t$ $t$

$O(m^{1/t})$ $\log m$ $u$ $t$ $i \in [t]$ $(\log m)/t$ $i$ $u$

$X$ $[m]$ $H[X] = \log m$ $X_1, \dots, X_t$ $t$ $H[X] = H[X_1] + H[X_2 | X_1] + \cdots + H[X_t | X_1, \dots, X_{t-1}] \leq t \log s$ $s$ $s \geq m^{1/t}$

$t > 1$

— rev arnab
źródło

5

$P$ $P$ $O(\log |X|)$ $X$ $P$

— Gil Kalai
źródło

3

Analiza średnich przypadków algorytmów wykorzystujących złożoność Kołmogorowa przez Jiang, Li, Vitanyi.

„Analiza złożoności algorytmów średniej wielkości przypadków jest bardzo praktycznym, ale bardzo trudnym problemem w informatyce. W ciągu ostatnich kilku lat wykazaliśmy, że złożoność Kołmogorowa jest ważnym narzędziem do analizy złożoności algorytmów w średnich przypadkach. Opracowaliśmy metodę nieściśliwości [7]. W tym artykule wykorzystujemy kilka prostych przykładów, aby dodatkowo zademonstrować moc i prostotę takiej metody. Udowadniamy ograniczenia średniej liczby stosów (kolejek) wymaganych do sortowania sekwencyjnego lub równoległego Queueusort lub Stacksort. ”

Zobacz także np. Złożoność Kołmogorowa i problem trójkąta typu Heilbronna .

— Neal Young
źródło

3

Równoważność pobierania próbek i wyszukiwania przez Scotta Aaronsona. Tutaj pokazuje równoważność problemu próbkowania i poszukiwania w teorii złożoności w odniesieniu do ważności rozszerzonej tezy Church-Turinga. Standardowa teoria informacji, algorytmiczna teoria informacji i złożoność Kołmogorowa są wykorzystywane w fundamentalny sposób.

Podkreśla:
„ Podkreślmy, że nie używamy złożoności Kołmogorowa jedynie jako wygody technicznej lub jako skrótu do liczenia argumentów. Raczej złożoność Kołmogorowa wydaje się niezbędna nawet do zdefiniowania problemu wyszukiwania. ”

— DurgaDatta
źródło

0

To proste, a także przybliżenie: ile kombinacji 10 ⁶ rzeczy z 10 ⁹ , pozwalając na duplikaty? Prawidłowa formuła to

N = (10 ⁶ + 10 ⁹ )! / (10 ⁶ ! 10 ⁹ !) ~ = 2 ^{11409189.141937481}

Ale wyobraź sobie, że dajesz instrukcje, aby przejść wzdłuż rzędu miliarda wiader, zrzucając milion kulek do wiader po drodze. Będzie ~ 10 ⁹ instrukcji „krok do następnego wiadra” i 10 ⁶ instrukcji „upuść marmur”. Łączna informacja to

log ₂ (N) ~ = -10 ⁶ log ₂ (10 ⁶ / (10 ⁶ + 10 ⁹ )) - 10 ⁹ log ₂ (10 ⁹ / (10 ⁶ + 10 ⁹ )) ~ = 11409200.432742426

co jest zabawnym, ale całkiem dobrym sposobem na przybliżenie liczby (dziennika). Podoba mi się, ponieważ działa, jeśli zapomnę, jak robić kombinatorykę. Jest to równoważne z powiedzeniem tego

(a + b)! / a! b! ~ = (a + b) ^{(a + b)} / a ^a b ^b

co jest jak użycie przybliżenia Stirlinga, anulowanie i pominięcie czegoś.

— FutureNerd
źródło

2

Może to być bardziej czytelne, jeśli wykonasz ogólne ograniczenie, a nie określone liczby. Myślę, że mówisz o aproksymacyjnym przybliżeniu objętości piłki Hamminga.

— Sasho Nikolov

0

Bardzo ładna niedawna aplikacja do wyznaczania górnych granic permutacji wysokowymiarowych przez Linial i Lurię znajduje się tutaj: http://www.cs.huji.ac.il/~nati/PAPERS/hd_permutations.pdf

— Gil Kalai
źródło