Istnieje prosta procedura obejmująca całą intuicję, w tym elementy psychologiczne i geometryczne. Opiera się na wykorzystaniu bliskości przestrzennej , która jest podstawą naszej percepcji i zapewnia nieodłączny sposób uchwycenia tego, co tylko niedokładnie mierzone jest przez symetrie.
Aby to zrobić, musimy zmierzyć „złożoność” tych tablic w różnych skalach lokalnych. Chociaż mamy dużą swobodę wyboru tych skal i wyboru sposobu, w jaki mierzymy „bliskość”, jest wystarczająco prosty i wystarczająco skuteczny, aby użyć małych kwadratowych dzielnic i spojrzeć na ich średnie (lub równoważnie sumy) w ich obrębie. W tym celu można uzyskać sekwencję tablic z dowolnej tablicy na poprzez utworzenie ruchomych sum sąsiedztwa przy użyciu na sąsiedztwa, następnie na itd., Do do (chociaż do tego czasu zwykle jest za mało wartości, aby zapewnić cokolwiek wiarygodnego).mnk=2233min(n,m)min(n,m)
Aby zobaczyć, jak to działa, obliczenia dla tablic w pytaniu, które od do , od góry do dołu. Oto wykresy ruchomych sum dla ( to oczywiście tablica oryginalna) zastosowanych do .a1a5k=1,2,3,4k=1a1
Zgodnie z ruchem wskazówek zegara od lewego górnego rogu, wynosi , , i . Tablice mają odpowiednio na , następnie na , na i na . Wszystkie wyglądają na „losowe”. Zmierzmy tę losowość za pomocą ich entropii base-2. Dla sekwencja tych entropii wynosi . Nazwijmy to „profilem” .k124355442233a1(0.97,0.99,0.92,1.5)a1
Tutaj natomiast są ruchome sumy :a4
Dla istnieje niewielka zmienność, stąd niska entropia. Profil to . Jego wartości są konsekwentnie niższe niż wartości dla , potwierdzając intuicyjne poczucie, że w występuje silny „wzorzec” .k=2,3,4(1.00,0,0.99,0)a1a4
Potrzebujemy ramy odniesienia do interpretacji tych profili. Idealnie losowa tablica wartości binarnych będzie miała około połowy swoich wartości równych a druga połowa równa , dla entropii . Ruchome sumy w dzielnicach na będą miały zwykle rozkłady dwumianowe, co da im przewidywalne entropie (przynajmniej dla dużych tablic), które można aproksymować o :011kk1+log2(k)
Wyniki te znajdują potwierdzenie w symulacji z tablicami do . Jednak rozkładają się na małe tablice (na przykład tutaj tablice na ) z powodu korelacji między sąsiednimi oknami (gdy rozmiar okna wynosi około połowy wymiarów tablicy) i ze względu na małą ilość danych. Oto profil odniesienia losowych tablic na wygenerowanych przez symulację wraz ze wykresami niektórych rzeczywistych profili:m=n=1005555
Na tym wykresie profil odniesienia jest jednolicie niebieski. Profile tablic odpowiadają : czerwony, : złoty, : zielony, : jasnoniebieski. (Włączenie zasłoniłoby obraz, ponieważ jest on zbliżony do profilu .) Ogólnie profile odpowiadają kolejności w pytaniu: zmniejszają się co najwyżej wartości wraz ze wzrostem pozornego uporządkowania. Wyjątkiem jest : do końca, dla , jego sumy ruchome mają zwykle jedne z najniższych entropii. Ujawnia to zaskakującą prawidłowość: co na dzielnice wa1a2a3a4a5a4ka1k=422a1 ma dokładnie lub czarne kwadraty, nigdy więcej lub mniej. Jest znacznie mniej „losowy”, niż mogłoby się wydawać. (Jest to częściowo spowodowane utratą informacji, która towarzyszy sumowaniu wartości w każdym sąsiedztwie, procedura, która skrapla możliwych konfiguracji sąsiedztwa w tylko różnych możliwych sumach. Jeśli chcielibyśmy uwzględnić konkretnie dla grupowania i orientacji w obrębie każdego sąsiedztwa, zamiast korzystać z ruchomych sum, użylibyśmy ruchomych konkatenacji. Oznacza to, że każde sąsiedztwo na ma122k2k2+1kk2k2możliwe różne konfiguracje; rozróżniając je wszystkie, możemy uzyskać dokładniejszą miarę entropii. Podejrzewam, że taki środek podniósłby profil porównaniu z innymi obrazami.)a1
Ta technika tworzenia profilu entropii w kontrolowanym zakresie skal, poprzez sumowanie (lub łączenie lub inne łączenie) wartości w ruchomych dzielnicach, została zastosowana w analizie obrazów. Jest to dwuwymiarowe uogólnienie dobrze znanej idei analizy tekstu najpierw jako szeregu liter, a następnie jako serii digrafów (ciągów dwuliterowych), a następnie jako trygrafów itp. Ma także pewne wyraźne związki z fraktalem analiza (która bada właściwości obrazu w coraz mniejszej skali). Jeśli dołożymy starań, aby zastosować sumę ruchomą bloku lub konkatenację bloku (aby nie zachodziły na siebie okna), można uzyskać proste relacje matematyczne między kolejnymi entropiami; jednak,
Możliwe są różne rozszerzenia. Na przykład w przypadku profilu niezmiennego obrotowo należy stosować sąsiedztwa kołowe, a nie kwadratowe. Oczywiście wszystko uogólnia się poza tablicami binarnymi. Przy wystarczająco dużych tablicach można nawet obliczyć lokalnie zmieniające się profile entropii w celu wykrycia niestacjonarności.
Jeśli pożądana jest pojedyncza liczba, zamiast całego profilu, wybierz skalę, w której interesująca jest przypadkowość przestrzenna (lub jej brak). W tych przykładach skala ta najlepiej odpowiadałaby ruchomemu sąsiedztwu na lub na , ponieważ do ich wzorowania wszyscy opierają się na grupach obejmujących od trzech do pięciu komórek (a sąsiedztwo na jedynie uśrednia wszystkie warianty w tablica i tak jest bezużyteczne). W drugiej skali entropie dla do wynoszą , , , i334455a1a51.500.81000 ; oczekiwana entropia w tej skali (dla tablicy jednorodnie losowej) wynosi . Uzasadnia to poczucie, że „powinna mieć raczej wysoką entropię”. Aby rozróżnić , i , które są powiązane z entropią w tej skali, spójrz na następną lepszą rozdzielczość ( na dzielnice): ich entropie wynoszą odpowiednio , , (podczas gdy losowa siatka powinna mają wartość ). Dzięki tym środkom pierwotne pytanie ustawia tablice we właściwej kolejności.1.34a1a3a4a50331.390.990.921.77