10

Zadaniem jest jak najszybsze obliczenie OEIS A005434 .

Rozważ ciąg binarny So długości n. Indeksując od 1, możemy ustalić, czy dokładnie S[1..i+1]pasuje S[n-i..n]do wszystkich iw kolejności od 0do n-1. Na przykład,

S = 01010

daje

[Y, N, Y, N, Y].

Jest tak, ponieważ 0dopasowuje 0, 01nie pasuje 10, 010dopasowuje 010, 0101nie pasuje 1010 i ostatecznie 01010dopasowuje się do siebie.

Zdefiniuj f(n)liczbę odrębnych tablic Ys i Ns, które otrzymujesz podczas iteracji wszystkich 2^nróżnych możliwych ciągów bitów Sdługości n.

Spostrzegający zauważy, że to pytanie jest prostszym wariantem innego mojego ostatniego pytania . Oczekuję jednak, że sprytne sztuczki mogą to uczynić o wiele szybszym i łatwiejszym.

Zadanie

Aby zwiększyć, nzaczynając od 1, twój kod powinien wypisywać n, f(n).

Przykładowe odpowiedzi

Dla n = 1..24, poprawne odpowiedzi są:

1, 2, 3, 4, 6, 8, 10, 13, 17, 21, 27, 30, 37, 47, 57, 62, 75, 87, 102, 116, 135, 155, 180, 194

Punktacja

Twój kod powinien powtarzać się od n = 1udzielenia odpowiedzi po nkolei. Poświęcę czas na cały bieg, zabijając go po dwóch minutach.

Twój wynik jest najwyższy nw tym czasie.

W przypadku remisu pierwsza odpowiedź wygrywa.

Gdzie będzie testowany mój kod?

Uruchomię twój kod pod Virtualbox na maszynie wirtualnej gościa Lubuntu (na moim hoście Windows 7).

Mój laptop ma 8 GB pamięci RAM i procesor Intel i7 5600U@2.6 GHz (Broadwell) z 2 rdzeniami i 4 wątkami. Zestaw instrukcji obejmuje SSE4.2, AVX, AVX2, FMA3 i TSX.

Wiodące wpisy według języka

n = 599 w Rust bu Anders Kaseorg.
n = 30 w C według Grimy'ego. Wersja równoległa osiąga 32, gdy działa natywnie w cygwin.

array-manipulation combinatorics fastest-code

math.uni-bielefeld.de/~sillke/SEQUENCES/autocorrelation-range.c (link do strony OEIS) działający z -O3 może obliczyć do 100 w <0,02 sekundy na mojej maszynie

— vroomfondel

@rogaos O kochanie. Powinienem usunąć pytanie, ale ma już odpowiedź.

Myślę, że nadal jest to fajny problem - ale może nawet 1000? Lub zapytaj golfa o wystarczająco szybki program

— vroomfondel

1

@rogaos Właśnie usunąłem twardy limit całkowicie.

4

Rdza , ≈ 660

use std::collections::HashMap;
use std::iter::once;
use std::rc::Rc;

type Memo = HashMap<(u32, u32, Rc<Vec<u32>>), u64>;

fn f(memo: &mut Memo, mut n: u32, p: u32, mut s: Rc<Vec<u32>>) -> u64 {
    debug_assert!(p != 0);
    let d = n / p;
    debug_assert!(d >= 1);
    let r = n - p * if d >= 2 { d - 1 } else { 1 };

    let k = s.binary_search(&(n - r + 1)).unwrap_or_else(|i| i);
    for &i in &s[..k] {
        if i % p != 0 {
            return 0;
        }
    }

    if d >= 3 {
        let o = n - (p + r);
        n = p + r;
        s = Rc::new(s[k..].iter().map(|i| i - o).collect());
    } else if n == p {
        return 1;
    } else if k != 0 {
        s = Rc::new(s[k..].to_vec());
    }

    let query = (n, p, s);
    if let Some(&c) = memo.get(&query) {
        return c;
    }
    let (n, p, s) = query;

    let t = Rc::new(s.iter().map(|i| i - p).collect::<Vec<_>>());
    let c = if d < 2 {
        (1..r + 1).map(|q| f(memo, r, q, t.clone())).sum()
    } else if r == p {
        (1..p + 1)
            .filter(|&q| p % q != 0 || q == p)
            .map(|q| f(memo, r, q, t.clone()))
            .sum()
    } else {
        let t = match t.binary_search(&p) {
            Ok(_) => t,
            Err(k) => {
                Rc::new(t[..k]
                            .iter()
                            .cloned()
                            .chain(once(p))
                            .chain(t[k..].iter().cloned())
                            .collect::<Vec<_>>())
            }
        };
        (1..t.first().unwrap() + 1)
            .filter(|&q| p % q != 0 || q == p)
            .map(|q| f(memo, r, q, t.clone()))
            .sum()
    };
    memo.insert((n, p, s), c);
    c
}

fn main() {
    let mut memo = HashMap::new();
    let s = Rc::new(Vec::new());
    for n in 1.. {
        println!("{} {}",
                 n,
                 (1..n + 1)
                     .map(|p| f(&mut memo, n, p, s.clone()))
                     .sum::<u64>());
    }
}

Wypróbuj online!

Jak to działa

Jest to zapamiętana implementacja rekurencyjnego predykatu Ξ podanego przez Leo Guibasa, „Periods in strings” (1981). Funkcja f(memo, n, p, s)wyszukuje liczbę korelacji długości nz najmniejszym okresem, pa także każdy z okresów w zbiorze s.

— Anders Kaseorg
źródło

Sprawia, że zastanawiasz się, czy istnieje szybsze rozwiązanie innego powiązanego problemu. Bardzo imponujące!

Co ciekawe, pamięć jest całkowicie ograniczona. Przyspiesza do ~ 500, a następnie nagle zwalnia, gdy kończy się pamięć RAM.

2

Wystarczy proste wyszukiwanie z użyciem siły, aby rozpocząć wyzwanie:

#include <stdio.h>
#include <stdint.h>
#include <string.h>

typedef uint16_t u16;
typedef uint64_t u64;

static u64 map[1<<16];

int main(void)
{
    for (u64 n = 1;; ++n) {
        u64 result = 1;
        u64 mask = (1ul << n) - 1;
        memset(map, 0, sizeof(map));

        #pragma omp parallel
        #pragma omp for
        for (u64 x = 1ul << (n - 1); x < 1ul << n; ++x) {

            u64 r = 0;
            for (u64 i = 1; i < n; ++i)
                r |= (u64) (x >> i == (x & (mask >> i))) << i;
            if (!r)
                continue;

            u16 h = (u16) (r ^ r >> 13 ^ r >> 27);
            while (map[h] && map[h] != r)
                ++h;

            if (!map[h]) {
                #pragma omp critical
                if (!map[h]) {
                    map[h] = r;
                    ++result;
                }
            }
        }

        printf("%ld\n", result);
    }
}

Kompiluj z clang -fopenmp -Weverything -O3 -march=native. Na mojej maszynie osiąga n = 34 w ciągu 2 minut.

EDYCJA: posypałem niektóre dyrektywy OMP dla łatwego równoległości.

— Ponury
źródło

@Lembik Czy istnienie dobrej odpowiedzi poza podstawami SE do usunięcia? Czy nie powinieneś poczekać, aż ktoś (być może komentator) prześle ten algorytm jako odpowiedź i zaakceptuje tę odpowiedź?

— Grimmy,

Robisz bardzo dobry punkt

Niestety nie mogę naprawdę przetestować twojego równoległego kodu w virtualbox, ponieważ mam w sumie dwa rdzenie na moim CPU.

Uruchomiłem go w cygwin i dostałem 32.

Oblicz OEIS A005434