Nimrod: ~ 38 667 (580 000 000/15 000)
W tej odpowiedzi zastosowano dość proste podejście. W kodzie zastosowano proste sito liczby pierwszej, które przechowuje liczbę pierwszą najmniejszej mocy liczby pierwszej w każdym gnieździe dla liczb zespolonych (zero dla liczb pierwszych), a następnie używa programowania dynamicznego do skonstruowania funkcji totient w tym samym zakresie, a następnie sumuje wyniki. Program spędza praktycznie cały czas na budowie sita, a następnie oblicza funkcję totient w ułamku czasu. Wygląda na to, że sprowadza się to do zbudowania wydajnego sita (z lekkim zwrotem, że trzeba również wyodrębnić główny czynnik dla liczb zespolonych z wyniku i utrzymać zużycie pamięci na rozsądnym poziomie).
Aktualizacja: Poprawiona wydajność poprzez zmniejszenie zajmowanego miejsca w pamięci i poprawę zachowania pamięci podręcznej. Można wycisnąć o 5% -10% większą wydajność, ale wzrost złożoności kodu nie jest tego wart. Ostatecznie algorytm ten przede wszystkim wykorzystuje wąskie gardło procesora von Neumanna i istnieje bardzo niewiele poprawek algorytmicznych, które mogą to obejść.
Zaktualizowałem również dzielnik wydajności, ponieważ kod C ++ nie miał być kompilowany przy wszystkich optymalizacjach i nikt tego nie zrobił. :)
Aktualizacja 2: Zoptymalizowane działanie sita dla lepszego dostępu do pamięci. Teraz obsługa dużych liczb pierwszych za pomocą memcpy () (przyspieszenie ~ 5%) i pomijanie wielokrotności 2, 3 i 5 podczas przesiewania większych liczb pierwszych (przyspieszenie ~ 10%).
Kod C ++: 9,9 sekundy (z g ++ 4.9)
Kod Nimrod: 9,9 sekundy (z -d: release, backend gcc 4.9)
proc handleSmallPrimes(sieve: var openarray[int32], m: int) =
# Small primes are handled as a special case through what is ideally
# the system's highly optimized memcpy() routine.
let k = 2*3*5*7*11*13*17
var sp = newSeq[int32](k div 2)
for i in [3,5,7,11,13,17]:
for j in countup(i, k, 2*i):
sp[j div 2] = int32(i)
for i in countup(0, sieve.high, len(sp)):
if i + len(sp) <= len(sieve):
copyMem(addr(sieve[i]), addr(sp[0]), sizeof(int32)*len(sp))
else:
copyMem(addr(sieve[i]), addr(sp[0]), sizeof(int32)*(len(sieve)-i))
# Fixing up the numbers for values that are actually prime.
for i in [3,5,7,11,13,17]:
sieve[i div 2] = 0
proc constructSieve(m: int): seq[int32] =
result = newSeq[int32](m div 2 + 1)
handleSmallPrimes(result, m)
var i = 19
# Having handled small primes, we only consider candidates for
# composite numbers that are relatively prime with 31. This cuts
# their number almost in half.
let steps = [ 1, 7, 11, 13, 17, 19, 23, 29, 31 ]
var isteps: array[8, int]
while i * i <= m:
if result[i div 2] == 0:
for j in 0..7: isteps[j] = i*(steps[j+1]-steps[j])
var k = 1 # second entry in "steps mod 30" list.
var j = 7*i
while j <= m:
result[j div 2] = int32(i)
j += isteps[k]
k = (k + 1) and 7 # "mod 30" list has eight elements.
i += 2
proc calculateAndSumTotients(sieve: var openarray[int32], n: int): int =
result = 1
for i in 2'i32..int32(n):
var tot: int32
if (i and 1) == 0:
var m = i div 2
var pp: int32 = 2
while (m and 1) == 0:
pp *= 2
m = m div 2
if m == 1:
tot = pp div 2
else:
tot = (pp div 2) * sieve[m div 2]
elif sieve[i div 2] == 0: # prime?
tot = i - 1
sieve[i div 2] = tot
else:
# find and extract the first prime power pp.
# It's relatively prime with i/pp.
var p = sieve[i div 2]
var m = i div p
var pp = p
while m mod p == 0 and m != p:
pp *= p
m = m div p
if m == p: # is i a prime power?
tot = pp*(p-1)
else:
tot = sieve[pp div 2] * sieve[m div 2]
sieve[i div 2] = tot
result += tot
proc main(n: int) =
var sieve = constructSieve(n)
let totSum = calculateAndSumTotients(sieve, n)
echo totSum
main(580_000_000)