님로드 : ~ 38,667 (580,000,000 / 15,000)
이 답변은 매우 간단한 접근법을 사용합니다. 이 코드는 복합 숫자 (프라임의 경우 0)에 대해 각 슬롯에서 가장 작은 소수의 소수를 저장 한 다음 소수 범위의 동적 함수를 사용하여 동일한 범위에 대한 배신자 기능을 구성한 다음 결과를 합산하는 간단한 소수 체를 사용합니다. 이 프로그램은 체를 구성하는 데 거의 모든 시간을 소비 한 다음, 짧은 시간 안에 계류 기능을 계산합니다. 효율적인 체를 구성하는 것으로 보입니다 (결과에서 복합 수의 주요 요소를 추출 할 수 있어야하고 메모리 사용을 합리적인 수준으로 유지 해야하는 약간의 왜곡이 있음).
업데이트 : 메모리 공간을 줄이고 캐시 동작을 개선하여 성능을 향상시킵니다. 성능을 5 % -10 % 향상시킬 수는 있지만 코드 복잡성의 증가는 그만한 가치가 없습니다. 궁극적으로이 알고리즘은 주로 CPU의 von Neumann 병목 현상을 발생 시키며,이를 해결할 수있는 알고리즘 조정은 거의 없습니다.
또한 C ++ 코드가 모든 최적화와 함께 컴파일되도록 설계되지 않았으므로 다른 누구도 수행하지 않았기 때문에 성능 분할기가 업데이트되었습니다. :)
업데이트 2 : 메모리 액세스 개선을위한 최적화 된 체 작업. memcpy () (~ 5 % speedup)를 통해 작은 소수를 일괄 처리하고 더 큰 소수를 체질 할 때 2, 3, 5의 배수를 건너 뜁니다 (~ 10 % 속도 향상).
C ++ 코드 : 9.9 초 (g ++ 4.9 포함)
님로드 코드 : 9.9 초 (-d : release, gcc 4.9 백엔드 사용)
proc handleSmallPrimes(sieve: var openarray[int32], m: int) =
# Small primes are handled as a special case through what is ideally
# the system's highly optimized memcpy() routine.
let k = 2*3*5*7*11*13*17
var sp = newSeq[int32](k div 2)
for i in [3,5,7,11,13,17]:
for j in countup(i, k, 2*i):
sp[j div 2] = int32(i)
for i in countup(0, sieve.high, len(sp)):
if i + len(sp) <= len(sieve):
copyMem(addr(sieve[i]), addr(sp[0]), sizeof(int32)*len(sp))
else:
copyMem(addr(sieve[i]), addr(sp[0]), sizeof(int32)*(len(sieve)-i))
# Fixing up the numbers for values that are actually prime.
for i in [3,5,7,11,13,17]:
sieve[i div 2] = 0
proc constructSieve(m: int): seq[int32] =
result = newSeq[int32](m div 2 + 1)
handleSmallPrimes(result, m)
var i = 19
# Having handled small primes, we only consider candidates for
# composite numbers that are relatively prime with 31. This cuts
# their number almost in half.
let steps = [ 1, 7, 11, 13, 17, 19, 23, 29, 31 ]
var isteps: array[8, int]
while i * i <= m:
if result[i div 2] == 0:
for j in 0..7: isteps[j] = i*(steps[j+1]-steps[j])
var k = 1 # second entry in "steps mod 30" list.
var j = 7*i
while j <= m:
result[j div 2] = int32(i)
j += isteps[k]
k = (k + 1) and 7 # "mod 30" list has eight elements.
i += 2
proc calculateAndSumTotients(sieve: var openarray[int32], n: int): int =
result = 1
for i in 2'i32..int32(n):
var tot: int32
if (i and 1) == 0:
var m = i div 2
var pp: int32 = 2
while (m and 1) == 0:
pp *= 2
m = m div 2
if m == 1:
tot = pp div 2
else:
tot = (pp div 2) * sieve[m div 2]
elif sieve[i div 2] == 0: # prime?
tot = i - 1
sieve[i div 2] = tot
else:
# find and extract the first prime power pp.
# It's relatively prime with i/pp.
var p = sieve[i div 2]
var m = i div p
var pp = p
while m mod p == 0 and m != p:
pp *= p
m = m div p
if m == p: # is i a prime power?
tot = pp*(p-1)
else:
tot = sieve[pp div 2] * sieve[m div 2]
sieve[i div 2] = tot
result += tot
proc main(n: int) =
var sieve = constructSieve(n)
let totSum = calculateAndSumTotients(sieve, n)
echo totSum
main(580_000_000)