임의 정밀도 정수 제곱근 알고리즘?

n비트 정수의 제곱근의 바닥을 계산하기위한 알려진 이차 알고리즘이 있습니까?

순진한 알고리즘은

def sqrt(x):
    r = 0
    i = x.bit_length() // 2
    while i >= 0:
        inc = (r << (i+1)) + (1 << (i*2))
        if inc <= x:
            x -= inc
            r += 1 << i
        i -= 1
    return r

이 작업에는 O(n)반복 작업 이 필요합니다 . 각 작업에는 O(n)시간 이 더해진 작업이 포함 되므로 O(n^2)전체 시간입니다. 더 빠른 것이 있습니까? 곱셈의 경우 2 차 시간보다 나은 특수 알고리즘이 있지만 제곱근에 대해서는 아무것도 찾을 수 없다는 것을 알고 있습니다.

algorithms numerical-algorithms

— 안티몬
소스

관련된 것에 대한 내 대답은 cs.stackexchange.com/a/37338/12052 도움이 될 수 있습니다 . 문제는 정확도의 조정을 위해 경험적으로 찾아야하는 필요한 방정식의 일부입니다.

— Francesco Gramano

@FrancescoGramano : 죄송합니다. 도움이되지 않습니다.

— Aryabhata

btw,이 차 이차 요구 사항이 더 큰 문제의 일부입니까? 단순한 이차와 복잡한 이차의 차이점이 실제로 그렇게 크지 않을 수도 있기 때문입니다. 아니면 단지 이론적 인 관심입니까?

— Aryabhata

@Aryabhata 죄송합니다. 이전에 댓글을 보지 못했습니다. 아니요, 더 큰 문제의 일부가 아니라 호기심입니다.

— 안티몬

답변:

다항식의 근에 근사값을 구하기 위해 Newton의 방법 또는 다른 여러 방법을 사용할 수 있습니다 $p(x) = x^2 -c$ .

Newton의 방법에 대한 수렴 속도는 2 차적입니다. 즉, 올바른 반복 횟수는 각 반복에서 두 배가됩니다. 이것은 의미 $O(\lg n)$ 뉴턴의 방법으로 충분하다.

뉴턴 방법의 각 반복 계산

x_{j + 1} = x_{j} - (x_{j}^{2} - c) / (2 x_{j}) = 0.5 x_{j} + \frac{c}{2 x_{j}} .

$x_{j+1} = x_j - (x_j^2 -c)/(2x_j) = 0.5 x_j + \frac{c}{2x_j}.$

곱셈의 비트 복잡성은 $\stackrel{~}{O}(b \lg b)$ 두 곱하기 $b$ 비트 정수 (무시) $\lg \lg b$ 요인). 나누기의 비트 복잡도 $b$ 정밀도의 비트)는 동일합니다. 따라서 각 반복은 $\stackrel{~}{O}(n \lg n)$ 작업. 에 의해 곱하기 $O(\lg n)$ 반복, 우리는 제곱근을 계산하는 전체 실행 시간을 $n$ 정밀한 비트는 $\stackrel{~}{O}(n (\lg n)^2)$ . 이것은 이차 이하입니다.

더 신중한 분석에 따르면 이것이 향상 될 수 있다고 생각합니다. $\stackrel{~}{O}(n \lg n)$ 러닝 타임 (각각 알아야 할 것을 고려하여 $x_j$ ~ 안에 $j$ 정밀도가 아닌 비트 $n$ 정밀한 비트). 그러나 더 기본적인 분석조차도 이미 이차적 인 실행 시간을 보여줍니다.

— DW
소스

이진수로도 정체성을 사용하여 큰 초기 추측이 있습니다.

x^{1 / 2} = 2^{1 / 2 \log_{2} x}

$x^{1/2} = 2^{1/2 \log_2 x}$ . 로그를 계산하는 대신 대략적으로

\log_{2} x

$\log_2 x$ 의 자리수로

x

$x$ . 예 :

\log_{2} 101011 \approx 6

$\log_2 101011 \approx 6$ .

— Nick Alger

@DW : 그러나 우리는 정수 제곱근을 찾고 있지 않습니까? 정수 산술 만 사용하여 뉴턴의 메소드 반복을 수행하는 경우 우리는

O (\log n)

$O(\log n)$ 주장하지 않습니까? 그렇지 않으면, 우리는 이미 충분히 큰 정밀도를 가정하고 있습니다 ... 분명한 것이 빠지면 미안합니다.

— Aryabhata

@DW :

$\;\;\;$ "뉴턴 방법의 수렴 속도"는

c = 0

$c\hspace{-0.04 in}=\hspace{-0.04 in}0$ , 그리고 나는 가치에 어떤 일이 일어나는지 모른다

c

$c$ 그것은 음이 아닌 사실이 아닙니다.

$\:$ 곱셈의 비트 복잡도에 대한 추정치는 다음 말이 제시하는 것보다 더 엄격합니다 .

$\:$ 또한, 우리는 각각을 알아야합니다

x_{j}

$x_j$ ~ 안에

2^{j}

$2^{\hspace{.02 in}j}$ "정도의 비트".

$\;\;\;\;\;\;\;$

@Aryabhata :

$\;\;\;$ 우리는 "정수 제곱근을 찾고 있지 않습니다"; 우리는 "제곱근 바닥"을 찾고 있습니다.

$\:$ 부동 소수점 연산에 대해 동일한 비트 복잡성이 유지되지만 정수 산술 문제에 대해서는 맞습니다.

$\;\;\;\;\;\;\;$

@RickyDemer, 예,

c = 0

$c=0$ 특별한 경우입니다.

p (x)

$p(x)$ 다중도 2를 갖지만

c > 0

$c>0$ 루트는 다중도를 가지므로 Newton의 방법 은 차 융합이있다. 아무도 뉴턴의 방법을 사용하여 제곱근을 계산하지 않을 것이라고 가정합니다.

c = 0

$c=0$ (0의 제곱근은 분명히 0이기 때문에). 무슨 말을하려고합니까? 귀하의 의견은 "응답에 0의 제곱근"이라는 내용을 추가하여 해결되는 사소한 의견입니까, 아니면 내가 누락 된 부분이 있습니까?

— DW

Newton의 방법의 문제점 중 하나는 각 반복마다 나누기 연산이 필요하다는 것입니다. 이는 가장 느린 기본 정수 연산입니다.

그러나 역 제곱근에 대한 뉴턴의 방법은 그렇지 않습니다. 만약 $x$ 찾고자하는 번호입니다 $\frac{1}{\sqrt x}$ 반복 :

r_{i + 1} = \frac{1}{2} r_{i} (3 - x r_{i}^{2})

$r_{i+1} = \frac{1}{2} r_i (3 - x r_i^2)$

이것은 종종 다음과 같이 표현됩니다 :

w_{i} = r_{i}^{2}

$w_i = r_i^2$

d_{i} = 1 - w_{i} x

$d_i = 1 - w_i x$

r_{i + 1} = r_{i} + \frac{r_{i} d_{i}}{2}

$r_{i+1} = r_i + \frac{r_i d_i}{2}$

세 번의 곱셈 연산입니다. 2 개로 나누는 것은 오른쪽 이동으로 구현할 수 있습니다.

이제 문제는 $r$ 정수가 아닙니다. 그러나 부동 소수점을 수동으로 구현하고 적절한 경우 보상하기 위해 많은 시프트 연산을 수행하여이를 조작 할 수 있습니다.

먼저 크기를 조정하겠습니다 $x$ :

x^{'} = 2^{- 2 e} x

$x' = 2^{-2e} x$

우리가 원하는 곳 $x'$ 보다 크지 만 가까이 있어야합니다 $1$ . 위의 알고리즘을 실행하면 $x'$ 대신에 $x$ , 우리는 찾는다 $r = \frac{1}{\sqrt x'}$ . 그때, $\sqrt{x} = 2^e r x'$ .

이제 나누자 $r$ 가수와 지수로 :

r_{i} = 2^{- e_{i}} r_{i}^{'}

$r_i = 2^{-e_i} r'_i$

어디 $r'_i$ 정수입니다. 직관적으로 $e_i$ 답의 정확성을 나타냅니다.

우리는 뉴턴의 방법이 정확한 유효 자릿수의 두 배를 가짐을 알고 있습니다. 그래서 우리는 선택할 수 있습니다 :

e_{i + 1} = 2 e_{i}

$e_{i+1} = 2e_i$

약간의 조작만으로 우리는 다음을 발견합니다.

e_{i + 1} = 2 e_{i}

$e_{i+1} = 2e_i$

w_{i} = {r_{i}^{'}}^{2}

$w_i = {r'_i}^2$

x_{i}^{'} = \frac{x}{2^{2 e - e_{i + 1}}}

$x'_i = \frac{x}{2^{2e - e_{i+1}}}$

d_{i} = 2^{e_{i + 1}} - \frac{w_{i}^{'} x_{i}^{'}}{2^{e_{i + 1}}}

$d_i = 2^{e_{i+1}} - \frac{w_i' x'_i}{2^{e_{i+1}}}$

r_{i + 1}^{'} = 2^{e_{i}} r_{i}^{'} - \frac{r_{i}^{'} d_{i}}{2^{e_{i} + 1}}

$r'_{i+1} = 2^{e_i} r'_i - \frac{r'_i d_i}{2^{e_i + 1}}$

반복 할 때마다 :

\sqrt{x} \approx \frac{r_{i}^{'} x}{2^{e + e_{i}}}

$\sqrt{x} \approx \frac{r'_i x}{2^{e + e_i}}$

예를 들어, 제곱근을 계산해 봅시다 $x = 2^{63}$ . 우리는 그 답이 $2^{31}\sqrt{2}$ . 상호 제곱근은 $\frac{1}{\sqrt{2}} 2^{-31}$ 그래서 우리는 설정합니다 $e = 31$ (이것은 문제의 규모입니다) 첫 번째 추측을 위해 우리는 선택할 것입니다 $r'_0 = 3$ 과 $e_0 = 2$ . (즉, 우리는 $\frac{3}{4}$ 초기 추정치 $\frac{1}{\sqrt{2}}$ .)

그때:

e_{1} = 4, r_{1}^{'} = 11

$e_1 = 4, r'_1 = 11$

e_{2} = 8, r_{2}^{'} = 180

$e_2 = 8, r'_2 = 180$

e_{3} = 16, r_{3}^{'} = 46338

$e_3 = 16, r'_3 = 46338$

e_{4} = 32, r_{4}^{'} = 3037000481

$e_4 = 32, r'_4 = 3037000481$

우리는 반복을 멈추는 시점을 비교하여 해결할 수 있습니다. $e_i$ 에 $e$ ; 내가 정확하게 계산했다면 $e_i > 2e$ 충분해야합니다. 우리는 여기서 멈추고 다음을 찾습니다.

\sqrt{2^{63}} \approx \frac{3037000481 \times 2^{63}}{2^{31 + 32}} = 3037000481

$\sqrt{2^{63}} \approx \frac{3037000481 \times 2^{63}}{2^{31+32}} = 3037000481$

올바른 정수 제곱근은 $3037000499$ 우리는 아주 가깝습니다. 또 다른 반복을 수행하거나 최적화되지 않은 최종 반복을 수행 할 수 있습니다. $e_i$ . 세부 사항은 연습으로 남습니다.

To analyse the complexity of this method, note that multiplying two $b$ -bit integers takes $O(b \log b)$ operations. However, we have arranged things so that $r'_i < 2^{e_i}$ . So the multiplication to calculate $w_i$ multiplies two $e_i$ -bit numbers to produce a $e_{i+1}$ -bit number, and the other two multiplications multiply two $e_{i+1}$ -bit numbers to produce a $2e_{i+1}$ -bit number.

In each case, the number of operations per iteration is $O(e_i \log e_i)$ , and there are $O(\log e)$ iterations required. The final multiplication is on the order of $O(2e \log 2e)$ operations. So the overall complexity is $O(e \log^2 e)$ operations, which is sub-quadratic in the number of bits in $x$ . That ticks all the boxes.

However, this analysis hides an important principle which everyone working with large integers should keep in mind: because multiplication is superlinear in the number of bits, any multiplication operations should only be performed on integers which have the roughly the magnitude of the current precision (and, I might add, you should try to multiply numbers together which have a similar order of magnitude). Using integers larger than that is a waste of effort. Constant factors matter, and for large integers, they matter a lot.

As a final observation, two of the multiplications are of the form $\frac{ab}{2^c}$ . Clearly it's wasteful to compute the all the bits of $ab$ only to throw $c$ of them away with a right-shift. Implementing a smart multiplication method which takes this into account is also left as an exercise.

— Pseudonym
소스

This is great stuff. One comment, though: Isn't the bit-complexity of division asymptotically approximately the same as the bit-complexity of multiplication? So you're talking about something that gives a constant factor improvement, not an asymptotic improvement, right? That wasn't entirely clear from your answer.

— D.W.

You say that multiplying two

b

$b$ -bit integers takes

O (b \lg b)

$O(b \lg b)$ bit operations. I think the correct answer is something like

O (b \lg b (\lg l g b)^{O (1)})

$O(b \lg b (\lg lg b)^{O(1)})$ (right?). You might want to indicate that you are ignoring poly-log-log factors (e.g., by putting a tilde over your big O, or something).

— DW

@DW :

$\;\;\;$ 아니, 그는 "2를 곱하면

b

$b$ 비트 정수는

O (b \log b)

$O(b\log b)$ 작업. "

$\:$ "비트"라는 단어는 한 번만 나타납니다. 그렇지 않으면 나는 이미 그것을 지적했을 것입니다.

$\;\;\;\;\;\;\;$

It is a matter of constant factors, yes. The best large integer division algorithms use a technique very similar to the whole algorithm, such as Newton-Raphson iteration and doubling the effective precision on each iteration. A Newton-Raphson loop within a Newton-Raphson loop piles on the constant factors! Ricky Demer is correct; I was thinking in the word RAM model. I probably should have mentioned this.

— 가명