Schönhage–Strassen 알고리즘에서 내부 링은 어떻게 선택됩니까?

Schönhage–Strassen 정수 곱셈 알고리즘을 구현하려고했지만 재귀 단계에서 걸림돌을 쳤습니다.

이 I 값이 와 비트 및 I를 계산하려는 . 나는 원래 아이디어가 선택하는 줄 알았는데 있도록 , 분할 로 각 조각 비트 모듈로 작업하는 동안, SSA의 회선을 적용 , 비트의 용량을 가진 링 . 그러나 컨벌루션의 출력은 비트 보다 약간 더 큽니다 (즉, $x$ $n$ $x^2 \pmod {2^n+1}$ $k$ $4^k \geq 2n$ $x$ $2^k$ $2^{k-1}$ $2^{2^k}+1$ $2^k$ $2n$ $>2^k$ 각 출력 값이 여러 제품의 합이므로 링당 용량보다 큰 출력 값당 비트 수) 작동하지 않습니다. 2 패딩의 추가 요소를 추가해야했습니다.

패딩에서 2의 추가 요소는 복잡성을 망칩니다. 재귀 단계가 너무 비쌉니다. 대신에게 $F(n) = n \lg n + \sqrt{n} F(2 \sqrt{n}) = \Theta(n \; \lg n \; \lg \lg n)$ 알고리즘, I는 결국 와 $F(n) = n \lg n + \sqrt{n} F(4 \sqrt{n}) = \Theta(n \lg^2 n)$ 알고리즘.

Wikipedia에서 링크 된 몇 가지 참고 자료를 읽었지만이 문제가 어떻게 해결되는지에 대한 세부 사항을 살펴 보았습니다. 예를 들어, 의 거듭 제곱이 아닌 $2^{p 2^k} + 1$ 대해 modulo 을 사용 하여 여분의 패딩 오버 헤드를 피할 수 있습니다 ...하지만 전원이 아닌 경우 남은 2 개의 요인으로, 개수를 두 배로 늘리지 않으면 Cooley-Tukey를 적용 할 수 없습니다. 또한 는 곱하기 역 모듈로 갖지 않을 수 있습니다 . 따라서 2 가지 요소가 여전히 도입되고 있습니다. $p$ $p$ $2^p+1$

점근 적 복잡성을 불식시키지 않고 재귀 단계에서 사용할 링을 어떻게 선택합니까?

또는 의사 코드 형식으로 :

multiply_in_ring(a, b, n):
  ...
  // vvv                          vvv //
  // vvv HOW DOES THIS PART WORK? vvv //
  // vvv                          vvv //
  let inner_ring = convolution_ring_for_values_of_size(n);
  // ^^^                          ^^^ //
  // ^^^ HOW DOES THIS PART WORK? ^^^ //
  // ^^^                          ^^^ //

  let input_bits_per_piece = ceil(n / inner_ring.order);
  let piecesA = a.splitIntoNPiecesOfSize(inner_ring.order, input_bits_per_piece);
  let piecesB = b.splitIntoNPiecesOfSize(inner_ring.order, input_bits_per_piece);

  let piecesC = inner_ring.negacyclic_convolution(piecesA, piecesB);
  ...

ds.algorithms

— 크레이그 거 드니
소스

제발 여러 사이트에서 동일한 질문을 게시하지 않습니다 . 각 커뮤니티는 시간 낭비없이 정직하게 답변해야합니다. 두 사본 중 하나를 삭제하는 것이 좋습니다.

— DW

@DW 완료. cs가 일주일 동안 답변을하지 않은 후에 교차 게시하여 해당 사이트에 너무 어려웠습니다. 대답을 분명히 다시 연결하려고했습니다.

— Craig Gidney

이해 했어요. 나중에 올 경우 언제든지 운영자의 관심을 끌기 위해 게시물에 플래그를 지정하고 마이그레이션하도록 요청할 수 있으며 CSTheory로 이동할 수 있습니다. 이해해 주셔서 감사합니다!

— DW

형식의 모듈로 숫자를 사용하는 알고리즘 버전이 있습니다 . A. Schönhage. 복잡한 계수를 갖는 다항식의 숫자 곱셈 및 나눗셈을위한 점근 적으로 빠른 알고리즘. EUROCAM '82 : 유럽 컴퓨터 대수 회의, Lect. 노트 Comp. 공상 과학 144, 3-15. iai.uni-bonn.de/~schoe/publi39.dvi

2^{ν 2^{n}}

$2^{\nu2^n}$

— Markus Bläser

IIRC 당신은 지금 삭제 된 CS 질문에 부분적으로 자기 답을 얻었습니다. 그것을 잃는 것은 부끄러운 것 같습니다. 여기에 포함시킬 수 있습니까 (질문에 이미 답변 된 것으로 표시되지 않도록 질문에)?

— 피터 테일러

이 답변은 Markus가 주석에 링크 한 논문 "복잡한 계수를 갖는 다항식의 수치 적 축소 및 나눗셈을위한 빠른 속도의 알고리즘" 에서 발췌 한 것입니다.

비트 수, 모듈로 을 제곱하려고합니다 . 당신이하는 일은 다음과 같습니다. $n$ $2^n + 1$

및 를 만족하는 및 를 찾으십시오 . $p$ $s$ $n = (p-1) 2^s$ $s \leq p \leq 2s$
피스 수 을 선택하여 비트 를 분할 하고 피스 크기에 해당하는 매개 변수를 선택하십시오. $2^m$ $n$

$\begin{aligned} 미디엄 & = ⌊ 에스 / 2 ⌋ + 1 \\ {에스}_{2} & = ⌈ 에스 / 2 ⌉ + 1 \\ 피_{2} & = ⌈ 피 / 2 ⌉ + 1 \end{aligned}$ $\begin{align} m &= \lfloor s/2 \rfloor + 1 \\s_2 &= \lceil s/2 \rceil + 1 \\ p_2 &= \lceil p/2 \rceil + 1 \end{align}$
참고 하고 만족 계속 불변. 또한 이 만족되므로 입력이 운반 공간에 맞습니다. $s_2$ $p_2$ $s_2 \leq p_2 \leq 2 s_2$ $2^m 2^{s_2} p_2 \geq 2n + m + 1$
평소와 같이 조각과 나머지 부분에 대해 FFT 기반 음의 순환을 수행하십시오.

그래서 그것은 가장 중요한 아이디어입니다 : 대수 패딩 팩터 . 이제 복잡도 분석 FFT는 작업을 수행하고 크기 조각을 하므로 이제 재발 관계 wrt 사용하여 매우 거친 수학을 수행 할 수 있습니다 . $p$ $n m$ $2^m$ $(p_2-1) 2^{s_2}$ $s$

\begin{aligned} F (에스) & (\leq) (피 - 1) 2^{에스} 미디엄 + 2^{미디엄} 에프 (⌈ 에스 / 2 ⌉ + 1) \\ (\leq) 2 에스 2^{에스} (⌊ 에스 / 2 ⌋ + 1) + 2^{⌊ 에스 / 2 ⌋ + 1} 에프 (⌈ 에스 / 2 ⌉ + 1) \\ (\leq) {에스}^{2} 2^{에스} + 2 \cdot 2^{에스 / 2} 에프 (에스 / 2 + 1) \\ (\leq) {에스}^{2} 2^{에스} + 4 (에스 / 2)^{2} 2^{에스} + 16 (에스 / 4)^{2} 2^{에스} + . . . \\ (\leq) 2^{에스} {에스}^{2} \lg (에스) \\ (\leq) \frac{엔}{\lg 엔} {(\lg \frac{엔}{\lg 엔})}^{2} \lg \lg \frac{엔}{\lg 엔} \\ (\leq) \frac{엔}{\lg 엔} (\lg^{2} 엔) \lg \lg 엔 \\ (\leq) 엔 (\lg 엔) \lg \lg 엔 \end{aligned}

$\begin{align} F(s) &(\leq)\; (p-1)2^sm + 2^m F(\lceil s/2\rceil+1) \\ &(\leq)\; 2s2^s (\lfloor s/2\rfloor+1) + 2^{\lfloor s/2\rfloor+1} F(\lceil s/2\rceil+1) \\ &(\leq)\; s^2 2^s + 2 \cdot 2^{s/2} F(s/2+1) \\ &(\leq)\; s^2 2^s + 4 (s/2)^2 2^s + 16(s/4)^2 2^s + ... \\ &(\leq)\; 2^s s^2 \lg(s) \\ &(\leq)\; \frac{n}{\lg n} \left(\lg \frac{n}{\lg n}\right)^2 \lg \lg \frac{n}{\lg n} \\ &(\leq)\; \frac{n}{\lg n} (\lg^2 n) \lg \lg n \\ &(\leq)\; n \;(\lg n) \lg \lg n \end{align}$

나는 그 단계에서 많은 것을 속 였지만 옳은 것처럼 보입니다.

'트릭'우리가 결국 사실 것 같다 대신 기본 비용을. 나는이 문제에 대해 불평했지만, 지금의 반감과 같은 재귀 수준에 따라 두 가지로 두 개의 곱셈은, 거기에 여전히 모두가 밖으로 작동하므로 이중 배당을 지급한다. 그런 다음, 마지막에, 우리는의 추가 요소 취소 (실제의 요소 인 ) 만들기 덕분에 에 대수적으로 큰 상대 처음입니다. $s^2$ $s$ $s$ $s$ $\log n$ $p$ $s$

— 크레이그 거 드니
소스