마지막 N 숫자의 가중치 합계

스트림에서 숫자를 받고 있다고 가정합니다. 각 숫자를받은 후에는 마지막 숫자 의 가중치 합계를 계산해야합니다. 여기서 가중치는 항상 동일하지만 임의적입니다. $N$

계산에 도움이되는 데이터 구조를 유지할 수 있다면 얼마나 효율적으로 할 수 있습니까? 우리는 보다 더 잘 할 수 있습니까 ? 즉 숫자를받을 때마다 합계를 다시 계산할 수 있습니까? $\Theta(N)$

예를 들어, 가중치가 이라고 가정하십시오 . 어느 시점에서 우리는 마지막 숫자 의 목록과 가중 합계 입니다. $W= \langle w_1, w_2, w_3, w_4\rangle$ $N$ $L_1= \langle a, b, c, d \rangle>$ $S_1=w_1*a+w_2*b+w_3*c+w_4*d$

다른 숫자 가 수신되면 을 얻기 위해 목록을 업데이트하고 를 계산해야합니다 . $e$ $L_2= \langle b,c,d,e\rangle$ $S_2=w_1*b+w_2*c+w_3*d+w_4*e$

FFT를 사용한 고려 사항 이 문제의 특별한 경우는 고속 푸리에 변환을 사용하여 효율적으로 해결할 수있는 것으로 보입니다. 여기서 우리 는 배수로 계량 합계 $S$ 를 계산합니다 . 다시 말해, 우리는 숫자를 수신 한 후에 만 해당하는 가중치 합계를 계산할 수 있습니다 . 이를 위해서는 총 숫자의 과거 숫자 (이미 합계가 이미 계산 된 숫자 )와 새 숫자가 필요 합니다. $N$ $N$ $N$ $N-1$ $N$ $2N-1$

입력 번호의 벡터 및 가중치 벡터 경우 $W$ 다항식의 계수 정의 $P(x)$ 및 $Q(x)$ 있는 계수, $Q$ 반전하여 제품의 볼 $P(x)\times Q(x)$ 인 앞에서 $x^{N-1}$ 까지 의 계수 가 정확히 우리가 찾는 가중 합인 다항식입니다 . 이는 시간에 FFT를 사용하여 계산할 수 있으며 , 이는 입력 번호 당 평균 시간을 제공합니다. $x^{2N-2}$ $\Theta(N*\log (N))$ $Θ(\log (N))$

그러나 이것은 새로운 숫자를받을 때 마다 가중 합계를 효율적으로 계산해야하기 때문에 계산 된 문제를 해결할 수 없기 때문에 계산 이 지연 될 수 없습니다.

algorithms data-structures online-algorithms

— 암브 로즈 비자 크
소스

여기서 LaTeX 를 사용할 수 있습니다 .

— Raphael

입력이 알려진 분포에서 나오는가? 유용한 수학적 속성이 있습니까? 그들이 그렇지 않다면, 이것이 가능하지 않을 것입니다 (누군가 하위 선형 계산 가능한 깔끔한 닫힌 형태를 찾을 수 없다면-나는 확실히 찾을 수 없습니다). 또한 근사값은 괜찮습니까? 그것은 당신에게 전혀 유용하다면 갈 수있는 한 가지 방법 일 수 있습니다.

— RDN

FIR 필터 가이를 수행하므로 설계가 관련됩니다.

— adrianN

@ RDN 호기심 으로이 질문을 제기했는데 실용적인 응용 프로그램을 염두에 두지 않았습니다.

— Ambroz Bizjak

다음은 귀하의 접근 방식에 대한 설명입니다. 모든 반복, 우리가 계산하기 위해 FFT 알고리즘을 사용하여 시간에서 컨볼 루션의 값을 후속하는 것으로 가정하면, 값은 제로이다. 즉, 우리는 여기서 는 $m$ $m$ $O(n\log n)$ $m$

\sum_{i = 0}^{n - 1} w_{i} a_{t - i + k}, 0 \leq k \leq m - 1,

$\sum_{i=0}^{n-1} w_i a_{t-i+k}, \quad 0 \leq k \leq m-1,$

w_{i}

$w_i$

가중치입니다 (또는 역방향 가중치)

, 입력 시퀀스 인

현재 시간이며,

에 대한

n

$n$

a_{i}

$a_i$

t

$t$

a_{t^{'}} = 0

$a_{t'} = 0$

t^{'} > t

$t' > t$

다음의 내용은 각각 반복, 우리는 시간에 필요한 회선 계산할 수 합니다 ( 반복 시간 요구 번째 ). 상각 시간 정도로 . 를 선택하면 최소화됩니다. $m$ $O(m)$ $i$ $O(i)$ $O(m) + O(n\log n/m)$ , 상각 된 실행 시간 $m = \sqrt{n\log n}$ . $O(\sqrt{n\log n})$

를 최악의 실행 시간으로 개선 할 수 있습니다 계산을 부분으로 나눔으로써. 수정하고 $O(\sqrt{n\log n})$ $m$ 각 는 입력에만 의존하므로 시간 로 계산할 수 있습니다. 또한, 소정의 에 대해

b_{T, p, o} = \sum_{i = 0}^{m - 1} w_{p m + i} a_{T m - i + o}, C_{T, p} = b_{T, p, 0}, \dots, b_{T, p, m - 1} .

$b_{T,p,o} = \sum_{i=0}^{m-1} w_{pm+i} a_{Tm-i+o}, \quad C_{T,p} = b_{T,p,0}, \ldots, b_{T,p,m-1}.$

C_{T, p}

$C_{T,p}$

2 m

$2m$

O (m \log m)

$O(m\log m)$

C_{⌊ t / m ⌋ - p, p}

$C_{\lfloor t/m \rfloor-p,p}$

, 시간

의 컨벌루션을 계산할 수 있습니다. 그러므로 계획은리스트

0 \leq p \leq n / m - 1

$0 \leq p \leq n/m-1$

O (n / m + m)

$O(n/m + m)$

입력 의 각주기에 대해이들의

을 업데이트해야합니다. 각각의 갱신 시간 소요

우리가 균일 업데이트를 확산 그렇다면, 각각의 입력 작업이 소요될 것이다

씨_{⌊ 티 / 미디엄 ⌋ - 피, 피}, 0 \leq 피 \leq 엔 / 미디엄 - 1.

$C_{\lfloor t/m \rfloor-p,p}, \quad 0 \leq p \leq n/m-1.$

m

$m$

n / m

$n/m$

O (m \log m)

$O(m\log m)$

O ((n / m^{2}) m \log m) = O ((n / m) \log m)

$O((n/m^2) m\log m) = O((n/m) \log m)$ . 컨볼 루션 자체 계산과 함께 입력 당 시간 복잡도는

입니다.

선택

O ((n / m) \log m + m)

$O((n/m)\log m + m)$

이전과 같이

, 이것은

m = \sqrt{n \log n}

$m = \sqrt{n\log n}$

O (\sqrt{n \log n})

$O(\sqrt{n\log n})$

— 유발 필름 러스
소스

훌륭한 해결책, 고마워, 나는 그것이 가능한지 정말로 확신하지 못했습니다.

— Ambroz Bizjak

그리고 작동합니다! C 구현 : ideone.com/opuoMj

— Ambroz Bizjak

Meh, 실제로 계산을 중단시키는 마지막 코드가 누락되었습니다 . 여기서 ideone.com/GRXMAZ .

— Ambroz Bizjak

내 컴퓨터 에서이 알고리즘은 약 17000 가중치의 간단한 알고리즘보다 빠릅니다. 적은 수의 가중치는 느립니다. 벤치 마크 : ideone.com/b7erxu

— Ambroz Bizjak

m

$m$

m = \sqrt{n \log n}

$m = \sqrt{n\log n}$

m

$m$