중앙값 선택을위한 스토리지 요구 사항 (2 개의 패스 알고리즘)

18

고전 논문 Munro와 Paterson 은 알고리즘이 무작위로 정렬 된 배열에서 중앙값을 찾는 데 얼마나 많은 저장 공간이 필요한지에 대한 문제를 연구합니다. 특히 다음 모델에 중점을 둡니다.

입력은 P 번 여러 번 왼쪽에서 오른쪽으로 읽습니다.

그것은 도시되는 의 메모리 셀은 충분하지만,이 하부 P = 1 만 알려져 결합 대응. P> 1에 대한 결과를 보지 못했습니다. 누구든지 그러한 하한을 알고 있습니까? $O(n^{\frac{1}{2P}})$

여기서 가장 어려운 점은 두 번째 패스에서 입력이 더 이상 무작위로 정렬되지 않는다는 것입니다.

ds.algorithms space-bounded data-streams

— 마시모
소스

14

최근 SODA에서 Chan이이 논문을 시도해보십시오 http://portal.acm.org/citation.cfm?id=1721842&dl=ACM를 .

빠른 구글은 검색 또한 외모 가능성과 관련된 다음과 같은 용지를 발견,하지만 난 그것을 읽지 않은 : http://portal.acm.org/citation.cfm?id=1374470를 .

— 워렌 슈디
소스

감사합니다. 두 번째 논문은 내 질문에 부분적으로 답하는 것 같습니다. 그런 답은 내가 알고 있던 이전의 논문에는 없습니다.

— MassimoLauria

18

1 회 이상 통과 할 수있는 첫 번째 논문은 SODA'08의 Jayram과 Amit에 관한 논문입니다. 그런 다음 워렌이 언급 한 논문이 있는데, 이는 확실한 증거로 한계를 개선합니다.

간단히 말해, 패스 수 앞에 상수를 허용하면 의존성을 이해합니다. 물론, 이러한 상수는 지수에 있으므로 정확한 이해를 요청할 수 있습니다. 저의 주요 불만은 멀티 패스 스트리밍 모델이 모든 동기 부여가 아니라는 것입니다.

더 흥미로운 질문은 분기 프로그램을 하한으로 증명할 수 있는지 여부입니다. 메모리를 원하는대로 액세스 할 수있는 경계 공간 알고리즘의 경우에도 최선의 전략은 멀티 패스 스트리밍을 수행하는 것입니까?

그 대답은 긍정적 인 것으로 보이며, 우리는 그것을 증명하기위한 부분적인 진전이 있습니다.

— 미하이
소스

5

멀티 패스 스트리밍 은 다음과 같은 실험에서 자연스러운 모델 이라고 생각 합니다. 무작위 샘플링을 사용하여 통계 테스트 (예 : 순열 테스트)를 수행합니다. 수십억 개의 실험을 수행합니다. 각 실험은 PRNG에서 난수를 가져 와서 일부 출력 값을 생성합니다. 그런 다음이 값의 중앙값, 히스토그램 등을 계산하려고합니다. 출력 스트림에 효율적으로 무작위로 액세스 할 수 없으며 모든 것을 저장할 메모리가 없습니다. 그러나 스트림을 다시 재생할 수 있습니다 . 동일한 시드로 PRNG를 재설정하고 알고리즘을 다시 실행하십시오.

— Jukka Suomela

2

우리는 최고가 멀티 패스 스트리밍 모델에서 상한을 가지며 일부 관련 브랜칭 프로그램 제품군에 대해 하한을 매칭한다는 것에 동의 할 수 있습니다.

— MassimoLauria