«data-streams» 태그된 질문

5
여러 패스로 st-connectivity의 공간 사용량을 줄입니까?
n 개의 꼭짓점이 있는 그래프 가 m 개의 가장자리 스트림으로 표시되지만 스트림을 통해 여러 패스가 허용 된다고 가정 합니다.지GG엔nn엠mm Monika Rauch Henzinger, Prabhakar Raghavan 및 Sridar Rajagopalan 은 데이터에 k 패스가 허용되는 경우 G에 주어진 두 정점 사이에 경로가 있는지 여부를 결정하기 위해 공간이 필요 하다는 것을 관찰했습니다 . 그러나 …

2
가장 자주 발생하는 'k'에 대한 알고리즘
어떤 시점에서든 데이터 스트림에서 가장 자주 발생하는 'k'요소를 알려주는 가장 효율적인 (스트리밍 ??) 알고리즘을 찾고 있습니다. 이 게시물 : "분할 및 정복"데이터 스트림 알고리즘에 관심이있었습니다. 예를 들어, (4,3,5,1,6,2,4,3,3,8,9,1) 숫자가 있다고 가정하고 가장 자주 발생하는 3 개의 숫자 (예 :)를 쿼리하면 답으로 (3,4,1)을 얻습니다. 온라인 검색을 시도했지만 접근 방식을 제공하고 그것이 …

2
중앙값 선택을위한 스토리지 요구 사항 (2 개의 패스 알고리즘)
고전 논문 Munro와 Paterson 은 알고리즘이 무작위로 정렬 된 배열에서 중앙값을 찾는 데 얼마나 많은 저장 공간이 필요한지에 대한 문제를 연구합니다. 특히 다음 모델에 중점을 둡니다. 입력은 P 번 여러 번 왼쪽에서 오른쪽으로 읽습니다. 그것은 도시되는 의 메모리 셀은 충분하지만,이 하부 P = 1 만 알려져 결합 대응. P> 1에 …

5
무손실 압축 데이터의 한계는 무엇입니까? (제한이있는 경우)
최근에 압축 관련 알고리즘을 다루고 있으며 무손실 데이터 압축으로 얻을 수있는 최고의 압축 비율 이 궁금 합니다. 지금 까지이 주제에서 찾을 수있는 유일한 출처는 Wikipedia입니다. 비디오, 디지털화 된 필름 및 오디오와 같은 디지털화 된 데이터의 무손실 압축은 모든 정보를 보존하지만 데이터의 본질적인 엔트로피로 인해 1 : 2 압축보다 훨씬 나은 …

6
데이터 스트림 알고리즘 "분할 및 정복"
거대한 데이터 스트림에서 작동하는 유용한 알고리즘은 무엇이며 결과도 상당히 작으며 결과를 병합하여 두 스트림을 혼합하여 결과를 계산할 수 있습니까? 몇 가지 이름을 지정할 수 있습니다. sum, min, max, count, top-K 등과 같은 명백한 것 히스토그램, 별개의 항목 수 계산 또는 Quantile 계산을위한 대략적인 "스케치 기반"스트림 알고리즘 다른 사람이 있습니까? (이 …


4
연속 클러스터링
실시간 스트리밍 데이터를 사용한 클러스터링과 관련하여 직면 한 문제가 있습니다. 점점 증가하는 데이터 세트가 있으므로 효율적이고 효과적인 클러스터링을 실행하는 가장 좋은 방법이 무엇인지 잘 모르겠습니다. 나는 다음과 같은 몇 가지 가능한 해결책을 생각해 냈습니다. 허용 할 데이터 포인트 수에 대한 한계를 설정하여 다른 데이터 포인트가 가장 오래된 포인트에 도달 할 …
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.