비 RDBMS 데이터 저장소 또는 메시지 대기열과 같은 새 서비스를 사용할 때 가장 먼저 생각하는 것 중 하나는 "데이터를 어떻게 구성해야합니까?"입니다.
소개 자료를 읽고 봤습니다. 특히 Kafka : 로그 처리를위한 분산 메시징 시스템을 예로 들어 보겠습니다 .
- "주제는 메시지와 관련된 컨테이너입니다"
- "가장 작은 병렬 처리 단위는 주제의 파티션입니다. 이는 주제의 특정 파티션에 속하는 모든 메시지가 소비자 그룹의 소비자가 사용함을 의미합니다."
이것을 알면 주제와 파티션을 사용하는 방법을 보여주는 좋은 예는 무엇입니까? 언제 주제가되어야합니까? 언제 파티션이되어야합니까?
예를 들어, (Clojure) 데이터가 다음과 같다고 가정 해 봅시다.
{:user-id 101 :viewed "/page1.html" :at #inst "2013-04-12T23:20:50.22Z"}
{:user-id 102 :viewed "/page2.html" :at #inst "2013-04-12T23:20:55.50Z"}
토픽에 근거해야합니까 user-id
? viewed
? at
? 파티션은 어떻습니까?
어떻게 결정합니까?