연합 및 분산 데이터웨어 하우스의 차이점은 무엇입니까?


9

나는 이것들에 대한 명확한 정의 나 설명을 찾을 수 없습니다. 둘 다 분산 된 것처럼 보입니다. Federated DWH에서는 데이터가 분산되어 단일 저장소에 통합되지 않고 분산 소스에서 액세스되는 것으로 보입니다.

분산 DWH 구현에서 데이터는 하나의 중앙 저장소에 통합됩니다.

이 두 구현의 차이점을 설명하십시오.


답변:


6

분산 데이터웨어 하우스는 기본적으로 개별 지역이나 사업 단위에서 유지 관리하지만 중앙에서 사용 가능한 데이터웨어 하우스의 모음입니다. 이들은 동일한 물리적 서버에 있거나보고 도구를 공유하거나 다른 방법으로 조직 전체에서 사용할 수 있습니다. 마스터 데이터 관리와 같은 중앙 집중식 구성 요소가있을 수도 있습니다. 이는 중앙 집중식 데이터웨어 하우스가 특정 규모의 조직을 넘어 서기 어려워지기 때문에 일반적으로 수행됩니다. 데이터웨어 하우스는 변화에 신속하게 대응해야하며, 너무 반응이 없으면 개별 부서에서 자체 솔루션 구축을 시작합니다.

전체 비즈니스에 중앙 집중식 창고를 구축하는 대신 특정 요구 사항 (예 : 특정 규제 이니셔티브 또는 일부 유형의 재무보고)을 충족시키기 위해 데이터웨어 하우스를 만드는 경향이있는 투자 은행에서이를 확인할 수 있습니다. 대규모 은행 규모의 회사는 합리적 시간 내에 완전히 중앙 집중식 EDW에 대한 요구 사항을 수행하기에는 너무 복잡합니다.

연합 데이터웨어 하우스는 분산 된 데이터웨어 하우스에 마스터 통합 계층을 추가합니다. 일반적으로 모든 부서에 일반화 된 MI 플랫폼을 제공하는 것이 아니라 회사 또는 그룹 수준의보고를 위해 전체 비즈니스에 걸쳐 주요 메트릭을 통합하는 것이 목적이므로 데이터의 좁은 수직 슬라이스 만 수용합니다. 부서는 자체 EDW 또는 MI 시스템을 생산해야하지만 중앙 통합 계층을 채우는 데 필요한 데이터 세트를 제공해야합니다.

이 아키텍처는 두 가지 이점을 모두 제공합니다. 중앙 관리 부서는 전체 조직에 대한 메트릭을 볼 수 있으며 부서는 필요에 맞게 MI 솔루션을 배열 할 수 있습니다. 중앙 관리는 부서 시스템에서 제공하는 피드로 분석 및 MI에 필요한 데이터 요구 사항 만 적용하면됩니다. 특정 부서에 대한보다 심층적 인보고 또는 분석이 필요한 경우 부서 시스템에서이를 제공 할 수 있습니다.

아래 링크 된 기사에서는 페더레이션 데이터웨어 하우스에 대해 자세히 설명합니다.

http://www.zentut.com/data-warehouse/federated-data-warehouse-architecture/

이 기사에서는 데이터웨어 하우스 토폴로지에 대해 자세히 설명합니다.

https://www.ibmbigdatahub.com/blog/data-warehouse-architectures-multinational-organizations-part-1

https://www.ibmbigdatahub.com/blog/data-warehouse-architectures-multinational-organizations-part-2


따라서 둘 다 분산되어 있지만 페더레이션은 하위 집합 (핵심 메트릭)을 한 곳에 통합합니까?
LifeH2O

예. 맞습니다. 이러한 정의는 비공식적이므로 사람들은 다르게 사용할 수 있습니다. 페더레이션 아키텍처에 대한 제안을 한 번 수행했지만 사용중인 정의에 의해 분산 된 것으로 특징 지을 수있는 시스템이있는 두 사이트를 보았지만 두 가지 유형의 시스템을 구축 할 기회는 없었습니다.
ConcernedOfTunbridgeWells
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.