데이터 마트 역시 아래 포스트 했던 글과 동일하게 ㅇㅇ쇼핑몰 제안 시에 들었던 용어입니다. DW에 대해서는 대략 이해를 하고 있었는데 처음 들어봤던 용어라 검색해보았습니다. 그냥 생각했을 때는 데이터웨어하우스가 포함되겠지 했는데 사용자에 포커스 된 데이터라는 점에서 조금 다르더군요. 물론 더 큰 개념이라는 점은 당연한거겠지만요..
============================================================ 데이터 마트 (DB Mart, Data Mart)
데이터 마트는 운영데이터나 기타 다른 원천으로부터 수집된 데이터 저장소로서, 특정그룹의 지식노동자들을 지원하기 위해 설계된다. 데이터는 전사적인 데이터베이스, 또는 데이터 웨어하우스, 그리고 보다 특화된 것으로부터 끌어낼 수도 있다. 데이터 마트의 중요성은 분석이나, 내용물, 표현 및 사용의 용이성 등의 측면에서 특정 그룹의 지식노동자의 명확한 요구에 부합되는 데에 있다.
실제로는, 데이터 마트나 데이터 웨어하우스라는 용어가 각각 어느 정도까지는 서로의 존재를 포함하고 있는 경향이 있다. 그러나, 이 용어를 사용하는 대부분의 필자들은, 데이터 마트의 설계는 사용자요구분석으로부터 시작하고, 데이터 웨어하우스는 이미 존재하는 데이터가 어떤 것인지와, 그러한 것들이 어떻게 수집될 수 있는지에 대한 분석으로부터 출발하는 경향이 있다는 사실에 대해 의견을 같이 한다. 데이터 웨어하우스는 데이터의 중앙 집합체이고(실제로 그것들의 물리적인 위치가 분산되어 있을 수는 있지만), 데이터 마트는 데이터 웨어하우스 등으로부터 유도될 수 있는 데이터의 저장소로서 특별히 계획된 목적을 위해 접근의 용이성과 유용성을 강조한 것이다. 일반적으로, 데이터 웨어하우스는 전략적이지만 다소 덜 다듬어진 개념이며, 데이터 마트는 전술적이며 당장의 요구에 부합하는 데에 목표를 두는 경향이 있다.
Marc Demerest 라는 필자는 UDA라는 개념을 주창하며, 두 가지를 이 곳으로 결합하자는 제안을 한다. 실제로 데이터 웨어하우스 서비스를 제공하고 있는 많은 제품들과 회사들이, 데이터 마트 능력과 서비스를 함께 제공하는 경향이 있다.
* 관련 사이트들 - 1993년 11월에 Marc Demarest이 발표한 '데이터 마트의 구축'이라는 논문입니다. 데이터 웨어하우스와 데이터 마트의 결합을 제안하는 설명이 제공됩니다. - 다양한 산업계의 전문가들의 데이터 마트에 관한 시각을 요약한 자료입니다.
Data Mart는 전사적인 Data의 부분 집합격으로 특정 사용자나 대상 (종종 LOB, 즉 Line of Business라고 함)에게 가치가 있는 Data들을 포함하는 작은 Warehouse이다. 이들 Data는 주로 사용자들 그룹내의 Data를 중심으로 필요시 다른 부서나 그룹의 Data를 가져오고 외부의 정보를 포함하기도 한다.
예 : 전국적인 규모의 유통업체의 경우 서울지역에서 판매된 제품에 대한 요약
Data의 경우 Data Mart로 간주될 수 있다. Data Mart는 대개 UNIX나 NT 또는 OS/2와 같은 운영체계를 사용하는 저가의 부서급 Server상에서 구현된다. Data Mart는 그것이 사용하는 Data Source에 따라 두 가지로 분류된다. ☆독립적 Data Mart(independent data mart) : 기존의 운영계 시스템과 외부 Data를 Source로 한다. 어떠한 경우는 Data Mart에 들어갈 Data가 특정 부서나 작업현장에서 새로이 생성된 것일 수도 있다. ☆ 종속적 Data Mart(dependent data mart) : 전사적 DW에서 직접 Source Data를 추출한다.
각 SI업체들은 DW과 Data Mart들을 통합구조로 가져가는 Multi-Tier방식의 Warehouse를 구현할 것으로 보인다. 이같은 경우를 표현한 것이 다음과 같다. 「 Multi-tier 방식의 DW」
이같은 Multi-tier 방식의 Architecture에서 Data의 위치는 그 Data에 대한 무결성 (그 값이 정확하여 결함없이 완벽한 가치를 지녀야 한다는 Data의 속성)을 최대한 보장하는 범위 내에서 최고의 가용성과 시스템 성능을 확보할 수 있도록 존재해야 한다.
「 분산 Data Mart 환경 」
○ 의사결정지원과 관련하여 주목할 만한 솔루션 ○ 특정 주제 혹은 부서 단위 데이터 저장고 ○ 수주일에서 수개월 내로 구축 가능 ○ 크기는 데이터 웨어하우스보다 작지만 복잡한 분석 업무를 수행한다는 차별성 ○ 데이터마트는 데이터 웨어하우스와는 달리 읽기, 쓰기도 가능한 환경을 제공
○ 데이터 웨어하우스와 데이터마트의 차이점
데이터 웨어하우스
데이타마트
목 표 특 성 질의유형 응답속도 내 용 자료구조 데이터량 구축기간
잠재적인 모든 유형의 질의에 대처 데이터 저장고 읽기 질의 유형에 따라 가변적 과거, 현재 비정규화, 평면적 초대량, 매우 상세 수개월∼수년
특화된 분석지원 모델링 도구, 연산 엔진 읽기/쓰기 일관성, 신속성 과거, 현재, 미래 다차원적, 계층적 대량, 상세 수주일∼수개월