데이터웨어하우스 / 데이터마트 > 전자상거래 관리사 필기

전자상거래 관리사 필기

마케팅 데이터웨어하우스 / 데이터마트

페이지 정보

본문

데이터웨어하우스(Data Warehouse)

1) 정의

기업의 데이터베이스에는 많은 데이터가 실시간으로 저장된다. 데이터웨어하우스는 그 데이터를 추출, 취합, 분석하여 기업의 전략수립이나 의사결정을 효율적으로 지원하는 것을 목표로 하는 경영 지원 시스템이다. 데이터의 가용성이 중요한 시스템.


2) 도입 배경 : 기존 데이터 활용의 문제

일반적으로 데이터베이스는 복잡한 구조로 되어 있어 이 데이터베이스의 데이터에 접근하여 활용하기 위해서는 복잡한 프로그래밍 툴을 사용해야 하며 편의를 위해 코딩된 데이터가 의미 있게 표시되지 않는 경우가 많기 때문에 데이터의 의미를 파악하기 힘들다. 


또한 사용자가 시스템을 본래 목적 이외의 다른 목적으로 사용하는 경우도 많고 이를 처리하기 위한 데이터가 여러 다른 시스템에 퍼져 있는 경우가 많다. 더구나 데이터베이스의 데이터는 시간이 경과됨에 따라 변하고 특정시간 동안의 데이터에 대해 요약하기 힘들다.


3) 도입

따라서 위의 내용처럼 운용 데이터가 의사결정을 위한 요구를 만족시키고 있다고 보기 어렵기 때문에 이들 데이터가 전략적인 의사결정에 활용될 수 있도록 변형, 통합하는 작업이 필요하게 된다. 이러한 작업을 데이터웨어하우징이라고 한다. 


데이터웨어하우스는 데이터웨어하우징을 통해 운용 데이터를 "분석된 정보"로 바꿔주기 때문에 데이터웨어하우스 안에 있는 정보는 조직의 요구 사항에 기초를 두고 있으며 다양한 종류나 형태의 데이터를 끌어내어 사용자의 질문에 적합한 정보를 제공할 수 있게 된다.


4) 데이터웨어하우스의 역할

■ 기업의 대용량 데이터를 기초로 하여 기업의 각종 의사 결정 과정을 지원해 준다.

■ 내용에 의한 참조를 넘어서 주제 지향적이고 통합적인 자료 속성을 지니고 있다.

■ 주로 고객과의 거래 내용이나 인적 정보, 회계명세 구분, 품질 정보 등을 자료의 대상으로 한다. 


5) 데이터웨어하우스의 특징

데이터웨어하우스는 특정한 의사결정을 위해 필요한 특정한 주제의 분석과 판단을 위해 특정한 시점에 특정한 기준에 따라 가능한 (기업의) 모든 관련된 데이터를 통합하여 활용하는 데이터 관리 시스템이다. 따라서 다음과 같은 특징을 갖고 있다.


⑴ 주제지향성(Subject Oriented)

데이터웨어하우스 내의 데이터는 일반적인 트랜잭션을 처리하는 프로세스 중심 시스템의 데이터베이스와 달리 특정한 주제별로 구성된다. 예를 들어 학교에서 등록금, 장학금, 학점 등이 프로세스 중심의 시스템을 구성하는 일반적인 트랜잭션을 위한 항목이라면 학생 생활, 학업 분위기, 학교 주변 환경 등은 특정한 주제들로 분류한 항목이라고 할 수 있다.


⑵ 통합성(Integrated)

데이터웨어하우스 내의 데이터는 보다 확실하게 통합되어야 한다. 예를 들면 기존의 응용 프로그램 중심의 환경에서는 남자와 여자의 구분을 남/여, Man/Woman, 1/0 등으로 다양하게 분류하여 적용할 수 있으나 데이터웨어하우스에서는 M/W 등의 한 가지 분류로 통합할 필요가 있다. 


⑶ 비휘발성(Non-Volatile)

데이터웨어하우스에는 데이터의 로딩(loading)과 액세스(access)라는 두 가지 동작(operation)만이 존재한다. 이것은 일단 데이터웨어하우스 내에 로딩된 데이터는 읽기 전용이라는 것을 뜻한다. 

따라서 데이터웨어하우스의 데이터는 수시로 데이터의 내용이 변한다는 의미인 “휘발성”이라는 일반적인 운용 데이터베이스 내의 데이터들의 특징은 사라지게 된다.


⑷ 시계열성(Time Variant)

데이터베이스의 데이터는 액세스(access)하는 순간마다 새로운 데이터로 적합하게 수정되는 것이 당연하다. 이에 비해 데이터웨어하우스의 데이터는 특정한 시점의 데이터를 목적에 따라 모아 놓은 것이므로 시계열성이 중요한 특징이 된다. 




* 데이터마트 (Data Mart)


데이터웨어하우스가 전사적(全社的)인 의사결정을 위한 전략적인 시스템이라면 데이터마트는 한 부서 또는 한 부문의 의사결정을 위한 전술적 시스템이라고 할 수 있다. 데이터 마트는 일반적으로 특정 업무 혹은 특정 부서를 지원하기 위해 개별적으로 설계된다. UDA(Universal Data Access)는 데이터마트와 데이터웨어하우스를 포괄하는 개념이다. (경우에 따라 중소기업을 위한 소형의 데이터웨어하우스라고 보는 시각도 있다)