데이터 웨어하우스란 무엇입니까?
데이터 웨어하우스는 보다 정보에 입각한 의사 결정을 내릴 수 있도록 분석 가능한 정보의 중앙 리포지토리입니다. 데이터는 트랜잭션 시스템, 관계형 데이터베이스 및 기타 소스로부터 보통 정기적으로 데이터 웨어하우스로 들어갑니다. 비즈니스 애널리스트, 데이터 엔지니어, 데이터 사이언티스트 및 의사 결정권자는 비즈니스 인텔리전스(BI) 도구, SQL 클라이언트 및 기타 분석 애플리케이션을 통해 데이터에 액세스합니다.
데이터 및 분석은 비즈니스가 경쟁력을 유지하는 데 없어서는 안 되는 부분이 되었습니다. 비즈니스 사용자는 보고서, 대시보드 및 분석 도구를 활용하여 데이터에서 통찰력을 찾아내고, 비즈니스 성과를 모니터링하며, 의사 결정을 지원합니다. 데이터 웨어하우스는 데이터를 효율적으로 저장하여 보고서, 대시보드 및 분석 도구를 강화함으로써 데이터의 입출력(I/O)을 최소화하고 수백 수천 명의 사용자에게 동시에 신속하게 쿼리 결과를 제공합니다.
데이터 웨어하우스는 어떻게 설계됩니까?
데이터 웨어하우스 아키텍처는 티어로 구성됩니다. 상단 티어는 보고, 분석 및 데이터 마이닝 도구를 통해 결과를 제시하는 프런트 엔드 클라이언트입니다. 중간 티어는 데이터를 액세스하고 분석하는 데 사용되는 분석 엔진으로 구성됩니다. 아키텍처의 하단 티어는 데이터가 로드되고 저장되는 데이터베이스 서버입니다. 데이터는 다음 두 가지의 다른 방식으로 저장됩니다. 1) 자주 액세스하는 데이터는 매우 빠른 스토리지(예: SSD 드라이브)에 저장합니다. 2) 자주 액세스하지 않는 데이터는 저렴한 객체 스토어(예: Amazon S3)에 저장합니다. 데이터 웨어하우스는 자주 액세스되는 데이터가 “빠른” 스토리지로 이동되어 쿼리 속도가 최적화되는지 자동으로 확인합니다.
데이터 웨어하우스는 어떻게 작동합니까?
데이터 웨어하우스에는 여러 개의 데이터베이스가 포함될 수 있습니다. 각 데이터베이스 내에서 데이터는 테이블 및 열로 구성됩니다. 각 열 내에서 사용자는 정수, 데이터 필드 또는 문자열 등 데이터의 설명을 정의할 수 있습니다. 테이블은 스키마 내부에 구성될 수 있으며, 이는 폴더와 같은 역할을 합니다. 데이터가 수집되면 스키마에 의해 설명되는 다양한 테이블에 저장됩니다. 쿼리 도구는 스키마를 사용하여 어떤 데이터 테이블을 액세스하고 분석할지 결정합니다.
데이터 웨어하우스를 사용하면 어떤 이점이 있습니까?
데이터 웨어하우스의 이점은 다음과 같습니다.
- 정보에 기반한 의사 결정
- 여러 소스의 데이터 통합
- 과거 데이터 분석
- 데이터 품질, 일관성 및 정확성
- 트랜잭션 데이터베이스와 분석 처리를 분리하여 두 시스템 모두의 성능을 향상
데이터 웨어하우스, 데이터베이스 및 데이터 레이크는 어떻게 함께 동작합니까?
일반적으로 비즈니스는 데이터베이스, 데이터 레이크 및 데이터 웨어하우스의 조합을 활용하여 데이터를 저장 및 분석합니다. Amazon Redshift의 레이크 하우스 아키텍처를 사용하여 그러한 통합을 편리하게 수행할 수 있습니다.
데이터의 볼륨 및 다양성이 증가함에 따라 데이터베이스, 데이터 레이크 및 데이터 웨어하우스에서 데이터 관련 작업 시 하나 이상의 공통 패턴을 따르면 다음과 같은 이점이 있습니다.
데이터 웨어하우스와 달리, 데이터 레이크는 정형, 반정형 및 비정형 데이터를 비롯한 모든 데이터에 대한 중앙 리포지토리입니다. 데이터 웨어하우스에서는 데이터를 테이블 형식으로 구성해야 하며, 여기서는 스키마가 중요한 역할을 합니다. 테이블 형식은 SQL을 사용하여 데이터를 쿼리하기 위해 필요합니다. 그러나 일부 애플리케이션에서는 데이터가 테이블 형식일 필요가 없습니다. 빅 데이터 분석, 전체 텍스트 검색 및 기계 학습과 같은 일부 애플리케이션에서는 ‘반정형’ 또는 비정형인 경우에도 데이터에 액세스할 수 있습니다.
데이터 웨어하우스와 데이터 레이크를 심층적으로 비교하려면 데이터웨어하우스와 데이터 레이크 전용 비교 페이지를 방문하세요.
데이터 마트와 데이터 웨어하우스는 어떻게 다릅니까?
데이터 마트는 금융, 마케팅 또는 영업과 같은 특정 팀 또는 사업 단위의 요구를 충족시키는 데이터 웨어하우스입니다. 규모가 더 작고, 집중적이며 사용자 커뮤니티에 가장 잘 맞는 데이터 요약을 포함할 수 있습니다. 데이터 마트는 데이터 웨어하우스의 일부일 수도 있습니다.
데이터 마트와 데이터 웨어하우스를 심층적으로 비교하려면 데이터 마트와 데이터 웨어하우스의 전용 비교 페이지를 방문하세요.
AWS는 데이터 웨어하우스 활동을 어떻게 지원할 수 있습니까?
AWS를 사용하면 사실상 무제한의 스토리지 및 컴퓨팅 용량에 액세스하고, 수집, 저장 및 쿼리되는 데이터 양이 증가함에 따라 시스템을 병렬로 확장하며, 프로비저닝한 리소스에 대해서만 비용을 지불하는 등 온디맨드 컴퓨팅과 관련된 모든 주요 혜택을 누릴 수 있습니다. AWS에서는 서로 원활하게 통합되는 다양한 관리형 서비스를 제공하므로 엔드 투 엔드 분석 및 데이터 웨어하우징 솔루션을 신속하게 배포할 수 있습니다.
다음 그림은 스택이라고도 하는 엔드 투 엔드 분석 프로세스의 주요 단계에 대한 설명입니다. AWS는 각 단계에서 다양한 관리형 서비스를 제공합니다.
Amazon Redshift는 빠르고, 비용 효율적인 완전 관리형 데이터 웨어하우스 서비스입니다. 한 서비스에서 페타바이트 규모의 데이터 웨어하우징과 엑사바이트 규모의 데이터 레이크 분석이 함께 제공되며, 사용한 만큼만 지불하면 됩니다.
지금 계정을 만들어 AWS에서 데이터 웨어하우스를 시작하세요.