전통문화대전망 - 전통 미덕 - OLAP의 주요 적용 분야와 개발 동향을 아시는 분 계신가요?

OLAP의 주요 적용 분야와 개발 동향을 아시는 분 계신가요?

OLAP(온라인 분석 처리).

OLAP(온라인 분석 처리)란 무엇인가요?

OLAP(온라인 분석 처리)의 개념은 관계형 데이터베이스의 아버지인 E.F. Codd가 1993년에 처음 제안했습니다. OLAP의 12가지 원칙을 제안했습니다. OLAP의 제안은 큰 반향을 불러일으켰다. OLAP은 일종의 제품으로서 온라인 트랜잭션 처리(OLTP)와는 확실히 구별된다.

오늘날의 데이터 처리는 크게 온라인 거래 처리 OLTP(on-line transaction process)와 온라인 분석 처리 OLAP(On-Line Analytical Process) 두 가지로 나눌 수 있습니다. OLTP는 주로 은행 거래와 같은 기본적이고 일상적인 거래 처리를 위한 전통적인 관계형 데이터베이스의 주요 애플리케이션입니다. OLAP은 데이터 웨어하우스 시스템의 주요 애플리케이션으로 복잡한 분석 작업을 지원하고 의사결정 지원에 중점을 두고 직관적이고 이해하기 쉬운 쿼리 결과를 제공합니다. 다음 표에는 OLTP와 OLAP의 비교가 나와 있습니다.

OLTPOLAP 사용자 운영자, 하위 관리자, 의사 결정자, 고위 관리자, 기능, 일상 작업, 처리, 분석 및 의사 결정, DB 설계는 응용 프로그램 중심, 주제 중심 데이터 현재, 최신 세부사항, 2차원 이산 이력, 집계, 다차원, 통합, 통합 액세스, 수십 개의 레코드 읽기/쓰기, 수백만 개의 레코드 읽기, 작업 단위에 대한 단순 트랜잭션, 복잡한 쿼리, 수천 또는 수백 명의 사용자, DB 크기 100MB- GB100GB-TB

OLAP는 분석가, 관리자 또는 경영진이 다양한 관점에서 빠르고 일관되게 대화형으로 정보에 액세스하여 데이터를 더 깊이 이해할 수 있도록 지원하는 소프트웨어 기술 유형입니다. OLAP의 목표는 다차원 환경에서 의사결정 지원이나 특정 쿼리 및 보고 요구 사항을 충족하는 것입니다. 기술 핵심은 "차원"이라는 개념입니다.

'차원'은 사람들이 객관적인 세계를 관찰하는 각도로, 유형에 대한 상위 분류이다. "차원"에는 일반적으로 계층적 관계가 포함되어 있으며 때로는 매우 복잡합니다. 엔터티의 여러 중요한 속성을 여러 차원으로 정의함으로써 사용자는 다양한 차원의 데이터를 비교할 수 있습니다. 따라서 OLAP은 다차원 데이터 분석 도구의 집합체라고도 할 수 있습니다.

OLAP의 기본적인 다차원 분석 작업에는 드릴(롤업 및 드릴다운), 슬라이스(슬라이스), 주사위(주사위)는 물론 회전(피벗), 드릴 건너뛰기, 드릴스루 등이 포함됩니다.

·드릴링은 차원의 수준을 변경하고 분석의 세분화를 변환하는 것입니다. 여기에는 드릴업 및 드릴다운이 포함됩니다. 롤업은 특정 차원에서 하위 수준의 세부 데이터를 상위 수준의 요약 데이터로 요약하거나 차원 수를 줄이는 반면, 드릴다운은 그 반대이며 요약 데이터에서 세부 데이터로 이동하여 관찰하거나 새 차원을 추가합니다. .

·슬라이싱 앤 다이싱은 일부 차원의 값을 선택한 후 나머지 차원의 메트릭 데이터 분포에 관한 것입니다. 차원이 2개만 남아 있으면 슬라이스이고, 3개가 있으면 주사위입니다.

·회전은 차원의 방향을 변경하는 것입니다. 즉, 테이블에서 차원의 배치를 다시 정렬하는 것입니다(예: 행과 열 교체).

OLAP에는 다양한 구현 방식이 있는데, 데이터를 저장하는 방식에 따라 ROLAP, MOLAP, HOLAP으로 나눌 수 있습니다.

ROLAP은 관계형 데이터베이스(Relational OLAP) 기반의 OLAP 구현을 나타냅니다. 관계형 데이터베이스를 핵심으로 다차원 데이터를 관계형 구조로 표현하고 저장합니다. ROLAP은 다차원 데이터베이스의 다차원 구조를 두 가지 유형의 테이블로 나눕니다. 하나는 데이터 및 차원 키워드를 저장하는 데 사용되는 사실 테이블이고, 다른 하나는 차원 테이블입니다. 즉, 각 차원에 대해 저장하기 위해 최소한 하나의 테이블이 사용됩니다. 차원 계층 구조, 멤버 범주 및 기타 차원에 대한 설명 정보. 차원 테이블과 사실 테이블은 기본 키와 외래 키를 통해 함께 연결되어 "스타 스키마"를 형성합니다. 계층적으로 복잡한 차원의 경우 너무 많은 저장 공간을 차지하는 중복 데이터를 방지하기 위해 여러 테이블을 사용하여 이를 설명할 수 있습니다. 이러한 스타 스키마 확장을 "눈송이 스키마"라고 합니다.

MOLAP은 다차원 데이터 구성(MultiDimensional OLAP)을 기반으로 한 OLAP 구현을 의미합니다. 다차원 데이터 구성을 핵심으로, 즉 MOLAP은 다차원 배열을 사용하여 데이터를 저장합니다. 다차원 데이터는 저장소에서 "큐브" 구조를 형성합니다. MOLAP에서는 "큐브"를 "회전", "절단" 및 "슬라이스"하는 것이 다차원 데이터 보고서를 생성하는 주요 기술입니다.

HOLAP은 하이브리드 데이터 조직(Hybrid OLAP) 기반의 OLAP 구현을 의미합니다. 예를 들어, 낮은 수준은 관계형이고 높은 수준은 다차원 행렬입니다. 이 접근 방식은 더 나은 유연성을 제공합니다.

전용 SQL Server 제공, 특정 스토리지 모드(예: 스타 및 눈송이)에 대한 SQL 쿼리에 대한 특별 지원 제공 등 OLAP를 구현하는 다른 방법이 있습니다.

OLAP 도구는 특정 문제에 대한 온라인 데이터 액세스 및 분석입니다. 다차원적인 방식으로 데이터를 분석, 쿼리 및 보고합니다. 차원은 사람들이 데이터를 보는 특정 각도입니다. 예를 들어, 기업이 제품의 매출을 고려할 때 일반적으로 해당 제품의 매출을 시간, 지역, 제품 등 다양한 관점에서 심층적으로 관찰합니다. 여기서 시간, 지역, 제품은 차원입니다. 이러한 차원과 조사 중인 측정 지표의 다양한 조합으로 구성된 다차원 배열은 OLAP 분석의 기초가 되며 공식적으로 다음과 같이 (차원 1, 차원 2,..., 차원 n, 측정 지표)로 표현할 수 있습니다. 지역, 시간), 제품, 매출). 다차원 분석이란 다차원 형태로 정리된 데이터를 슬라이싱, 다이싱, 드릴링(Drill-down 및 Roll-up), 회전(Pivot) 등 다양한 분석 작업을 수행하여 사용자가 수행할 수 있도록 하는 것을 말합니다. 데이터베이스의 데이터를 다양한 각도와 측면에서 관찰하여 데이터에 포함된 정보를 깊이 이해합니다.

종합 데이터를 구성하는 다양한 방식에 따라 현재 일반적인 OLAP에는 주로 다차원 데이터베이스 기반의 MOLAP과 관계형 데이터베이스 기반의 ROLAP이 있습니다. MOLAP은 다차원 방식으로 데이터를 구성하고 저장하는 반면, ROLAP은 기존 관계형 데이터베이스 기술을 사용하여 다차원 데이터를 시뮬레이션합니다. 데이터 웨어하우스 애플리케이션에서 OLAP 애플리케이션은 일반적으로 데이터 웨어하우스 애플리케이션을 위한 프런트 엔드 도구입니다. 동시에 OLAP 도구는 데이터 마이닝 도구 및 통계 분석 도구와 함께 사용하여 의사 결정 분석 기능을 향상시킬 수도 있습니다.