반응형
이 글은 공부하며 정리한 내용입니다. 틀리거나 보완할 점이 있다면 댓글로 알려주시면 감사하겠습니다.
1. 핵심 요약
- ODS(Operational Data Store)는 운영 데이터 저장소로, 운영 시스템에서 생성된 데이터를 일시적으로 저장하고 정형화하는 중간 저장
- DW(Data Warehouse)로 데이터가 적재되기 전에, 실시간 또는 근실시간 데이터를 빠르게 질의하거나 가공하기 위한 용도로 활용
- 스테이징과 유사하지만, 더 정제되고, 운영 중 조회 및 처리에 활용되는 점
2. 상세 내용 설명
ODS의 정의
- 먼저, ODS(Operational Data Store)는 일반적으로 운영 데이터를 정형화하여 임시 저장하는 저장소로 정의된다.
- 운영 시스템에서 수집된 데이터를 실시간 또는 짧은 지연으로 반영하며, DW로 적재되기 전 중간 단계로 자주 사용된다.
⚠️ 조직마다 다른 의미로 사용될 수 있음
- 다만, ODS는 조직마다 의미나 범위가 다를 수 있는 용어로 보임..
- 예를 들어 어떤 회사에서는 ODS를 단순한 Staging 저장소로만 쓰고(우리 회사),
또 어떤 회사는 실시간 운영 DB와 직접 연결되는 API 전용 저장소를 ODS라고 부르기도 한다. - 따라서 "ODS"라는 이름이 붙었다고 해서 모두 같은 목적, 구조를 가진다고 보기 어렵고, 실제로는 각 조직의 데이터 흐름 구조 속에서 어떤 역할을 하느냐로 이해하는 것이 더 현실적이다.
- ODS는 운영 데이터를 정형화하여 임시 저장하는 저장소로, 데이터 웨어하우스로 가기 전 단계의 가공/보관 공간이다.
- 운영 DB에서 실시간 또는 주기적으로 데이터를 복제하여 저장하며, 일부 가공을 거쳐 분석 및 집계 시스템으로 전달된다.
어떤 역할을 할까?
- 운영 데이터의 최신 상태 유지: 실시간 또는 짧은 지연으로 데이터를 수집하여 현재 상태를 조회 가능하게 함
- DW 적재 전 사전 가공 공간: 데이터 정제, 변환, 필터링, 키 정리 등 수행
- 사용자 요청 처리: 복잡한 분석은 DW에서, 빠르고 간단한 실시간 응답은 ODS에서 처리하는 식으로 역할 분리
스테이징과의 차이
항목 ODS 스테이징(Staging)
목적 | 실시간 데이터 제공, 운영 상태 반영 | 임시 저장, 배치 적재 전 원본 보관 |
데이터 갱신 | 주기적으로 최신 데이터로 덮어쓰기 | 적재 시간 기준으로 계속 추가됨 (이력 유지) |
활용 목적 | 단순 질의/응답, DW 적재 전 전처리 | 후속 처리용 원본 보관용 |
3. 결론
ODS는 단순한 임시 저장소가 아니라, 운영 데이터를 신속하게 처리하고 일부 가공하여 다음 단계(DW, 마트 등)로 넘기기 위한 실시간 대응형 저장소이다.
일반적으로 데이터 플랫폼에서는 소스 시스템 → ODS → DW → DM(데이터 마트) 의 흐름으로 구성되며, ODS는 이 중에서 빠른 응답성과 최신성 보장이라는 역할을 담당한다.
4. 참고 자료
반응형
'DATA' 카테고리의 다른 글
ELT란 무엇인가 – ETL과의 차이와 선택 기준 (0) | 2021.07.31 |
---|---|
ETL이란 무엇인가 – 개념 (0) | 2021.06.28 |
댓글