본문 바로가기
DATA

ODS란 무엇인가 – 개념

by 오늘은강박사갈거야~~ 2022. 5. 8.
반응형

이 글은 공부하며 정리한 내용입니다. 틀리거나 보완할 점이 있다면 댓글로 알려주시면 감사하겠습니다.


1. 핵심 요약

  • ODS(Operational Data Store)는 운영 데이터 저장소로, 운영 시스템에서 생성된 데이터를 일시적으로 저장하고 정형화하는 중간 저장
  • DW(Data Warehouse)로 데이터가 적재되기 전에, 실시간 또는 근실시간 데이터를 빠르게 질의하거나 가공하기 위한 용도로 활용
  • 스테이징과 유사하지만, 더 정제되고, 운영 중 조회 및 처리에 활용되는 점

2. 상세 내용 설명

ODS의 정의

  • 먼저, ODS(Operational Data Store)는 일반적으로 운영 데이터를 정형화하여 임시 저장하는 저장소로 정의된다.
  • 운영 시스템에서 수집된 데이터를 실시간 또는 짧은 지연으로 반영하며, DW로 적재되기 전 중간 단계로 자주 사용된다.

⚠️ 조직마다 다른 의미로 사용될 수 있음

  • 다만, ODS는 조직마다 의미나 범위가 다를 수 있는 용어로 보임..
  • 예를 들어 어떤 회사에서는 ODS를 단순한 Staging 저장소로만 쓰고(우리 회사),
    또 어떤 회사는 실시간 운영 DB와 직접 연결되는 API 전용 저장소를 ODS라고 부르기도 한다.
  • 따라서 "ODS"라는 이름이 붙었다고 해서 모두 같은 목적, 구조를 가진다고 보기 어렵고, 실제로는 각 조직의 데이터 흐름 구조 속에서 어떤 역할을 하느냐로 이해하는 것이 더 현실적이다.
  • ODS는 운영 데이터를 정형화하여 임시 저장하는 저장소로, 데이터 웨어하우스로 가기 전 단계의 가공/보관 공간이다.
  • 운영 DB에서 실시간 또는 주기적으로 데이터를 복제하여 저장하며, 일부 가공을 거쳐 분석 및 집계 시스템으로 전달된다.

어떤 역할을 할까?

  • 운영 데이터의 최신 상태 유지: 실시간 또는 짧은 지연으로 데이터를 수집하여 현재 상태를 조회 가능하게 함
  • DW 적재 전 사전 가공 공간: 데이터 정제, 변환, 필터링, 키 정리 등 수행
  • 사용자 요청 처리: 복잡한 분석은 DW에서, 빠르고 간단한 실시간 응답은 ODS에서 처리하는 식으로 역할 분리

스테이징과의 차이

항목 ODS 스테이징(Staging)

목적 실시간 데이터 제공, 운영 상태 반영 임시 저장, 배치 적재 전 원본 보관
데이터 갱신 주기적으로 최신 데이터로 덮어쓰기 적재 시간 기준으로 계속 추가됨 (이력 유지)
활용 목적 단순 질의/응답, DW 적재 전 전처리 후속 처리용 원본 보관용

3. 결론

ODS는 단순한 임시 저장소가 아니라, 운영 데이터를 신속하게 처리하고 일부 가공하여 다음 단계(DW, 마트 등)로 넘기기 위한 실시간 대응형 저장소이다.

일반적으로 데이터 플랫폼에서는 소스 시스템 → ODS → DW → DM(데이터 마트) 의 흐름으로 구성되며, ODS는 이 중에서 빠른 응답성과 최신성 보장이라는 역할을 담당한다.

4. 참고 자료

반응형

'DATA' 카테고리의 다른 글

ELT란 무엇인가 – ETL과의 차이와 선택 기준  (0) 2021.07.31
ETL이란 무엇인가 – 개념  (0) 2021.06.28

댓글