데이터베이스

ILM (Information Lifecycle Management) in Database

Information Lifecycle Management (ILM)은 데이터베이스에서 데이터의 수명 주기에 따라 저장, 보관, 이동, 삭제를 자동화하는 관리 기법입니다.
즉, 자주 사용하는 데이터(핫 데이터)는 빠른 스토리지에, 오래된 데이터(콜드 데이터)는 저비용 스토리지로 이동하여 성능과 비용을 최적화하는 전략입니다.

1. ILM의 개념

ILM은 데이터의 가치와 접근 빈도에 따라 데이터 관리 전략을 자동화합니다.

ILM 주요 기능

  • 데이터 저장 비용 절감 (자주 사용하는 데이터는 빠른 디스크, 오래된 데이터는 저비용 스토리지에 저장)
  • 데이터 아카이빙 및 보관 자동화 (필요 없는 데이터는 아카이브 또는 삭제)
  • 쿼리 성능 향상 (핫 데이터를 빠른 스토리지에서 처리)
  • 컴플라이언스 및 규제 준수 (금융, 의료 등 규제 산업에서 장기 보관 정책 지원)

2. ILM 주요 단계 (데이터 수명 주기)

데이터는 생성된 후 일정 시간이 지나면서 중요도가 달라집니다.
ILM은 데이터를 라이프사이클 단계별로 적절한 스토리지에 배치하는 역할을 합니다.

단계설명주요 ILM 정책
핫 데이터 (Hot Data)최근 생성된 자주 조회되는 데이터SSD / 고속 디스크에 저장
웜 데이터 (Warm Data)사용 빈도가 줄어든 중간 단계의 데이터중간 성능의 스토리지로 이동
콜드 데이터 (Cold Data)거의 접근하지 않는 데이터저비용 스토리지로 이동
아카이브 데이터 (Archived Data)장기간 보관해야 하지만 거의 사용되지 않는 데이터클라우드, 테이프, 객체 스토리지 등에 저장
삭제 (Purge)더 이상 필요 없는 데이터영구 삭제

3. ILM을 지원하는 데이터베이스 기능

다양한 데이터베이스에서 ILM을 지원하는 기능을 제공합니다.

(1) Oracle Database ILM

Oracle에서는 Automatic Data Optimization (ADO)Heat Map 기능을 통해 ILM을 자동화합니다.

Heat Map (데이터 접근 빈도 추적)

  • 데이터가 얼마나 자주 조회되는지 자동으로 추적
  • 자주 사용되는 데이터는 핫 데이터, 오래된 데이터는 콜드 데이터로 자동 분류

📌 Heat Map 활성화

ALTER DATABASE HEAT_MAP ON;

Automatic Data Optimization (ADO)

  • 지정된 정책에 따라 데이터 이동, 압축, 삭제를 자동 수행
  • 사용 빈도가 낮은 데이터를 자동으로 압축하거나, 느린 스토리지로 이동

📌 ADO 정책 설정 (1년간 접근하지 않은 데이터 압축)

ALTER TABLE sales ILM ADD POLICY ROW STORE COMPRESS ADVANCED
FOR QUERY LOW SEGMENT AFTER 365 DAYS OF NO ACCESS;

📌 ADO 정책 설정 (3년간 접근하지 않은 데이터 테이블 이동)

ALTER TABLE sales ILM ADD POLICY TIER TO tablespace_low_cost
AFTER 1095 DAYS OF NO ACCESS;

(2) Microsoft SQL Server ILM

SQL Server는 ILM을 위해 Stretch DatabasePartitioning 기능을 제공합니다.

Stretch Database (온프레미스 + 클라우드 연동)

  • 콜드 데이터(자주 사용되지 않는 데이터)를 Azure로 자동 이동
  • 핫 데이터는 로컬 DB에 유지하여 성능 최적화

📌 Stretch Database 활성화

ALTER DATABASE MyDatabase SET REMOTE_DATA_ARCHIVE = ON;

Partitioning을 통한 ILM 적용

  • 최근 데이터는 빠른 디스크(SSD) → 핫 데이터
  • 오래된 데이터는 느린 디스크(HDD) → 콜드 데이터

📌 월별 파티션 테이블 생성

CREATE PARTITION FUNCTION pf_date_range (DATETIME)
AS RANGE LEFT FOR VALUES ('2023-12-31', '2024-06-30');

(3) PostgreSQL + Tablespaces

PostgreSQL에서는 Tablespace 및 파티셔닝을 활용하여 ILM을 구현할 수 있습니다.

Tablespace 기반 데이터 이동

📌 고성능 SSD에 핫 데이터 저장

CREATE TABLESPACE fast_storage LOCATION '/mnt/ssd/';

📌 저비용 HDD에 콜드 데이터 저장

CREATE TABLESPACE slow_storage LOCATION '/mnt/hdd/';

📌 파티션 이동

ALTER TABLE transactions SET TABLESPACE slow_storage;

(4) Snowflake & Google BigQuery ILM

클라우드 기반 데이터 웨어하우스에서는 자동 티어링 및 압축을 통해 ILM을 적용합니다.

📌 BigQuery ILM 정책 적용 예제 (7년 후 삭제)

CREATE TABLE sales (
id INT64,
amount FLOAT64
)
PARTITION BY DATE(created_at)
OPTIONS (
expiration_timestamp=TIMESTAMP_ADD(CURRENT_TIMESTAMP(), INTERVAL 7 YEAR)
);

4. ILM 활용 사례

(1) 금융 데이터 관리

  • 최근 3년간의 거래 기록 → 핫 데이터 (SSD 저장)
  • 3~10년 전 거래 데이터 → 콜드 데이터 (HDD 저장)
  • 10년 이상 데이터 → 아카이브 (테이프 또는 클라우드)

📌 Oracle ADO를 사용하여 금융 데이터 압축

ALTER TABLE transactions ILM ADD POLICY ROW STORE COMPRESS ADVANCED
FOR ARCHIVE HIGH SEGMENT AFTER 3650 DAYS OF NO ACCESS;

(2) 로그 데이터 아카이빙

  • 최근 1개월 로그 데이터 → 핫 데이터 (고속 검색 가능)
  • 1~6개월 로그 데이터 → 압축 저장
  • 6개월 이상 → 저비용 클라우드 또는 삭제

📌 PostgreSQL에서 오래된 로그 데이터 이동

ALTER TABLE logs SET TABLESPACE slow_storage;

(3) 전자상거래 주문 관리

  • 최근 주문 데이터(1년) → 빠른 스토리지
  • 오래된 주문 데이터(1~5년) → 느린 스토리지
  • 5년 이상 주문 데이터 → 클라우드 또는 삭제

📌 SQL Server Stretch DB를 활용한 주문 데이터 자동 이동

ALTER TABLE Orders ENABLE REMOTE_DATA_ARCHIVE;

5. ILM의 장점과 한계

ILM의 장점

  1. 스토리지 비용 절감 (핫 데이터는 고속 디스크, 콜드 데이터는 저비용 스토리지)
  2. 쿼리 성능 향상 (핫 데이터만 빠르게 접근)
  3. 컴플라이언스 및 데이터 보관 정책 준수 (규제 요구사항 충족)
  4. 데이터 자동화 및 유지보수 비용 절감

ILM의 한계

  1. 초기 설정이 복잡할 수 있음 (ILM 정책 설계 필요)
  2. 잘못된 정책 설정 시 성능 저하 가능 (콜드 데이터가 자주 조회될 경우 문제 발생)
  3. 모든 데이터베이스에서 완벽히 지원되는 기능이 아님 (DBMS마다 지원 수준 차이 있음)

6. 결론

ILM(정보 수명 주기 관리)은 데이터 활용도에 따라 적절한 스토리지 및 관리 정책을 자동화하는 필수 기술
Oracle, SQL Server, PostgreSQL 등 다양한 DBMS에서 ILM을 지원하며, 비용 절감 및 성능 최적화 가능
데이터 아카이빙, 성능 튜닝, 보안 강화를 위한 필수적인 전략! 🚀

zerg96

Recent Posts

노트북(윈도우)에서 아이폰 유선 테더링 하기

윈도우 운영체제의 노트북에서는 iPhone 유선 테더링이 잘 안되는 경우가 많습니다. 보통 iPhone의 드라이버가 설치가 안되있어서인…

5일 ago

오라클 래치(Latch)

오라클 데이터베이스의 성능을 논할 때, 내부적으로 발생하는 경합(Contention)은 피할 수 없는 주제다. 특히 다수의 프로세스가…

1주 ago

사장님도 3표, 나도 3표? ‘3%룰’ 완전 정복!

안녕하세요, 혹시 이런 생각해 본 적 없으신가요? "내가 투자한 회사는 누가 감시하고, 어떻게 운영될까?" 오늘은…

3주 ago

Vector Store(벡터 스토어)

'벡터 스토어' 완벽 가이드: AI 시대, 데이터의 새로운 심장을 만나다 IT 업계는 인공지능(AI)이라는 거대한 패러다임의…

3주 ago

Gemini CLI (재미나이 CLI)

1. Gemini CLI란 무엇인가요? Gemini CLI는 터미널 환경에서 직접 Gemini 모델과 상호작용할 수 있도록 만들어진…

3주 ago

과적합 (overfitting)

과적합은 머신러닝에서 학습용데이터를 과하게 학습하여, 실제데이터를 예측하지 못하는 현상을 말합니다. 인공지능(AI)의 학습 방법은 우리가 시험공부를…

1개월 ago