데이터베이스

ILM (Information Lifecycle Management) in Database

Information Lifecycle Management (ILM)은 데이터베이스에서 데이터의 수명 주기에 따라 저장, 보관, 이동, 삭제를 자동화하는 관리 기법입니다.
즉, 자주 사용하는 데이터(핫 데이터)는 빠른 스토리지에, 오래된 데이터(콜드 데이터)는 저비용 스토리지로 이동하여 성능과 비용을 최적화하는 전략입니다.

1. ILM의 개념

ILM은 데이터의 가치와 접근 빈도에 따라 데이터 관리 전략을 자동화합니다.

ILM 주요 기능

  • 데이터 저장 비용 절감 (자주 사용하는 데이터는 빠른 디스크, 오래된 데이터는 저비용 스토리지에 저장)
  • 데이터 아카이빙 및 보관 자동화 (필요 없는 데이터는 아카이브 또는 삭제)
  • 쿼리 성능 향상 (핫 데이터를 빠른 스토리지에서 처리)
  • 컴플라이언스 및 규제 준수 (금융, 의료 등 규제 산업에서 장기 보관 정책 지원)

2. ILM 주요 단계 (데이터 수명 주기)

데이터는 생성된 후 일정 시간이 지나면서 중요도가 달라집니다.
ILM은 데이터를 라이프사이클 단계별로 적절한 스토리지에 배치하는 역할을 합니다.

단계설명주요 ILM 정책
핫 데이터 (Hot Data)최근 생성된 자주 조회되는 데이터SSD / 고속 디스크에 저장
웜 데이터 (Warm Data)사용 빈도가 줄어든 중간 단계의 데이터중간 성능의 스토리지로 이동
콜드 데이터 (Cold Data)거의 접근하지 않는 데이터저비용 스토리지로 이동
아카이브 데이터 (Archived Data)장기간 보관해야 하지만 거의 사용되지 않는 데이터클라우드, 테이프, 객체 스토리지 등에 저장
삭제 (Purge)더 이상 필요 없는 데이터영구 삭제

3. ILM을 지원하는 데이터베이스 기능

다양한 데이터베이스에서 ILM을 지원하는 기능을 제공합니다.

(1) Oracle Database ILM

Oracle에서는 Automatic Data Optimization (ADO)Heat Map 기능을 통해 ILM을 자동화합니다.

Heat Map (데이터 접근 빈도 추적)

  • 데이터가 얼마나 자주 조회되는지 자동으로 추적
  • 자주 사용되는 데이터는 핫 데이터, 오래된 데이터는 콜드 데이터로 자동 분류

📌 Heat Map 활성화

ALTER DATABASE HEAT_MAP ON;

Automatic Data Optimization (ADO)

  • 지정된 정책에 따라 데이터 이동, 압축, 삭제를 자동 수행
  • 사용 빈도가 낮은 데이터를 자동으로 압축하거나, 느린 스토리지로 이동

📌 ADO 정책 설정 (1년간 접근하지 않은 데이터 압축)

ALTER TABLE sales ILM ADD POLICY ROW STORE COMPRESS ADVANCED
FOR QUERY LOW SEGMENT AFTER 365 DAYS OF NO ACCESS;

📌 ADO 정책 설정 (3년간 접근하지 않은 데이터 테이블 이동)

ALTER TABLE sales ILM ADD POLICY TIER TO tablespace_low_cost
AFTER 1095 DAYS OF NO ACCESS;

(2) Microsoft SQL Server ILM

SQL Server는 ILM을 위해 Stretch DatabasePartitioning 기능을 제공합니다.

Stretch Database (온프레미스 + 클라우드 연동)

  • 콜드 데이터(자주 사용되지 않는 데이터)를 Azure로 자동 이동
  • 핫 데이터는 로컬 DB에 유지하여 성능 최적화

📌 Stretch Database 활성화

ALTER DATABASE MyDatabase SET REMOTE_DATA_ARCHIVE = ON;

Partitioning을 통한 ILM 적용

  • 최근 데이터는 빠른 디스크(SSD) → 핫 데이터
  • 오래된 데이터는 느린 디스크(HDD) → 콜드 데이터

📌 월별 파티션 테이블 생성

CREATE PARTITION FUNCTION pf_date_range (DATETIME)
AS RANGE LEFT FOR VALUES ('2023-12-31', '2024-06-30');

(3) PostgreSQL + Tablespaces

PostgreSQL에서는 Tablespace 및 파티셔닝을 활용하여 ILM을 구현할 수 있습니다.

Tablespace 기반 데이터 이동

📌 고성능 SSD에 핫 데이터 저장

CREATE TABLESPACE fast_storage LOCATION '/mnt/ssd/';

📌 저비용 HDD에 콜드 데이터 저장

CREATE TABLESPACE slow_storage LOCATION '/mnt/hdd/';

📌 파티션 이동

ALTER TABLE transactions SET TABLESPACE slow_storage;

(4) Snowflake & Google BigQuery ILM

클라우드 기반 데이터 웨어하우스에서는 자동 티어링 및 압축을 통해 ILM을 적용합니다.

📌 BigQuery ILM 정책 적용 예제 (7년 후 삭제)

CREATE TABLE sales (
id INT64,
amount FLOAT64
)
PARTITION BY DATE(created_at)
OPTIONS (
expiration_timestamp=TIMESTAMP_ADD(CURRENT_TIMESTAMP(), INTERVAL 7 YEAR)
);

4. ILM 활용 사례

(1) 금융 데이터 관리

  • 최근 3년간의 거래 기록 → 핫 데이터 (SSD 저장)
  • 3~10년 전 거래 데이터 → 콜드 데이터 (HDD 저장)
  • 10년 이상 데이터 → 아카이브 (테이프 또는 클라우드)

📌 Oracle ADO를 사용하여 금융 데이터 압축

ALTER TABLE transactions ILM ADD POLICY ROW STORE COMPRESS ADVANCED
FOR ARCHIVE HIGH SEGMENT AFTER 3650 DAYS OF NO ACCESS;

(2) 로그 데이터 아카이빙

  • 최근 1개월 로그 데이터 → 핫 데이터 (고속 검색 가능)
  • 1~6개월 로그 데이터 → 압축 저장
  • 6개월 이상 → 저비용 클라우드 또는 삭제

📌 PostgreSQL에서 오래된 로그 데이터 이동

ALTER TABLE logs SET TABLESPACE slow_storage;

(3) 전자상거래 주문 관리

  • 최근 주문 데이터(1년) → 빠른 스토리지
  • 오래된 주문 데이터(1~5년) → 느린 스토리지
  • 5년 이상 주문 데이터 → 클라우드 또는 삭제

📌 SQL Server Stretch DB를 활용한 주문 데이터 자동 이동

ALTER TABLE Orders ENABLE REMOTE_DATA_ARCHIVE;

5. ILM의 장점과 한계

ILM의 장점

  1. 스토리지 비용 절감 (핫 데이터는 고속 디스크, 콜드 데이터는 저비용 스토리지)
  2. 쿼리 성능 향상 (핫 데이터만 빠르게 접근)
  3. 컴플라이언스 및 데이터 보관 정책 준수 (규제 요구사항 충족)
  4. 데이터 자동화 및 유지보수 비용 절감

ILM의 한계

  1. 초기 설정이 복잡할 수 있음 (ILM 정책 설계 필요)
  2. 잘못된 정책 설정 시 성능 저하 가능 (콜드 데이터가 자주 조회될 경우 문제 발생)
  3. 모든 데이터베이스에서 완벽히 지원되는 기능이 아님 (DBMS마다 지원 수준 차이 있음)

6. 결론

ILM(정보 수명 주기 관리)은 데이터 활용도에 따라 적절한 스토리지 및 관리 정책을 자동화하는 필수 기술
Oracle, SQL Server, PostgreSQL 등 다양한 DBMS에서 ILM을 지원하며, 비용 절감 및 성능 최적화 가능
데이터 아카이빙, 성능 튜닝, 보안 강화를 위한 필수적인 전략! 🚀

zerg96

Recent Posts

MCP(Model Context Protocol)

오늘은 AI 생태계에 혁신적인 변화를 가져올 것으로 예상되는 MCP(Model Context Protocol)에 대해 상세히 알아보겠습니다. 2024년…

2주 ago

TPM(Trusted Platform Module)

1. TPM이란? TPM(Trusted Platform Module)은 국제 표준 기반의 보안 하드웨어 칩으로, 컴퓨터나 디지털 장비 내에서…

2주 ago

BitLocker

BitLocker는 Microsoft Windows 운영 체제에 내장된 디스크 전체 암호화(Full Disk Encryption) 기능입니다. 기업 환경뿐만 아니라…

2주 ago

《데블스 플랜 시즌2》: 게임인가, 연애인가? 소희 이렇게까지..?

시즌2, 기대했는데... 실망도 두 배!두뇌싸움을 기대했는데, 전략도 없는 자기들만의 감정에 따른 편가르기, 정치싸움이 되어 버린…

2주 ago

BPF도어(BPFdoor)

BPF(Berkeley Packet Filter) 도어는 해커가 관리자 몰래 뒷문을 새로 만든 것입니다.해커가 명령을 내려 특정 데이터들을 뒷문을…

2주 ago

IPC (Inter-Process Communication)

1. IPC의 개념과 목적 1.1 IPC란 무엇인가? IPC (Inter-Process Communication)는 운영체제 내의 서로 독립적인 프로세스…

3주 ago