Teradata(테라데이타)는 대규모 데이터 분석 및 데이터웨어하우스(DWH)를 위한 고성능 MPP(Massively Parallel Processing) 기반의 데이터베이스 시스템 및 분석 솔루션입니다. 특히 정형 데이터 기반의 빅데이터 분석에 특화되어 있으며, 글로벌 대기업과 금융기관, 통신사 등에서 데이터웨어하우스 플랫폼으로 많이 사용됩니다.
1. Teradata 개요
Teradata는 1979년 설립된 미국 기업으로, 대량의 데이터를 빠르고 효율적으로 분석할 수 있는 분산 병렬처리 기반 아키텍처를 제공하며, 하이엔드 데이터웨어하우스 시장의 대표적인 솔루션입니다.
활용 분야:
- 고객 분석 (CRM)
- 매출 및 비용 분석
- 제품 성능 분석
- 공급망 최적화
- 통신 데이터 분석
2. Teradata 아키텍처
Teradata는 MPP(Massively Parallel Processing) 구조를 기반으로 하며, 다음과 같은 구성 요소로 이루어져 있습니다.
주요 구성 요소:
구성 요소 | 설명 |
---|---|
PE (Parsing Engine) | SQL 요청을 분석하고 실행 계획을 수립 |
BYNET | PE와 AMP 사이의 데이터 전송을 담당하는 고속 통신 계층 |
AMP (Access Module Processor) | 데이터 저장/조회 처리, 각 AMP는 독립적으로 병렬 처리 수행 |
DISK | 각 AMP가 관리하는 디스크 저장 공간 |
이 구조 덕분에 Teradata는 수천 테라바이트의 데이터를 수초 이내에 분석할 수 있는 뛰어난 성능을 제공합니다.
3. 구성도 (간단한 ASCII 구조 예시)

4. Teradata의 특징
항목 | 설명 |
---|---|
MPP 아키텍처 | 수많은 노드가 병렬로 동시에 작업하여 처리 속도 향상 |
확장성 | 데이터 용량 증가에 따라 시스템 유연한 수평 확장 가능 |
균등 분산 | 해시 기반 분산 저장으로 데이터 균형 유지 |
SQL 기반 | ANSI SQL 지원으로 익숙한 쿼리 작성 환경 |
고가용성 | 장애 발생 시 자동 Failover 기능 내장 |
5. 장점과 단점
장점
- 대용량 데이터 분석에 강함
- 병렬처리에 특화되어 빠른 응답 속도
- 우수한 확장성 및 안정성
- 데이터 정합성과 무결성 유지에 효과적
단점
- 도입 및 운영 비용이 높음
- 설치 및 유지보수에 전문 인력이 필요
- 최근 Cloud-Native 솔루션에 비해 유연성은 떨어질 수 있음
6. 최신 흐름
최근 Teradata는 **클라우드 기반 제품군(Vantage)**을 출시하여, AWS, Azure, Google Cloud 위에서 실행할 수 있도록 하였으며, AI/ML 연계 분석 기능, IoT 데이터 분석, 실시간 스트리밍 처리 기능도 강화되었습니다.
7. 최종 정리
Teradata는 대규모 정형 데이터를 효율적으로 저장하고 분석할 수 있는 대표적인 고성능 데이터웨어하우스 플랫폼입니다. 특히 기업의 정형 데이터 기반 의사결정 분석에 매우 적합하며, 클라우드 전환 전략을 포함한 차세대 BI 분석 환경에서도 중요한 역할을 합니다.