[제134회 정보관리기술사 1교시 13번] RAG(Retrieval Augmented Generation) — LLM의 지식 한계를 극복하는 아키텍처

📌 원문 문제

RAG(Retrieval Augmented Generation)를 설명하시오.

🔍 출제 의도 분석

RAG는 제134회뿐 아니라 이후 회차에서도 계속 변형 출제될 가능성이 높은 핵심 주제입니다. LLM의 할루시네이션(환각)이 실제 서비스의 신뢰성을 훼손하는 문제가 부각되면서, 이를 해결하는 대표 아키텍처인 RAG에 대한 이해는 이제 필수입니다. 단순히 “검색 + 생성”이라고만 쓰면 아깝습니다. 각 컴포넌트의 역할, Fine-tuning과의 비교, 발전 방향까지 서술하면 만점에 가까운 점수를 받을 수 있습니다.


1. RAG란 무엇인가

RAG(Retrieval Augmented Generation, 검색 증강 생성)는 외부 지식 베이스에서 관련 정보를 실시간으로 검색(Retrieval)하고, 이를 컨텍스트로 제공하여 LLM이 더 정확한 답변을 생성(Generation)하도록 하는 AI 아키텍처입니다.

LLM은 학습 시점의 데이터만 기억합니다. 2023년 초까지만 학습했다면 최신 정보를 모릅니다. 또한 특정 기업의 내부 문서나 도메인 전문 지식도 알 방법이 없습니다. RAG는 이 문제를 “모른다면 찾아보면 된다”는 방식으로 해결합니다.

2. RAG 동작 원리

① 오프라인 전처리 (인덱싱) 📄 원본 문서 ✂ 청킹 (Chunking) 🔢 임베딩 변환 🗄 벡터 DB 저장 ② 온라인 추론 (쿼리 시) 👤 사용자 질의 질의 임베딩 유사도 검색 프롬프트 조합 🤖 LLM 생성

▲ RAG 전체 파이프라인 — 오프라인 인덱싱과 온라인 추론의 두 단계

3. 핵심 구성요소

① 문서 청킹 (Chunking)

원본 문서를 LLM 컨텍스트 윈도우 크기에 맞게 적절한 크기의 조각으로 분할합니다. 청크가 너무 크면 검색 정확도가 떨어지고, 너무 작으면 문맥이 끊깁니다. 일반적으로 512~1024 토큰 크기에 10~20% 오버랩을 적용합니다.

② 임베딩 모델 (Embedding Model)

텍스트를 고차원 벡터로 변환하여 의미적 유사성 기반 검색을 가능하게 합니다. OpenAI text-embedding-3, Sentence-BERT, 다국어 지원 BGE-M3 등이 널리 사용됩니다.

③ 벡터 데이터베이스 (Vector DB)

임베딩 벡터를 저장하고 ANN(근사 최근접 이웃) 검색을 고속으로 지원합니다.

솔루션 특징 적합 환경
Pinecone 완전관리형 서비스, 고성능 대규모 프로덕션
Weaviate 오픈소스, 하이브리드 검색 지원 중·대규모
Chroma 경량, 설치 간편 로컬 개발·MVP
pgvector PostgreSQL 확장, 기존 DB 활용 중·소규모

④ 검색기 유형

  • Dense Retrieval: 임베딩 기반 의미적 유사도 검색 — “강아지”와 “개”를 같은 맥락으로 이해
  • Sparse Retrieval (BM25): 키워드 일치 기반 검색 — 정확한 용어 매칭에 강함
  • Hybrid: Dense + Sparse 결합 — 두 방식의 장점을 모두 활용

4. RAG vs Fine-tuning 비교

비교 항목 RAG Fine-tuning
최신 정보 반영 ✅ 실시간 가능 ❌ 재학습 필요
구축 비용 ✅ 상대적으로 낮음 ❌ 높은 GPU 비용
도메인 특화 🔶 문서 품질 의존 ✅ 높은 성능
출처 추적 ✅ 참조 문서 제공 ❌ 어려움
환각 감소 ✅ 효과적 🔶 부분적
추론 속도 🔶 검색 지연 발생 ✅ 빠름

5. RAG의 진화 방향

  • Advanced RAG: 검색 전 Query Rewriting, 검색 후 Re-ranking을 추가하여 정확도 향상. HyDE(가상 답변 기반 검색) 기법 활용
  • Modular RAG: 검색·재순위·생성 각 단계를 독립 모듈로 분리하여 개별 최적화 가능
  • Agentic RAG: AI 에이전트가 스스로 검색 전략을 결정하고, 결과 품질을 판단하여 추가 검색을 반복. 복잡한 다단계 질의에 효과적

6. 결론

RAG는 “LLM이 모르는 것은 찾아보면 된다”는 단순한 아이디어에서 출발했지만, 현재는 기업용 AI 서비스의 사실상 표준 아키텍처가 됐습니다. 공공기관 법령 검색, 기업 내부 문서 Q&A, 의료 정보 제공 등 다양한 현장에서 LLM의 신뢰성을 획기적으로 높이는 핵심 솔루션으로 자리잡고 있습니다.

✅ 핵심 암기 포인트: RAG = Retrieval(검색) + Augmented(증강) + Generation(생성)  /  구성요소: 청킹 → 임베딩 → 벡터DB → 검색 → 프롬프트 조합 → LLM 생성

Leave a Comment