대규모 언어모델(LLM)을 기반으로 한 지능형 정보검색 시스템 구축에 대하여 다음을 설명하시오.
가. 기존 키워드 검색과 LLM 기반 의미 검색의 차이점
나. RAG(Retrieval Augmented Generation) 파이프라인 구성요소와 품질 향상 방안
다. LLM 기반 정보검색 시스템의 성능 평가 지표
라. 환각(Hallucination) 발생 원인과 완화 전략
LLM 기반 검색 시스템은 2024년 이후 기업 정보 시스템의 핵심 패러다임으로 자리 잡았습니다. 단순한 RAG 개념을 넘어 품질 평가 지표와 환각 완화까지 묻는 실무 지향적 문제입니다. RAGAS 평가 프레임워크와 구체적인 환각 완화 전략을 중심으로 서술하면 고득점이 가능합니다.
| 구분 | 키워드 검색 (BM25/TF-IDF) | LLM 기반 의미 검색 |
|---|---|---|
| 검색 방식 | 단어 빈도·역문서 빈도 기반 매칭 | 임베딩 벡터 코사인 유사도 비교 |
| 의미 이해 | 동의어·문맥 이해 불가 | 의미적 유사성 기반 검색 가능 |
| 예시 | “강아지” 검색 시 “개” 문서 미검색 | “강아지” 검색 시 “개” 관련 문서 검색 |
| 다국어 | 언어별 형태소 분석 필요 | 다국어 임베딩 모델로 자동 처리 |
| 복잡 질의 | “저렴하면서 배터리 긴 노트북”처리 어려움 | 복합 의도 파악하여 관련 문서 검색 |
| 성능 한계 | 정확 용어 불일치 시 검색 실패 | 임베딩 품질에 따라 성능 차이 |
현업에서는 두 방식을 결합한 하이브리드 검색(Hybrid Search)이 주류입니다. 키워드 검색의 정확도와 의미 검색의 재현율을 모두 확보합니다.
품질 향상 방안:
| 평가 영역 | 지표 | 의미 |
|---|---|---|
| 검색 품질 | Recall@K | 상위 K개 결과에 정답 문서 포함 비율 |
| MRR (Mean Reciprocal Rank) | 정답 문서의 평균 역순위 | |
| 생성 품질 (RAGAS) | Faithfulness | 답변이 검색 문서에 근거하는 비율 |
| Answer Relevancy | 답변이 질의와 얼마나 관련 있는가 | |
| Context Precision/Recall | 검색된 컨텍스트의 정밀도·재현율 | |
| 종합 | E2E Latency (P95) | 사용자 체감 응답 시간 (95th percentile) |
발생 원인:
완화 전략:
요양원 선택 전 반드시 확인해야 할 체크리스트를 공개합니다. 공식 평가 자료 조회법, 방문 시 확인…
공공기관 채용 비리의 실태와 피해 지원자의 대응법을 정리했습니다. 채용 비리 신고 방법, 공익신고자 보호제도, 취준생…
주식 손실을 세금 절약에 활용하는 합법적 방법을 공개합니다. 해외주식 손익통산, ISA 계좌 활용, 연금계좌 절세까지…
배달이 예상 시간보다 크게 늦으면 취소·환불을 요청할 수 있습니다. 배달앱별 지연 취소 방법과 잘못 배달됐을…
통신비 절약의 핵심은 요금제 최적화입니다. 내 데이터 사용량 확인법, 알뜰폰 전환 비교, 위약금 없이 요금제…