벡터 데이터베이스(Vector Database)를 설명하시오.
LLM·RAG 아키텍처 확산으로 임베딩 저장·검색 수요가 폭발하면서 벡터 DB가 필수 인프라로 자리잡았습니다. 기존 RDBMS와의 차이, ANN 인덱스 종류, 주요 솔루션을 체계적으로 서술하면 됩니다.
벡터 데이터베이스(Vector Database)란 텍스트·이미지·오디오 등을 임베딩 모델로 변환한 고차원 실수 벡터를 저장하고, 코사인 유사도·유클리드 거리 기반 근사 최근접 이웃(ANN) 검색을 고속으로 지원하는 특수 목적 데이터베이스입니다.
| 구분 | RDBMS | 벡터 DB |
|---|---|---|
| 검색 기준 | 정확한 값 일치 (= , LIKE) | 의미적 유사도 (코사인·내적) |
| 데이터 타입 | 정형 (숫자·문자열) | 고차원 실수 벡터 (수백~수천 차원) |
| 인덱스 | B-Tree, Hash | HNSW, IVF, PQ |
| 주요 용도 | 트랜잭션, 리포팅 | 시맨틱 검색, RAG, 추천 |
| 솔루션 | 유형 | 특징 |
|---|---|---|
| Pinecone | 완전관리형 SaaS | 운영 부담 없음, 고성능, 유료 |
| Weaviate | 오픈소스 | 하이브리드 검색(키워드+벡터), GraphQL API |
| Chroma | 오픈소스 경량 | 로컬 개발·프로토타이핑에 최적 |
| pgvector | PostgreSQL 확장 | 기존 PostgreSQL에 벡터 기능 추가 |
요양원 선택 전 반드시 확인해야 할 체크리스트를 공개합니다. 공식 평가 자료 조회법, 방문 시 확인…
공공기관 채용 비리의 실태와 피해 지원자의 대응법을 정리했습니다. 채용 비리 신고 방법, 공익신고자 보호제도, 취준생…
주식 손실을 세금 절약에 활용하는 합법적 방법을 공개합니다. 해외주식 손익통산, ISA 계좌 활용, 연금계좌 절세까지…
배달이 예상 시간보다 크게 늦으면 취소·환불을 요청할 수 있습니다. 배달앱별 지연 취소 방법과 잘못 배달됐을…
통신비 절약의 핵심은 요금제 최적화입니다. 내 데이터 사용량 확인법, 알뜰폰 전환 비교, 위약금 없이 요금제…