과적합 (overfitting)
과적합은 머신러닝에서 학습용데이터를 과하게 학습하여, 실제데이터를 예측하지 못하는 현상을 말합니다. 인공지능(AI)의 학습 방법은 우리가 시험공부를 하는 과정과 아주 비슷합니다. 이 점을 생각하시면 ‘과적합’이 무엇인지 쉽게 이해하실 수 있습니다. 1. 한 … Read more
과적합은 머신러닝에서 학습용데이터를 과하게 학습하여, 실제데이터를 예측하지 못하는 현상을 말합니다. 인공지능(AI)의 학습 방법은 우리가 시험공부를 하는 과정과 아주 비슷합니다. 이 점을 생각하시면 ‘과적합’이 무엇인지 쉽게 이해하실 수 있습니다. 1. 한 … Read more
크롤링(crawling)과 스크래핑(scraping)은 웹 데이터를 수집할 때 자주 사용되는 기술이지만, 크롤링은 웹사이트 탐식 및 수집, 스크래핑은 특정 데이터만 추출하는 방식으로 목적과 작동 방식에 차이가 있습니다. 아래에 개념과 차이를 정리해 드리겠습니다. 1. … Read more
클라우드 네이티브(Cloud Native)는 클라우드 환경에서 애플리케이션을 구축하고 운영하는 방식을 의미합니다. 기존 온프레미스 방식과는 달리, 클라우드 네이티브는 컨테이너화(Containerization), 마이크로서비스(Microservices), 오케스트레이션(Orchestration), 데브옵스(DevOps), 지속적 통합 및 배포(CI/CD) 등의 개념을 기반으로 합니다. 🔹 클라우드 … Read more
RAG(Retrieval-Augmented Generation)는 OpenAI와 같은 LLM (Large Language Model)이 정보를 생성할 때 외부 데이터베이스에서 관련 정보를 검색(Retrieve)하고 이를 기반으로 답변을 생성(Generate)하는 방식의 모델입니다. 즉, 검색 결과를 바탕으로 답변을 생성해주는 AI라 보시면 … Read more
K-Fold Cross Validation(K-겹 교차 검증)은 머신러닝 모델의 성능을 평가하는데 사용되는 중요한 기법입니다. 일반적인 데이터셋을 훈련 데이터와 테스트 데이터로 단순 분할하는 방식보다 더 신뢰성 높은 성능 평가를 제공합니다. 1. K-Fold Cross … Read more
엘라스틱넷(Elastic Net) 회귀는 릿지 회귀(Ridge)와 라쏘 회귀(Lasso)의 장점을 결합한 모델입니다.즉, L1 정규화(라쏘)와 L2 정규화(릿지)를 동시에 적용하여 변수 선택과 가중치 축소를 함께 수행합니다. 1. 엘라스틱넷의 핵심 개념 2. 엘라스틱넷 회귀 수식 … Read more
라쏘 회귀(Lasso Regression)는 선형 회귀(Linear Regression)에 L1 정규화(Regularization)를 추가한 모델입니다.라쏘(Lasso)는 Least Absolute Shrinkage and Selection Operator의 약자로, 변수 선택(Feature Selection) 기능을 제공하는 것이 특징입니다. 1. 라쏘 회귀의 핵심 개념 라쏘 … Read more
차원 축소(Dimensionality Reduction)는 고차원의 데이터를 저차원의 공간으로 변환하는 기법입니다. 이는 데이터의 중요한 정보를 최대한 유지하면서 불필요한 정보(노이즈)를 제거하고, 계산 효율성을 높이며, 데이터 시각화와 모델 성능 향상에 기여합니다. 1. 차원 축소의 … Read more