NumPy 라이브러리란? NumPy(넘파이, Numerical Python)는 파이썬에서 과학 계산 및 데이터 분석을 위한 대표적인 라이브러리입니다. 다차원 배열 객체인 ndarray를 제공하며, 수학…
비닝(Binning)과 회귀(Regression)의 차이 비닝(Binning)과 회귀(Regression)은 데이터 분석에서 자주 사용되는 기법이지만, 목적과 활용 방식이 다릅니다. 1. 비닝(Binning) 🔹 개념 비닝(Binning)은 연속형…
68-95-99.7 규칙 (Three Sigma Rule) 68-95-99.7 규칙은 정규분포(Gaussian distribution)에서 평균(μ)과 표준편차(σ)를 기준으로 데이터가 분포하는 비율을 나타내는 경험적인 법칙입니다. 1. 규칙의…
데이터 준비 결측치 처리 결측치 처리: 개수 확인 # 결측치 개수 df.isnull().sum() # 결측치 개수 (전체) df.isnull().sum().sum() df.dropna() # df.dropna(axis=0)…
IQR(Interquartile Range, 사분위 범위)는 데이터에서 이상치를 탐지하고 변동성을 측정하는 데 사용되는 통계적 지표입니다. 📌 IQR의 정의 IQR은 데이터의 1사분위수(Q1)와 3사분위수(Q3)의…
1. 프롬프트 엔지니어링이란? 프롬프트 엔지니어링(Prompt Engineering)은 AI 모델, 특히 대형 언어 모델(LLM)이나 생성형 AI에게 원하는 결과를 얻기 위해 입력(프롬프트)을 최적화하는…
VAE (Variational AutoEncoder)는 딥러닝 기반의 생성 모델로, 입력 데이터를 잠재 변수(latent variable) 공간으로 압축하고, 이 잠재 변수를 기반으로 새로운 데이터를…